Pular para o conteúdo
Bancada
Sobre
Vídeo / Fundamentos

Taxa de quadros

Como a taxa de quadros amostra o movimento no tempo, por que 24 qps virou estética de cinema, de onde vêm os padrões 25/29,97/30 e o que acontece quando o movimento ultrapassa o limite de Nyquist temporal.

Alfredo Neto6 min de leitura
Sumário (10)

A taxa de quadros é o eixo temporal da imagem em movimento, complemento direto da Resolução, que descreve o eixo espacial. Onde a resolução define quão finamente a cena é amostrada no espaço, a taxa de quadros define quão finamente ela é amostrada no tempo. Este artigo trata da taxa em si: o que ela representa, como o olho a converte em movimento e quais são as taxas padronizadas e suas origens. A duração de cada exposição — a velocidade do obturador e o borrão de movimento dela decorrente — é uma propriedade independente, tratada no artigo Obturador.

O que é taxa de quadros

Um vídeo é uma sequência de imagens estáticas (quadros) apresentadas em rápida sucessão. A taxa de quadros é o número de quadros exibidos por segundo, medida em quadros por segundo (qps, ou fps, frames per second).

Conceitualmente, a taxa de quadros é a amostragem temporal da cena: cada quadro é uma amostra do estado visual do mundo em um instante. Assim como a resolução espacial determina o limite de detalhe que a imagem pode conter, a taxa de quadros determina o limite de detalhe de movimento que a sequência pode representar. Vale a mesma ressalva feita para a resolução: a taxa estabelece uma capacidade; ela não garante que o movimento seja percebido como fluido nem que esteja livre de artefatos.

Esse enquadramento como amostragem é o ponto central do artigo, e dele decorrem quase todas as suas consequências.

A ilusão de movimento

Quadros são imagens discretas e imóveis. Que uma sucessão delas seja percebida como movimento contínuo é um fenômeno perceptual, não uma propriedade do sinal. Dois mecanismos distintos — frequentemente confundidos em uma única explicação — atuam aqui.

O primeiro é a fusão de cintilação (flicker fusion): acima de certa frequência de repetição, o sistema visual deixa de perceber a alternância entre imagem e escuridão (o piscar) e enxerga uma luz estável. Esse limiar varia com o brilho e as condições, situando-se tipicamente entre 50 e 90 Hz. É o que a explicação popular chama, de forma imprecisa, de "persistência da visão".

O segundo, e o responsável pela impressão de movimento, é o movimento aparente (fenômenos beta e phi): o cérebro interpreta a mudança de posição de um elemento entre quadros sucessivos como deslocamento contínuo, preenchendo ativamente as posições intermediárias que nunca foram exibidas. O movimento não está nos quadros; é uma inferência perceptual.

A distinção entre os dois limiares é importante e tem consequência prática. O cinema clássico exibe 24 quadros por segundo, mas projetores tradicionais usavam um obturador de duas ou três pás que exibia cada quadro duas ou três vezes — produzindo 48 ou 72 lampejos por segundo. A taxa de amostragem do movimento permanecia em 24 qps, mas a frequência de cintilação subia o suficiente para ultrapassar a fusão de cintilação e eliminar o piscar perceptível. Movimento e cintilação são, portanto, governados por amostragens distintas.

Aliasing temporal

Toda amostragem discreta está sujeita a aliasing, e a amostragem temporal não é exceção. O movimento de um objeto na cena pode ser descrito como uma frequência temporal; quando essa frequência ultrapassa metade da taxa de quadros — o limite de Nyquist do eixo temporal — o movimento é subamostrado e reconstruído incorretamente.

O exemplo clássico é o efeito estroboscópico, ou "efeito da roda de carroça": uma roda que gira rápido parece girar devagar, parar ou até girar para trás. A cada quadro, o raio da roda avançou quase uma volta completa, e o sistema visual, aplicando o movimento aparente, infere o menor deslocamento possível — que pode ser nulo ou negativo. É o equivalente temporal exato do aliasing espacial: a informação de alta frequência, amostrada de forma insuficiente, reaparece disfarçada como uma frequência mais baixa e falsa.

Quem vem do áudio reconhecerá a estrutura: a taxa de quadros é a frequência de amostragem; a frequência do movimento é o sinal; e tudo acima de metade da taxa de quadros não pode ser representado fielmente. A diferença é apenas o domínio — tempo de cena, em vez de tempo de áudio.

Taxas padronizadas e suas origens

As taxas de quadros mais comuns não foram escolhidas por acaso; quase todas têm origem histórica ou técnica.

24 qps consolidou-se como padrão do cinema no fim da década de 1920, com a chegada do som. Era o menor valor que mantinha movimento e som aceitáveis sem desperdiçar película — um compromisso econômico que se tornou a estética do cinema.

25 qps e 30 qps derivam da frequência da rede elétrica das regiões onde os sistemas de televisão nasceram: 50 Hz (padrão PAL/SECAM, daí 25 qps) e 60 Hz (padrão NTSC, daí 30 qps). Atrelar a taxa de quadros à rede evitava batimentos visíveis entre a iluminação e a captação.

29,97 qps é um detalhe revelador. Quando a cor foi adicionada ao sistema NTSC monocromático de 30 qps, foi preciso reduzir levemente a taxa — para exatamente 30/1,001 — a fim de impedir interferência entre a subportadora de cor e a portadora de áudio. A discrepância acumulada entre os 29,97 quadros reais por segundo e a contagem de 30 do código de tempo é o que originou o timecode com descarte de quadros (drop-frame), que pula números de contagem (não quadros reais) periodicamente para manter o relógio sincronizado com o tempo de parede.

50 e 60 qps dobram as taxas de transmissão e são hoje comuns em esportes e conteúdo de movimento intenso. 48 qps e 120 qps ou mais constituem a alta taxa de quadros (HFR), explorada em produções que buscam fluidez extrema — frequentemente ao custo do "aspecto de novela" (soap opera effect), em que a redução do borrão e o excesso de amostras temporais afastam a imagem da estética cinematográfica a que o público associa 24 qps.

Varredura progressiva e entrelaçada

Há duas estratégias para distribuir a amostragem temporal, e a distinção entre elas é puramente temporal — motivo pelo qual pertence a este artigo, e não ao da Resolução.

Na varredura progressiva (p), cada quadro é uma amostra completa: todas as linhas da imagem correspondem ao mesmo instante. 1080p50 significa 50 quadros completos por segundo.

Na varredura entrelaçada (i), cada amostra temporal contém apenas metade das linhas — um campo, formado pelas linhas ímpares ou pelas linhas pares, alternadamente. Um sinal 1080i a 50 campos por segundo carrega 50 amostras de movimento por segundo, mas apenas 25 quadros completos em termos de resolução vertical instantânea. Foi um artifício engenhoso da era da transmissão: dobrava a fluidez temporal percebida sem dobrar a largura de banda, ao custo de artefatos quando há movimento rápido (as duas metades, capturadas em instantes diferentes, não coincidem). O tratamento desses artefatos e sua conversão para varredura progressiva (desentrelaçamento) é um tema aplicado que fica fora deste escopo.

Taxa de captura e taxa de reprodução

Até aqui supôs-se que a taxa de captura e a de reprodução coincidem. Quando elas são deliberadamente desacopladas, surgem os efeitos de velocidade.

Capturar a uma taxa alta e reproduzir a uma taxa menor distribui as amostras por um intervalo maior: o resultado é a câmera lenta. Capturar 240 qps e reproduzir a 24 qps gera uma desaceleração de dez vezes, com movimento fluido porque há amostras temporais de sobra. O processo inverso — capturar a uma taxa baixa e reproduzir normalmente — comprime o tempo e produz a câmera rápida. Os termos históricos overcranking e undercranking remetem à manivela das câmeras de película, girada mais rápido ou mais devagar que o padrão.

O ponto conceitual é que "câmera lenta" não é uma propriedade de um único valor de taxa, mas da razão entre a taxa de captura e a de reprodução.

O que a taxa de quadros não é

Não é a taxa de atualização da tela

A taxa de quadros é uma propriedade do conteúdo; a taxa de atualização (refresh rate, em Hz) é uma propriedade do dispositivo de exibição. Um filme de 24 qps pode ser exibido em uma tela de 60 Hz ou 120 Hz sem mudar sua taxa de quadros — o que muda é como cada quadro é repetido ou distribuído pelos ciclos de atualização da tela. A conversão entre uma taxa de conteúdo e uma taxa de exibição diferente (por repetição de quadros ou esquemas como o pulldown 3:2) é justamente o que evidencia que as duas grandezas são independentes.

Não é a velocidade do obturador

A taxa de quadros define com que frequência a cena é amostrada; a velocidade do obturador define por quanto tempo cada amostra é exposta. Duas gravações a 24 qps podem ter aparências de movimento completamente distintas conforme a exposição de cada quadro seja longa (muito borrão) ou curta (movimento "picotado"). Por serem independentes, são tratadas separadamente — o intervalo de amostragem aqui, a duração da exposição no artigo Obturador.

Não é a resolução

São eixos ortogonais: a resolução descreve o detalhe contido em cada quadro; a taxa de quadros, quantos quadros há por segundo. Alterar uma não implica nada sobre a outra, conforme já estabelecido em Resolução.