segunda-feira, 2 de abril de 2012

Entrelaçado ou progressivo? Eis a questão!



Ainda vemos muita confusão e dúvidas com esses dois tipos de vídeo. O fim dos monitores CRT  (tubo de imagem), que eram os únicos com a capacidade de reproduzir imagens entrelaçadas, determinou a popularização do formato progressivo.  É verdade que os monitores de plasma, LCD ou LED também conseguem reproduzir o material entrelaçado graças a um sistema interno que transforma em progressivos os frames dos vídeos entrelaçados.

Sendo assim, todos os vídeos que vemos em monitores digitais estão em formato progressivo, tanto nativos quanto criados a partir de fontes entrelaçadas. Mas apesar dessa capacidade dos monitores de LCD ou LED, o processamento inadequado, de um vídeo entrelaçado ou mesmo seu uso em determinadas situações de captação de imagens, pode levar a resultados desastrosos na hora da edição e finalização.

O assunto, apesar de bastante estudado e conhecido, ainda é muito controverso. Alguns profissionais defendem que o formato 60i reproduz melhor os assuntos que se movimentam rapidamente no quadro e as panorâmicas mais rápidas que o 30P  e o 24P. Outros defendem o formato progressivo por conta das imagens mais parecidas com o cinema convencional e a melhor definição e ausência de serrilhados. Quem está com a razão? Vamos ver isso nesse artigo!

Em princípio as duas correntes de pensamento estão corretas, mas com algumas restrições. Vamos começar do básico: como é formada a imagem, ou frame, em um vídeo entrelaçado e em um formato progressivo. Vamos ver o exemplo  seguir:
Em um vídeo entrelaçado, cada frame é formado por dois campos. E aqui geralmente há uma certa confusão. Campo (field) não é o mesmo que quadro (frame). Dois campos (superior e inferior) formam um frame, ou quadro, em um vídeo entrelaçado. Portanto são necessários 60 campos por segundo para se obter um vídeo com 30 frames por segundo. Nesse caso, a resolução temporal de um vídeo entrelaçado é maior do que a de um vídeo progressivo, já que a cada 1/60 de segundo uma imagem do objeto é capturada. Porém a resolução espacial é menor, pois cada campo possui apenas metade das linhas (e por conseguinte) metade da resolução total do objeto filmado. Esses dois campos entrelaçados formarão um quadro da imagem e, em um monitor convencional (tubo de raios catódicos), esses campos serão exibidos em sequencia na tela a um intervalo de 1/60 segundo.

Um fenômeno chamado persistência da imagem, que ocorre na retina do olho humano, vai formar uma imagem única com esses campos, nos fazendo enxergar o movimento de maneira natural e fluída. Somente em situações de câmera lenta ou em pausas na imagem é que vamos perceber o serrilhado em algumas partes. Isso ocorre porque há uma diferença de posicionamento no objeto filmado durante o intervalo de tempo (1/60s) em que os campos foram capturados. Esse defeito fica bem mais evidente nos monitores modernos de LCD ou LED por causa do desentrelaçamento obrigatório do vídeo para formar uma imagem progressiva. Ao invés de cada campo ser apresentado um após o outro, dois campos subsequentes são unidos para formar um frame progressivo, que é apresentado de uma só vez a razão de 30 por segundo.

Como os dois campos não são coincidentes a imagem fica com os fantasmas característicos e o serrilhado. Já no vídeo progressivo não existem campos. A totalidade da imagem formada no sensor da câmera é capturada uma única vez e contem toda a informação do quadro. Em um vídeo NTSC exatos 29,97 frames são capturados a cada segundo. Tal como no filme cinematográfico, onde a cada segundo são capturados 24 fotogramas do objeto. Teoricamente esse seria o formato perfeito., pois não existe o problema do serrilhado, embora, como veremos adiante, outros problemas acabam surgindo.
O mais comum deles é o efeito chamado judder, mais perceptível em filmes ou vídeos capturados a 24 quadros por segundo. Objetos se movimentando em velocidade parecem dar pequenos pulos, pois mudam de posição rapidamente entre cada quadro. Outro efeito que se tornou mais perceptível a partir da introdução de câmeras com sensores de grande formato CMOS foi o rolling shutter, também chamado de jelly. 
Ele acontece em virtude do tempo necessário para que todo o sensor seja escaneado e a informação do frame seja lida e processada pelos processadores de imagem da câmera antes de serem definitivamente salvos na memória.  Um objeto em movimento começa a ser capturado em uma posição, mas devido a sua grande velocidade, a parte final do quadro, onde o objeto já estará em outra posição no espaço-tempo vai aparecer distorcida.

As câmeras mais recentes receberam filtros digitais especiais que calculam essas diferenças, interpretando a posição atual e a anterior dos píxels que compõem a imagem e durante a compressão intra-frame ou inter-frame, tentam minimizar a aberração. Mas como prevenir é melhor que remediar, o ideal é usarmos velocidades mais altas de diafragma em captação de cenas de grande movimentação, evitando ainda a utilização de movimentos rápidos de pan com a câmera.

Outro fator a ser considerado, tanto em vídeos entrelaçados como em progressivos, é a degradação da definição da imagem e das cores causadas pela compressão utilizada pelo equipamento de captura na hora de armazenar o vídeo. No exemplo abaixo vemos duas ampliações (400x) de 2 frames diferentes. Cada um deles foi capturado no mesmo instante, sendo que um foi armazenado em cartão SD na própria câmera e o outro foi armazenado em um gravador digital de vídeo externo acoplado ao mesmo equipamento, através da saída SDI de alta definição do mesmo.

O equipamento usado (Sony NX5n) armazena no cartão o vídeo em formato AVCHD 8 bits com espaço de cor 4:2:0 a uma taxa de 25 Mb/segundo. O gravador externo armazenou o mesmo vídeo em formato AVI sem compressão com espaço de cor 10 bits 4:2:2. Apesar do vídeo ter sido capturado pela câmera em 60 frames progressivos por segundo em alta definição (720P), nele podemos notar maior incidência de artefatos introduzidos pela compressão AVCHD.


No vídeo capturado sem compressão, porém transformado, via processador da placa de captura, para o formato HD 1080i60 (entrelaçado), as cores estão mais homogêneas e a definição de detalhes (como a faixa preta na porta do veículo) está melhor. Nesse caso, o problema teria deixado de existir se a captura tivesse sido feita em HD720P30 pelo gravador externo. Isso não significa que o formato HD720P60 seja ruim ou não deva ser utilizado. Mais adiante veremos sua utilidade.

Outro ponto importante: a ordem de aparição dos campos (entrelaçados) Um outro erro bastante comum e que contribui para a má fama do vídeo entrelaçado é a exportação ou conversão de uma sequência com a ordem dos campos invertida. Quando editamos material entrelaçado devemos ficar atentos a ordem dos campos. Já vimos que cada frame (ou quadro), em um vídeo entrelaçado, é formado por dois campos (superior e inferior) que são exibidos em sequência. Essa sequencia pode começar pelo campo superior ou pelo inferior.

Formatos como o DV SD quando gravados em entrelaçado são LFF (lower field first), ou seja, o campo inferior é apresentado primeiro. Já o formato HDV Sony (1440 x 1080i60), que é também é entrelaçado, apresenta o campo superior primeiro (UFF – upper fiel first).Na hora de exportar esses vídeos entrelaçados para outro formato entrelaçado qualquer, devemos informar ao programa de edição ou de conversão de vídeo a ordem correta dos campos. Se essa ordem for invertida o resultado final de um DVD de vídeo, por exemplo, pode ficar muito comprometido.

Muitas vezes aqui no blog os leitores me relatam problemas com qualidade de imagens AVCHD transformadas para DVD, reclamando da definição. O AVCHD é sempre UFF e o DVD NTSC é LFF. Vejamos abaixo exemplos de exportação de vídeos entrelaçados no Premiere CS5. Abaixo vemos um trecho de frame entrelaçado (ampliado 400x) e um trecho da janela de exportação do Premiere CS5.

 


















No caso da exportação de conteúdo entrelaçado para progressivo, geralmente o próprio programa utiliza a ordem correta do conteúdo original. Em nosso caso, o vídeo será codificado para o formato progressivo utilizando o campo superior, ordem original de um vídeo AVCHD. (Mais adiante veremos como se processa esse tipo de exportação e quais as suas desvantagem). A seguir o mesmo frame sendo exportado com a ordem de campos errada:
Observe que a imagem aparece borrada, como se estivesse fora de foco ou com um efeito de blur aplicado. A ordem de campo(Lower) está diferente da original AVCHD (Upper). Na ultima figura abaixo, o mesmo frame entrelaçado exportado com a ordem correta (Upper).  A definição da imagem está igual a da primeira foto (exportação em formato progressivo).


















Desentrelaçando vídeos para o formato progressivo.

Nos exemplos acima, a definição da primeira (progressivo) e da terceira imagem (entrelaçada) parecem iguais. Isso se deve ao fato de ambas estarem sendo vistas em um monitor LCD, que trata os vídeos entrelaçados como progressivos. Mas na realidade há uma perda substancial de qualidade nesse processo. Veja a figura abaixo. 

























O processo de conversão de um vídeo entrelaçado para o formato progressivo sempre leva a perdas consideráveis de qualidade, seja pela diminuiçãoo do nível de croma e de luminância, seja pela perda de definição. Existem vários métodos de desentrelaçamento. Eles podem ser realizados em softwares de edição e também nos aparelhos de DVD, Bluray e nos monitores de plasma, LCD ou LED.

Cada software ou equipamento, dependendo do grau de softicação e do método utilizado, pode realizar a tarefa com maior ou menor precisao. Mas sempre haverão perdas.

No exemplo acima é demonstrado o método que o Premiere CS5 utiliza. O frame original contendo os dois campos entrelaçados é separado. O frame inferior (no caso do vídeo AVCHD) é descartado, pois o programa utiliza sempre o frame dominante ( no caso do AVCHD o superior). O campo superior é então duplicado por cópia (interpolação) e em seguida, os dois campos são unidos formando um frame progressivo.

Nesse sistema, todos os detalhes da cena contidos no frame descartado serão perdidos, assim como metade da luminância e cerca de 25% da informação de cor. Por esse motivo, a EBU – União Européia de Televisão e redes como a BBC inglesa tem se posicionado contra a utilização de conteúdos entrelaçados, recomendando a seus integrantes que utilizem preferencialmente o formato progressivo a 50 frames por segundo como forma de garantir um padrão de qualidade.

É preciso notar que o formato 720P (padrão de alta definição europeu) pode ser filmado em 25 ou 50 quadros progressivos e a maioria das câmeras suporta as duas taxas de frames. No caso do formato HD 1080, somente agora estão chegando no mercado filmadoras capazes de capturar vídeos a 60 quadros por segundo, sendo que quase todos os modelos de entrada, com preços inferiores a US$ 5 mil dólares, só conseguem captar a 24 ou 30 fps.

Para a maioria das cenas essas taxas de quadro são suficientes. Mas quando se trata de filmar esportes de alta velocidade e cenas que posteriormente serão apresentadas em câmera lenta, essa taxa de quadros é insuficiente. Filmar a 60 fps significa poder, por exemplo, fazer uma câmera lenta sem a necessidade de processamento gráfico na pós-produção. Um vídeo em 60 fps colocado em uma timeline de 30 fps já será exibido naturalmente em slowmotion. É nessa hora que encontramos utilidade para o formato HD720P60 disponível em quase todas as câmeras profissionais de baixo custo, como veremos a seguir.

Utilidade do formato 720P60

O vídeo abaixo foi filmado com uma Sony NX5n em formato 720P FX @ 60 FPS. Posteriormente foi ampliado, no Premiere CS5 para 1080P em uma timeline @ 30 FPS. O resultado final proporcionou boas cenas em slowmotion sem a necessidade de usar os comandos de duração ou velocidade, que geralmente levam a um efeito de câmera lenta artificial e com pequenos saltos na imagem. 

Mesmo com o upscalling (ampliação) do vídeo original, não se notam defeitos como pixelização ou serrilhados nas cenas. Obviamente, o ideal seria ter captado esse tipo de conteúdo em 60 frames por segundo, mas a NX5n não permite essa opção.

Conclusões:
 
Como já quase não existem mais monitores CRT analógicos o uso de vídeos entrelaçados nào é mais necessário. Há a alegação que o sinal do sistema brasileiro de televisão digital é 1080i, ou seja, um formato entrelaçado. Mas esse sinal, quando passa pelo processamento do monitor de televisão LCD ou LED, é processado novamente para se tornar progressivo.
 
Alem disso, as emissoras de televisão digital encodam o material progressivo em entrelaçado apenas para diminuir a necessidade de banda de transmissão. a transformação de um vídeo progressivo em entrelaçado não produz perdas, já que cada frame progressivo é apenas dividido em 2 campos para formar um frame entrelaçado. Não há diferença temporal entre esses campos, como vimos anteriormente nesse artigo, pois o frame progressivo é capturado de uma só vez.

O uso do formato entrelaçado melhoraria a qualidade de cenas com grande movimento se fosse visualizado em monitores entrelaçados, que quase não existem mais. E por outro lado a transformação desse material em formato progressivo, vai levar a perdas de definição e espaço de cor, o que não se justifica apenas para ganhar um pouco mais de fluidez nas imagens.

O formato 720P60 pode ser uma boa opção em cenas que requerem câmera lenta pela melhor qualidade da imagem. Os trechos filmados nesse formato podem ser ampliados no programa de edição e misturados ao restante do material captado em 1080P30 sem perdas importantes na qualidade, pricipalmente se o produto final for um DVD, vídeo para a internet ou televisão aberta.

Já para conteúdos que serão exibidos em telas grandes ou transformados em película, a opção mais adequada é a captação em formato progressivo 1080P60, ainda não disponível nas câmeras profissionais de baixo custo.

A menos que a captação em video entrelaçado seja uma exigência do contratante ou  uma escolha pessoal do diretor, desejando uma aparência mais televisiva, esta deve ser evitada. O formato 1080P30 é mais flexivel, pois pode inclusive ser transformado em entrelaçado sem perdas, além de poder ser convertido para 24P para cinema ou 25P para o mercado europeu.

E quando for comprar uma nova câmera de vídeo, procure dar preferência a modelos que possuam a capacidade de filmar em HD a 60 frames progressivos por segundo. Elas devem se popularizar a partir desse ano.

Grande abraço a todos!

Marcelo Ruiz

Nenhum comentário: