Informática

Microfone visual transforma imagens em sons

Microfone visual transforma imagens em sons
As paredes podem ter ouvidos, mas os sacos de batatas fritas têm boca. [Imagem: Abe Davis et al./ToG]

A voz das imagens

Uma equipe de pesquisadores do MIT, Microsoft e Adobe desenvolveu um algoritmo capaz de reconstruir um sinal de áudio apenas analisando um vídeo e detectando as minúsculas vibrações que os sons do ambiente induzem nos objetos.

Cada vez que um som é emitido, as ondas acústicas batem nos objetos ao redor, gerando vibrações minúsculas, invisíveis a olho nu.

"Quando o som atinge um objeto, faz com que o objeto vibre. O movimento desta vibração cria um sinal visual muito sutil que geralmente é invisível a olho nu. As pessoas não percebem que há informação lá," disse o pesquisador Abe Davis.

A tecnologia usada nestas experiências é parecida com a dos microfones a laser, usados por espiões para escutar conversas medindo as vibrações em superfícies reflexivas.

Mas, em vez de usar equipamentos caros e sofisticados, a equipe conseguiu transformar todos os tipos de objetos em microfones.

Normalmente a técnica exige câmeras de alta velocidade, de 2.000 a 6.000 quadros por segundo, quando uma câmera comum capta apenas 60 quadros por segundo - isto porque a frequência da amostragem de vídeo precisa ser maior do que a frequência do sinal de áudio.

Contudo, a equipe descobriu que uma peculiaridade no projeto dos CCDs, os sensores das câmeras digitais, torna possível extrair alguma informação mesmo das câmeras comuns - o suficiente, por exemplo, para distinguir a voz de um homem da voz de uma mulher.

Microfone visual transforma imagens em sons
Os sons do ambiente foram registrados a 4, 5 metros de distância, atrás de um vidro à prova de som. [Imagem: Abe Davis et al./ToG]

Dedos-duros

Em um dos experimentos foram recuperados sons compreensíveis e claros das vibrações recuperadas de um saco de batatas fritas filmado a 4,5 metros de distância e através de um vidro à prova de som.

Também foi possível extrair sinais de áudio a partir de vídeos de papel alumínio, da superfície de um copo d'água e até uma música refletida nas folhas de uma planta.

Abe Davis afirma que agora quer investigar se a nova técnica pode revelar informações sobre a estrutura interna dos objetos.

"Não apenas podemos conseguir informações sobre os sons emitidos perto dos objetos, mas também dentro dos próprios objetos, porque cada um responderá ao áudio de uma maneira diferente," afirmou.

Bibliografia:

The visual microphone: passive recovery of sound from video
Abe Davis, Michael Rubinstein, Neal Wadhwa, Gautham J. Mysore, Frédo Durand, William T. Freeman
Transactions on Graphics
Vol.: 33 Issue 4, Article No. 79




Outras notícias sobre:

Mais Temas