Informática

Programa traduz sinais cerebrais diretamente em voz

Programa traduz sinais cerebrais diretamente em voz
Um algoritmo conhecido como "vocoder" aprende a traduzir os sinais cerebrais em voz. [Imagem: Hassan Akbari et al. - 10.1038/s41598-018-37359-z]

Tradução de pensamento em voz

Neuroengenheiros criaram um programa de computador que traduz o "pensamento" em fala inteligível.

O "pensamento" na verdade são sinais neurais lidos por uma interface implantada no cérebro de pacientes que estão sendo tratados de epilepsia.

Monitorando a atividade cerebral desses pacientes, o programa conseguiu reconstruir algumas palavras - os nomes dos números - que uma pessoa ouve com uma clareza notável.

Esse avanço, que aproveita o poder dos sintetizadores de voz e da inteligência artificial, promete novas formas de interface com a tecnologia, permitindo que, no futuro, os computadores se comuniquem diretamente com o cérebro dos usuários, por exemplo.

Há grande esperança também de ajudar as pessoas que não podem falar - como as que vivem com esclerose lateral amiotrófica (ELA) ou se recuperando de um derrame - a recuperar sua capacidade de se comunicar com o mundo exterior.

Vocoder

Várias pesquisas mostram que, quando falamos - ou mesmo imaginamos falar -, emergem em nossos cérebros padrões de atividade muito característicos. Padrões de sinais diferentes, mas reconhecíveis, emergem também quando ouvimos alguém falar - ou imaginamos ouvir.

Mas gravar e decodificar esses padrões, para efetivamente "ler os pensamentos", tem-se mostrado uma tarefa mais difícil do que parecia à primeira vista.

Os primeiros esforços para decodificar os sinais neurais se concentraram em modelos computacionais simples que analisavam espectrogramas, que são representações visuais de frequências sonoras. Mas essa abordagem não conseguiu produzir nada que se assemelhe à fala inteligível.

Hassan Akbari e seus colegas da Universidade de Colúmbia, nos EUA, voltaram-se então para outra técnica, conhecida como vocoder, um codificador de voz, na verdade um algoritmo de computador que pode sintetizar a fala depois de ser treinado com gravações de pessoas falando - aparelhos como Amazon Echo e Apple Siri usam vocoders para responder perguntas.

"Nós pedimos a pacientes com epilepsia, que já estão passando por uma cirurgia no cérebro [para receber um implante neural] para ouvir sentenças [e números] ditas por pessoas diferentes, enquanto medíamos os padrões de atividade cerebral. Esses padrões neurais treinaram o vocoder," explicou o professor Nima Mesgarani, coordenador da equipe.

Bons resultados com números

O resultado final foi uma "voz robótica" recitando palavras e uma sequência de números.

Os pesquisadores decidiram usar apenas os números para testar a precisão da gravação, devido aos melhores resultados. As pessoas deviam ouvir a gravação e relatar o que ouviram. Elas entenderam a tradução dos seus próprios sinais cerebrais em 75% das vezes.

A equipe planeja a seguir começar a trabalhar com palavras e tentar voltar às sentenças, além de realizar os mesmos testes em sinais cerebrais emitidos quando uma pessoa fala ou imagina a fala.

Bibliografia:

Towards reconstructing intelligible speech from the human auditory cortex
Hassan Akbari, Bahar Khalighinejad, Jose L. Herrero, Ashesh D. Mehta, Nima Mesgarani
Nature Scientific Reports
Vol.: 9, Article number: 874
DOI: 10.1038/s41598-018-37359-z




Outras notícias sobre:

    Mais Temas