Logotipo do Site Inovação Tecnológica





Informática

Programa aprende regras da linguagem e compõe sentenças

Redação do Site Inovação Tecnológica - 05/09/2005


Pesquisadores das Universidades Cornell, Estados Unidos, e Tel Aviv, Israel, desenvolveram um método que permite a um computador escanear um texto, escrito em qualquer idioma, incluindo inglês e chinês, e, autonomamente e sem qualquer informação prévia, inferir as regras gramaticais por detrás da construção daquele texto.

Entendendo as regras, o computador pode então utilizá-las, construindo sentenças novas - diferentes daquelas que ele "leu" - e que têm sentido. O método também funciona para pautas musicais e até mesmo para seqüências de proteínas.

O novo método terá implicações significativas em aplicações como o reconhecimento de voz e em quaisquer outras aplicações que envolvam o processamento computadorizado da linguagem natural, assim como para campos de estudo como a genética ou a linguística.

"O algoritmo - o método computacional - para o aprendizado e processamento de linguagem que nós desenvolvemos pode pegar um texto, abstrair dele uma coleção de padrões recorrentes, ou regras, e então gerar um novo material," explica o psicólogo Shimon Edelman, co-autor do artigo que descreve a pesquisa, publicada no periódico Proceedings of the National Academy of Sciences.

Ao contrário das tentativas anteriores para o desenvolvimento de algoritmos de computador voltados para o aprendizado da linguagem, o novo método, batizado de "Automatic Distillation of Structure - ADIOS", ou destilação automática de estrutura, consegue identificar padrões complexos em textos comuns. O algoritmo descobre os padrões alinhando repetidamente as sentenças e procurando por partes que se sobreponham.

"O ADIOS se fundamenta em um método estatístico para a extração de padrões e em uma generalização estruturada - dois processos ligados à aquisição da linguagem. Nossas experiências mostram que ele consegue capturar estruturas intricadas de dados simples, incluindo transcrições de falas dos pais com crianças de dois ou três anos de idade,", conta o Dr. Edelman.

Além da fala com crianças, o algoritmo foi testado no texto completo da Bíblia, em diversos idiomas, e na notação musical. Ele também pode ser aplicado a dados biológicos, como pares de nucleotídeos e seqüências de aminoácidos. Analisando proteínas, por exemplo, o algoritmo foi capaz de extrair padrões de seqüências de aminoácidos que eram altamente correlacionados com as propriedades funcionais das proteínas.

Seguir Site Inovação Tecnológica no Google Notícias





Outras notícias sobre:
  • Inteligência Artificial
  • Software e Programação
  • Robôs
  • Realidade Virtual

Mais tópicos