Informática

Dados são gravados em moléculas de DNA de forma 100% confiável

Algoritmo permite gravar dados no DNA de forma 100% confiável
"O resultado se parece com um pequeno montinho de poeira."[Imagem: EMBL]

Dados para sempre

Que o DNA é um mecanismo eficiente para armazenar dados, os próprios seres vivos o demonstram.

Já existem equipamentos para ler as informações do DNA, e mais recentemente se demonstrou que pode ser possível ler os dados gravados em moléculas DNA até de fósseis com milhões de anos.

Isso é muito promissor para o armazenamento de dados de longo prazo, uma vez que um disco rígido ou um CD não duram mais do que uma década - o meio de armazenamento digital mais confiável atualmente são as fitas magnéticas, que prometem durar cerca de um século.

Além disso, moléculas de DNA são extremamente pequenas, o que está de acordo com a tendência constante de miniaturização.

Ou seja, gravar dados em DNA parece ser uma boa ideia na maioria dos enfoques adotados - será um dado apenas para leitura, mas a intenção não é substituir as memórias de computador, mas criar um meio de armazenar os dados digitais a longo prazo.

Algoritmo genético

O problema é que ainda não havia uma forma de gravar dados de forma confiável em moléculas de DNA.

Há dois problemas na hora de passar os dados para as moléculas de DNA. O primeiro é que atualmente só se consegue fabricar moléculas de DNA em fitas muito curtas. O segundo é que a escrita sai cheia de erros, particularmente quando é necessário repetir a mesma letra.

Entram então na história Nick Goldman e Ewan Birney, do Laboratório Europeu de Biologia Molecular (EMBL), que idealizaram um algoritmo de gravação dos dados no momento da sintetização do DNA que evita os erros.

"Nós sabíamos que precisávamos fazer um código usando apenas fitas curtas de DNA, e fazer isso de forma a criar uma repetição da mesma letra seria impossível. Então pensamos, vamos quebrar o código em porções de fragmentos que se sobreponham, indo nas duas direções," explicou Birney.

A técnica consiste em indexar as informações, onde os índices indicam onde qual fragmento se encaixa na informação total, e garantir que nenhum fragmento tenha repetições - tão logo surge a necessidade de gravar uma repetição da mesma letra, passa-se para um novo fragmento e grava-se essa informação no índice.

Algoritmo permite gravar dados no DNA de forma 100% confiável
A técnica consiste em indexar as informações, onde os índices indicam onde qual fragmento se encaixa na informação total, e garantir que nenhum fragmento tenha repetições. [Imagem: Goldman et al./Nature]

Poeira de dados

Os pesquisadores então pegaram um arquivo MP3 com o discurso "I Have a Dream", de Martin Luther King, um arquivo JPG contendo a foto do instituto onde trabalham, um PDF do artigo de Watson e Crick que relatou a descoberta da estrutura do DNA e um arquivo TXT contendo todos os sonetos de Shakespeare - tudo foi enviado por email para a empresa Agilent Technologies, que disponibilizou seus serviços para sintetizar as moléculas de DNA seguindo o algoritmo de Goldman e Birney.

"Nós baixamos os arquivos e os usamos para sintetizar centenas de milhares de pedaços de DNA - o resultado se parece com um pequeno montinho de poeira," disse Emily Leproust, da Agilent, que também figura como coautora do artigo científico que descreve o experimento.

Ao pegar seu montinho de poeira de volta, os pesquisadores conseguiram ler todas as informações gravadas com 100% de precisão.

Desafios

Há muitos desafios a serem vencidos antes que o armazenamento de dados em moléculas de DNA possa se tornar prático para uso diário.

Tanto a gravação quanto a leitura são processos lentos e caros, que ainda precisam de aperfeiçoamento e, sobretudo, automatização.

Mas a demonstração, ao lado de vários outros experimentos similares realizados ao longo dos últimos anos, mostra que pode ser possível armazenar todas as águas do "dilúvio de dados" de forma duradoura e que não exija qualquer tipo de manutenção.

Bibliografia:

Towards practical, high-capacity, low-maintenance information storage in synthesized DNA
Nick Goldman, Paul Bertone, Siyuan Chen, Christophe Dessimoz, Emily M. LeProust, Botond Sipos, Ewan Birney
Nature Physics
Vol.: Published online
DOI: 10.1038/nature11875




Outras notícias sobre:

Mais Temas