terça-feira, 22 de março de 2011

DNA humano possui superestruturas escondidas

Todos já estão acostumados para as letras do DNA - A, C, G e T são os símbolos dos nucleotídeos adenina, citosina, guanina e timina.

Elas se unem para formar as pontes entre as hastes retorcidas da chamada "molécula da vida".

Mas parece que essas letras podem se unir em unidades maiores, como "palavras" ou até mesmo "frases".

Unidades básicas do DNA

Um grupo de pesquisadores das universidade de Málaga (Espanha) e Harvard (Estados Unidos) descobriram que o DNA contém estruturas maiores, muito além das letras individuais dos nucleotídeos.

Embora as funções dessas estruturas ainda não estejam bem claras, isto significa que os genes não são a única unidade organizacional dentro da sequência genética de um organismo.

Os cientistas verificaram que os genes individuais dentro dessas superestruturas têm uma interrelação que não pode ser explicada pelo mero acaso, implicando que as estruturas têm alguma função biológica.

Entropia

O genoma humano contém cerca de 3 bilhões das letras químicas A, C, G e T, que codificam os genes. As sequências de genes estão inseridas em porções mais longas do DNA, conhecidas como isócoras ou isocores.

Mas Pedro Carpena e seus colegas começaram a procurar regularidade em escalas maiores do que uma única isócora, que é definida pelo percentual de G e C em sua sequência.

Eles procuraram por regiões ricas em GC e pobres em GC nas sequências dos cromossomos humanos, utilizando um algoritmo baseado no conceito de entropia - uma medida do número de diferentes maneiras que um estado pode ser gerado.

Se uma moeda arremessada 10 vezes resulta em cinco caras e cinco coroas, toda a sequência tem alta entropia, porque existem muitas maneiras de conseguir esse resultado 50%-50%. Mas duas rodadas, com cinco resultados idênticos cada uma, tem uma entropia muito baixa, porque só há uma forma para que isso ocorra.

Carpena e seus colegas dividiram a sequência de nucleotídeos em segmentos que maximizam a diferença de entropia entre segmentos individuais e a sequência como um todo.

Superestruturas no DNA

Ao contrário do que acontece com uma moeda, contudo, a probabilidade de um determinado nucleotídeo aparecer não é independente dos nucleotídeos que vieram antes dele.

Para levar isso em conta, Carpena e seus colegas desenvolveram um novo modelo com uma ordenação realista de longo alcance, em substituição aos modelos aleatórios usados até então.

Eles descobriram que cada cromossomo humano é dividido em grandes segmentos com dezenas de milhões de nucleotídeos de comprimento - mais do que qualquer estrutura organizacional previamente conhecida no genoma.

Esses segmentos, que eles batizaram de "superestruturas", têm cerca de duas centenas de genes em média.

Função biológica desconhecida

Para verificar se estas superestruturas são biologicamente significativas, ou se não seriam apenas anomalias estatísticas, a equipe analisou os genes nessas superestruturas.

Eles usaram um banco de dados que atribui a cada gene um termo descritivo de sua função biológica, como "membrana", "metabólica" ou "sinalização".

Dois genes selecionados aleatoriamente tendem a compartilhar 6 desses termos descritivos. Dois genes na mesma isócora compartilham 15.

Quaisquer dois genes na mesma superestrutura tendem a compartilhar cerca de 18 termos.

Para Carpena e seus colegas, esta similaridade funcional sugere que a superestrutura tem uma função biológica, mesmo que ainda não consigam identificá-la.

Nenhum comentário: