Tecnologia Científica

Novo genoma de referência humano abre regiões inexploradas
O novo genoma de referência preenche muitas lacunas que foram deixadas por rascunhos anteriores, especialmente nos centrômeros no meio dos cromossomos e duplicações em grande escala.
Por UC Davis - 31/03/2022


Megan Dennis, professora assistente de bioquímica e medicina molecular na UC Davis School of Medicine e MIND Institute, colaborou em estudos que completam o sequenciamento do genoma humano. Crédito: Karin Higgins/UC Davis

Uma sequência completa do genoma humano foi finalmente publicada por um consórcio internacional de cientistas. O novo genoma de referência preenche muitas lacunas que foram deixadas por rascunhos anteriores, especialmente nos centrômeros no meio dos cromossomos e duplicações em grande escala.

O trabalho é descrito em uma série de artigos publicados em 1º de abril na Science pelo Consórcio Telomere-to-Telomere (T2T). Vários pesquisadores da Universidade da Califórnia em Davis contribuíram para os estudos, incluindo Megan Dennis, professora assistente de bioquímica e medicina molecular na Escola de Medicina da UC Davis e no Instituto MIND, com os alunos de pós-graduação em Genética Integrativa e Genômica Daniela Soto e Colin Shew, como bem como Charles Langley, distinto professor de evolução e ecologia na UC Davis College of Biological Sciences, juntamente com sua filha Sasha Langley, cientista do projeto na UC Berkeley.

A sequência original do genoma humano , publicada em 2001, deixou de fora cerca de 8% do DNA, disse Dennis. As áreas omitidas incluíam duplicações quase idênticas contendo genes funcionais, bem como centrômeros e telômeros no meio e na ponta dos cromossomos, respectivamente. Essas áreas contêm longas sequências repetidas.

"Estas são regiões importantes, mas difíceis de sequenciar", disse Dennis.

Sequenciar um genoma é como cortar um livro em pedaços de texto e tentar reconstruir o livro juntando-os novamente. Trechos de texto que contêm muitas palavras e frases comuns ou repetidas seriam mais difíceis de colocar no lugar correto do que pedaços de texto mais exclusivos.

A tecnologia anterior de sequenciamento de DNA só conseguia ler sequências relativamente curtas.

"Um grande salto na tecnologia foi o sequenciamento de longa leitura", disse Dennis. Sequenciadores de nova geração podem decodificar pedaços muito mais longos, até um milhão de pares de bases ou "letras" de DNA. Isso significa que os pedaços são muito maiores e mais fáceis de montar de volta na sequência original.

"É um divisor de águas", disse Dennis.

Os pesquisadores da UC Davis contribuíram para o projeto realizando alguns dos sequenciamentos de leitura longa com máquinas no Centro de Genoma e analisando variantes e sequências duplicadas.

O novo genoma de referência vem de uma única amostra humana, embora não exatamente de uma pessoa. O DNA veio de uma linha celular derivada de um feixe de células chamado mola hidatiforme. Eles se formam quando um óvulo no útero perde seu próprio genoma, mas é fertilizado por um espermatozoide. A célula resultante acaba com duas cópias idênticas de cada cromossomo, ao contrário da maioria das células humanas, que carregam duas cópias ligeiramente diferentes. Apesar de sua origem estranha, não há nada que sugira algo fora do comum com o genoma da linhagem celular, disse Dennis.
 
O esperma veio de uma pessoa de ascendência europeia. Em contraste, o genoma de referência humano original foi costurado de várias pessoas, criando alguns erros e artefatos.

Explorando o centrômero

Cerca de 90 por cento da nova sequência realmente vem dos centrômeros dos cromossomos, disse Langley. Estruturalmente distintas e contendo longos trechos de DNA repetitivo, essas regiões são notoriamente difíceis de estudar.

"Nós costumávamos dizer que você alertaria os jovens geneticistas para não se aventurarem no centrômero porque você nunca sairia", disse Langley.

Mas hoje em dia os centrômeros são um tema quente na biologia. É aqui que a maquinaria que separa os cromossomos pareados durante a meiose – formação de espermatozoides e óvulos – se liga, um passo fundamental na herança. Ele contém grandes quantidades de heterocromatina, ou áreas onde o DNA e as proteínas parecem ser mais condensados ​​e compactos.

Os geneticistas conhecem a heterocromatina, vista como manchas escuras nos cromossomos, há décadas. O pensamento recente sugere que a heterocromatina desempenha um papel importante na forma como os genes são ativados e desativados, deslocando partes do DNA para uma fase diferente do resto do cromossomo, como gotas de óleo na água. Isso efetivamente criaria compartimentos no núcleo onde genes específicos poderiam ser ativados ou desativados.

Outro mistério dos centrômeros é como e por que eles se formam consistentemente no mesmo lugar, porque não há um código genético específico para eles. Eles são determinados "epigeneticamente", ou fora do genoma. Basicamente, seus centrômeros estão onde estão porque é onde eles estavam no esperma e no óvulo do qual você foi concebido.

Os Langleys e seus coautores foram capazes de comparar as sequências de centrômeros do novo genoma de referência com outras sequências publicadas, fornecendo evidências de que os centrômeros humanos podem de fato se mover um pouco. Isso foi encontrado em outras espécies animais.

"Agora poderemos entender melhor como essas coisas acontecem", disse Langley.

Formulários

Ter a sequência original do genoma humano tem sido uma ferramenta poderosa para descoberta em ciências biomédicas nos últimos 20 anos. A nova referência ajudará os pesquisadores a entender melhor a variação, especialmente nas áreas que não foram bem cobertas antes ou com erros e artefatos, disse Dennis.

"Ele já está sendo usado para reanalisar genomas coletados pelo Projeto 1000 Genomas, descobrindo e verificando milhares de novas variantes", disse ela. O Projeto 1000 Genomas é uma colaboração internacional para criar um catálogo de variação genética humana.

Essas novas variantes genéticas confirmadas podem, por exemplo, ser associadas a estados de doença e resultados clínicos usando dados de sequenciamento de pacientes, como indivíduos autistas, disse Dennis.

O T2T Consortium inclui 114 cientistas em 33 instituições e é copresidido por Adam Phillippy, NHGRI e Karen Miga, UC Santa Cruz.

 

.
.

Leia mais a seguir