Opinião

Os cientistas estão a caminho de sequenciar 1 milhão de genomas humanos e usar big data para desvendar segredos genéticos
O Projeto Genoma Humano permitiu aos cientistas ler, quase de ponta a ponta, os 3 bilhões de pares de bases de DNA - ou 'letras' - que definem biologicamente um ser humano.
Por Xavier Bofill De Ros - 16/04/2021


Um genoma humano completo, visto aqui em pares de cromossomos, oferece uma riqueza de informações, mas é difícil conectar a genética a características ou doenças. HYanWong / Wikimedia Comons

O primeiro esboço do genoma humano foi publicado há 20 anos em 2001 , levou quase três anos e custou entre US $ 500 milhões e US $ 1 bilhão . O Projeto Genoma Humano permitiu aos cientistas ler, quase de ponta a ponta, os 3 bilhões de pares de bases de DNA - ou “letras” - que definem biologicamente um ser humano.

Este projecto permitiu uma nova geração de pesquisadores como eu , atualmente um pós-doutorado no Instituto Nacional do Câncer, para identificar novos alvos para tratamentos de câncer , engenheiro de camundongos com sistemas imunológicos humanos e até mesmo construir uma página web onde qualquer pessoa pode navegar todo o genoma humano com a mesma facilidade com que você usa o Google Maps.

O primeiro genoma completo foi gerado a partir de um punhado de doadores anônimos para tentar produzir um genoma de referência que representasse mais do que apenas um único indivíduo. Mas isso estava longe de abranger a ampla diversidade das populações humanas no mundo . Não há duas pessoas iguais e nem dois genomas iguais. Se os pesquisadores quisessem compreender a humanidade em toda a sua diversidade, seria necessário sequenciar milhares ou milhões de genomas completos. Agora, um projeto como esse está em andamento.

Um grupo diversificado de pessoas.
Existe uma grande variação genética entre pessoas ao redor do globo. Flashpop /
DigitalVision via Getty Images

Compreendendo a diversidade genética

A riqueza da variação genética entre as pessoas é o que torna cada pessoa única. Mas as mudanças genéticas também causam muitos distúrbios e tornam alguns grupos de pessoas mais suscetíveis a certas doenças do que outros.

Na época do Projeto Genoma Humano, os pesquisadores também sequenciavam os genomas completos de organismos como ratos , moscas-das-frutas , leveduras e algumas plantas . O enorme esforço feito para gerar esses primeiros genomas levou a uma revolução na tecnologia necessária para ler os genomas. Graças a esses avanços, em vez de levar anos e custar centenas de milhões de dólares para sequenciar um genoma humano completo, agora leva alguns dias e custa apenas mil dólares . O sequenciamento do genoma é muito diferente dos serviços de genotipagem como 23 and Me ou Ancestry, que examinam apenas uma pequena fração das localizações no genoma de uma pessoa.

Os avanços na tecnologia permitiram aos cientistas sequenciar os genomas completos de milhares de indivíduos de todo o mundo. Iniciativas como o Genome Aggregation Consortia estão atualmente fazendo esforços para coletar e organizar esses dados dispersos. Até agora, esse grupo conseguiu reunir cerca de 150.000 genomas que mostram uma quantidade incrível de diversidade genética humana. Dentro desse conjunto, os pesquisadores encontraram mais de 241 milhões de diferenças nos genomas das pessoas, com uma média de uma variante para cada oito pares de bases .

A maioria dessas variações é muito rara e não terá efeito sobre uma pessoa. No entanto, escondidas entre eles estão variantes com importantes consequências fisiológicas e médicas. Por exemplo, certas variantes do gene BRCA1 predispõem alguns grupos de mulheres, como os judeus Ashkenazi, ao câncer de ovário e de mama . Outras variantes desse gene levam algumas mulheres nigerianas a apresentar mortalidade acima do normal por câncer de mama.

A melhor maneira que os pesquisadores podem identificar esses tipos de variantes em nível de população é por meio de estudos de associação do genoma que comparam os genomas de grandes grupos de pessoas com um grupo de controle. Mas as doenças são complicadas. O estilo de vida de um indivíduo, os sintomas e o tempo de início podem variar muito, e o efeito da genética em muitas doenças é difícil de distinguir. O poder preditivo da pesquisa genômica atual é muito baixo para detectar muitos desses efeitos porque não há dados genômicos suficientes .

Compreender a genética de doenças complexas, especialmente aquelas relacionadas às diferenças genéticas entre grupos étnicos, é essencialmente um problema de big data. E os pesquisadores precisam de mais dados.

1.000.000 de genomas

Para atender à necessidade de mais dados, o National Institutes of Health iniciou um programa chamado All of Us . O projeto visa coletar informações genéticas, registros médicos e hábitos de saúde a partir de pesquisas e vestíveis de mais de um milhão de pessoas nos Estados Unidos ao longo de 10 anos. Ele também tem o objetivo de coletar mais dados de grupos minoritários sub-representados para facilitar o estudo das disparidades de saúde. O projeto All of Us foi aberto ao público em 2018, e mais de 270.000 pessoas contribuíram com amostras desde então. O projeto continua recrutando participantes de todos os 50 estados. Participam desse esforço muitos laboratórios acadêmicos e empresas privadas.

Esse esforço pode beneficiar cientistas de uma ampla gama de campos. Por exemplo, um neurocientista pode procurar variações genéticas associadas à depressão, levando em consideração os níveis de exercício. Um oncologista pode pesquisar variantes que se correlacionam com a redução do risco de câncer de pele enquanto explora a influência da origem étnica.

Um milhão de genomas e as informações de saúde e estilo de vida que os acompanham fornecerão uma riqueza extraordinária de dados que deve permitir aos pesquisadores descobrir os efeitos da variação genética nas doenças, não apenas para os indivíduos, mas também dentro de diferentes grupos de pessoas.

A matéria escura do genoma humano

Outro benefício deste projeto é que permitirá aos cientistas aprender sobre partes do genoma humano que atualmente são muito difíceis de estudar. A maior parte da pesquisa genética tem sido feita nas partes do genoma que codificam proteínas. No entanto, representam apenas 1,5% do genoma humano .

Minha pesquisa se concentra no RNA - uma molécula que transforma as mensagens codificadas no DNA de uma pessoa em proteínas. No entanto, os RNAs que vêm de 98,5% do genoma humano que não produzem proteínas têm uma miríade de funções por si próprios. Alguns desses RNAs não codificadores estão envolvidos em processos como a disseminação do câncer , o desenvolvimento embrionário ou o controle do cromossomo X nas mulheres . Em particular, estudo como as variações genéticas podem influenciar o enovelamento intrincado que permite que os RNAs não codificantes façam seu trabalho. Uma vez que o projeto All of Us inclui todas as partes codificantes e não codificantes do genoma, será de longe o maior conjunto de dados relevante para o meu trabalho e espero lançar luz sobre esses misteriosos RNAs.

O primeiro genoma humano gerou 20 anos de progresso científico incrível. Acho que é quase certo que um enorme conjunto de dados de variações genômicas desvendará pistas sobre doenças complexas. Graças a estudos populacionais em grande escala e projetos de big data, como All of Us, os pesquisadores estão abrindo caminho para responder, na próxima década, como nossa genética individual molda nossa saúde.

*As opiniões expressas neste artigo são de responsabilidade exclusiva do(s) autor(es), não refletindo necessariamente a posição institucional do maisconhecer.com

Xavier Bofill De Ros
Bolsista de pesquisa em biologia de RNA, National Institutes of Health

 

.
.

Leia mais a seguir