Os cientistas estãoa caminho de sequenciar 1 milha£o de genomas humanos e usar big data para desvendar segredos genanãticos
O Projeto Genoma Humano permitiu aos cientistas ler, quase de ponta a ponta, os 3 bilhaµes de pares de bases de DNA - ou 'letras' - que definem biologicamente um ser humano.

Um genoma humano completo, visto aqui em pares de cromossomos, oferece uma riqueza de informações, mas édifacil conectar a genanãtica a caracteristicas ou doena§as. HYanWong / Wikimedia Comons
O primeiro esboa§o do genoma humano foi publicado há20 anos em 2001 , levou quase três anos e custou entre US $ 500 milhões e US $ 1 bilha£o . O Projeto Genoma Humano permitiu aos cientistas ler, quase de ponta a ponta, os 3 bilhaµes de pares de bases de DNA - ou “letras†- que definem biologicamente um ser humano.
Este projecto permitiu uma nova geração de pesquisadores como eu , atualmente um pa³s-doutorado no Instituto Nacional do Ca¢ncer, para identificar novos alvos para tratamentos de câncer , engenheiro de camundongos com sistemas imunológicos humanos e atémesmo construir uma pa¡gina web onde qualquer pessoa pode navegar todo o genoma humano com a mesma facilidade com que vocêusa o Google Maps.
O primeiro genoma completo foi gerado a partir de um punhado de doadores ana´nimos para tentar produzir um genoma de referaªncia que representasse mais do que apenas um aºnico indivaduo. Mas isso estava longe de abranger a ampla diversidade das populações humanas no mundo . Nãoháduas pessoas iguais e nem dois genomas iguais. Se os pesquisadores quisessem compreender a humanidade em toda a sua diversidade, seria necessa¡rio sequenciar milhares ou milhões de genomas completos. Agora, um projeto como esse estãoem andamento.
Um grupo diversificado de pessoas.
Existe uma grande variação genanãtica entre pessoas ao redor do globo. Flashpop /
DigitalVision via Getty Images
Compreendendo a diversidade genanãtica
A riqueza da variação genanãtica entre as pessoas éo que torna cada pessoa única. Mas asmudanças genanãticas também causam muitos distúrbios e tornam alguns grupos de pessoas mais suscetíveis a certas doenças do que outros.
Na anãpoca do Projeto Genoma Humano, os pesquisadores também sequenciavam os genomas completos de organismos como ratos , moscas-das-frutas , leveduras e algumas plantas . O enorme esfora§o feito para gerar esses primeiros genomas levou a uma revolução na tecnologia necessa¡ria para ler os genomas. Graças a esses avanços, em vez de levar anos e custar centenas de milhões de da³lares para sequenciar um genoma humano completo, agora leva alguns dias e custa apenas mil da³lares . O sequenciamento do genoma émuito diferente dos servia§os de genotipagem como 23 and Me ou Ancestry, que examinam apenas uma pequena fração das localizações no genoma de uma pessoa.
Os avanços na tecnologia permitiram aos cientistas sequenciar os genomas completos de milhares de indivíduos de todo o mundo. Iniciativas como o Genome Aggregation Consortia estãoatualmente fazendo esforços para coletar e organizar esses dados dispersos. Atéagora, esse grupo conseguiu reunir cerca de 150.000 genomas que mostram uma quantidade incravel de diversidade genanãtica humana. Dentro desse conjunto, os pesquisadores encontraram mais de 241 milhões de diferenças nos genomas das pessoas, com uma média de uma variante para cada oito pares de bases .
A maioria dessas variações émuito rara e não tera¡ efeito sobre uma pessoa. No entanto, escondidas entre eles estãovariantes com importantes consequaªncias fisiola³gicas e médicas. Por exemplo, certas variantes do gene BRCA1 predispaµem alguns grupos de mulheres, como os judeus Ashkenazi, ao câncer de ova¡rio e de mama . Outras variantes desse gene levam algumas mulheres nigerianas a apresentar mortalidade acima do normal por câncer de mama.
A melhor maneira que os pesquisadores podem identificar esses tipos de variantes emnívelde população épor meio de estudos de associação do genoma que comparam os genomas de grandes grupos de pessoas com um grupo de controle. Mas as doenças são complicadas. O estilo de vida de um indivaduo, os sintomas e o tempo de inicio podem variar muito, e o efeito da genanãtica em muitas doenças édifacil de distinguir. O poder preditivo da pesquisa gena´mica atual émuito baixo para detectar muitos desses efeitos porque não hádados gena´micos suficientes .
Compreender a genanãtica de doenças complexas, especialmente aquelas relacionadas a s diferenças genanãticas entre grupos anãtnicos, éessencialmente um problema de big data. E os pesquisadores precisam de mais dados.
1.000.000 de genomas
Para atender a necessidade de mais dados, o National Institutes of Health iniciou um programa chamado All of Us . O projeto visa coletar informações genanãticas, registros médicos e hábitos de saúde a partir de pesquisas e vestaveis de mais de um milha£o de pessoas nos Estados Unidos ao longo de 10 anos. Ele também tem o objetivo de coletar mais dados de grupos minorita¡rios sub-representados para facilitar o estudo das disparidades de saúde. O projeto All of Us foi aberto ao paºblico em 2018, e mais de 270.000 pessoas contribuaram com amostras desde então. O projeto continua recrutando participantes de todos os 50 estados. Participam desse esfora§o muitos laboratórios acadaªmicos e empresas privadas.
Esse esfora§o pode beneficiar cientistas de uma ampla gama de campos. Por exemplo, um neurocientista pode procurar variações genanãticas associadas a depressão, levando em consideração os naveis de exercacio. Um oncologista pode pesquisar variantes que se correlacionam com a redução do risco de câncer de pele enquanto explora a influaªncia da origem anãtnica.
Um milha£o de genomas e as informações de saúde e estilo de vida que os acompanham fornecera£o uma riqueza extraordina¡ria de dados que deve permitir aos pesquisadores descobrir os efeitos da variação genanãtica nas doena§as, não apenas para os indivaduos, mas também dentro de diferentes grupos de pessoas.
A matéria escura do genoma humano
Outro benefacio deste projeto éque permitira¡ aos cientistas aprender sobre partes do genoma humano que atualmente são muito difaceis de estudar. A maior parte da pesquisa genanãtica tem sido feita nas partes do genoma que codificam proteanas. No entanto, representam apenas 1,5% do genoma humano .
Minha pesquisa se concentra no RNA - uma molanãcula que transforma as mensagens codificadas no DNA de uma pessoa em proteanas. No entanto, os RNAs que vão de 98,5% do genoma humano que não produzem proteanas tem uma miraade de funções por si pra³prios. Alguns desses RNAs não codificadores estãoenvolvidos em processos como a disseminação do câncer , o desenvolvimento embriona¡rio ou o controle do cromossomo X nas mulheres . Em particular, estudo como as variações genanãticas podem influenciar o enovelamento intrincado que permite que os RNAs não codificantes fazm seu trabalho. Uma vez que o projeto All of Us inclui todas as partes codificantes e não codificantes do genoma, seráde longe o maior conjunto de dados relevante para o meu trabalho e espero lana§ar luz sobre esses misteriosos RNAs.
O primeiro genoma humano gerou 20 anos de progresso cientafico incravel. Acho que équase certo que um enorme conjunto de dados de variações gena´micas desvendara¡ pistas sobre doenças complexas. Graças a estudos populacionais em grande escala e projetos de big data, como All of Us, os pesquisadores estãoabrindo caminho para responder, na próxima década, como nossa genanãtica individual molda nossa saúde.
*As opiniaµes expressas neste artigo são de responsabilidade exclusiva do(s) autor(es), não refletindo necessariamente a posição institucional do maisconhecer.com
Xavier Bofill De Ros
Bolsista de pesquisa em biologia de RNA, National Institutes of Health