Durante décadas, o cromossoma Y – um dos dois cromossomas sexuais humanos – tem sido notoriamente um desafio para a comunidade genómica sequenciar devido à complexidade da sua estrutura.

Até recentemente, cerca de metade do cromossomo Y humano estava faltando no genoma de referência. Agora, os cientistas sequenciaram esse cromossomo de ponta a ponta. Crédito: Instituição Nacional de Pesquisa do Genoma Humano
Durante décadas, o cromossoma Y – um dos dois cromossomas sexuais humanos – tem sido notoriamente um desafio para a comunidade genómica sequenciar devido à complexidade da sua estrutura.
Agora, esta área indescritível do genoma foi totalmente sequenciada, um feito que finalmente completa o conjunto de cromossomas humanos de ponta a ponta e adiciona 30 milhões de novas bases à referência do genoma humano, principalmente a partir de ADN de satélite difícil de sequenciar. Essas bases revelam 41 genes codificadores de proteínas adicionais e fornecem informações cruciais para aqueles que estudam questões importantes relacionadas à reprodução, evolução e mudança populacional.
Pesquisadores do consórcio Telomere-to-Telomere (T2T), que é co-liderado pela professora assistente de engenharia biomolecular da Universidade da Califórnia, Santa Cruz, Karen Miga, anunciaram essa conquista em um artigo publicado na revista Nature . A referência completa e anotada do cromossomo Y está disponível para uso no UCSC Genome Browser e pode ser acessada via Github.
"Há apenas alguns anos, faltava metade do cromossomo Y humano [na referência] - as desafiadoras e complexas áreas satélites", disse Monika Cechova, coautora principal do artigo e pós-doutoranda em engenharia biomolecular na UCSC. "Naquela época, nem sabíamos se poderia ser sequenciado, era muito intrigante. Esta é realmente uma grande mudança no que é possível."
Completando o Y
Quando cientistas e médicos estudam o genoma de um indivíduo, eles comparam o DNA dos indivíduos com o de uma referência padrão para determinar onde há variação. Até agora, a porção do cromossomo Y do genoma humano continha grandes lacunas que dificultavam a compreensão da variação e das doenças associadas.
A estrutura do cromossomo Y tem sido difícil de decodificar porque parte do DNA está organizada em palíndromos – longas sequências que são iguais para frente e para trás – abrangendo mais de um milhão de pares de bases. Além disso, uma grande parte do cromossoma Y que faltava na versão anterior da referência Y é ADN satélite – regiões grandes e altamente repetitivas de ADN não codificador de proteínas. No cromossomo Y, dois satélites estão interligados entre si, complicando ainda mais o processo de sequenciamento.
Os pesquisadores conseguiram uma leitura perfeita do cromossomo Y devido aos avanços na tecnologia de sequenciamento de leitura longa e aos novos e inovadores métodos de montagem computacional que poderiam lidar com as sequências repetitivas e transformar os dados brutos do sequenciamento em um recurso utilizável.
Esses novos conjuntos de métodos permitiram à equipe abordar alguns dos aspectos particularmente desafiadores do cromossomo Y, como identificar com precisão onde ocorre uma inversão em uma sequência palindrômica – uma técnica que pode ser usada para encontrar outras inversões. Os métodos estabelecidos no artigo permitirão aos cientistas realizar leituras mais completas dos cromossomos Y humanos para obter uma melhor compreensão de como esse material genético afeta a diversificada população humana.
“Era o cromossomo Y que carecia de mais sequências do genoma de referência anterior”, disse Arang Rhie, cientista do Instituto Nacional de Pesquisa do Genoma Humano e autor principal do artigo. "Sempre foi irritante saber que faltava metade do Y sempre que tentávamos fazer qualquer análise baseada em referências. Fiquei muito animado para fazer a curadoria do primeiro Y completo, para ver o que realmente estava faltando e o que podemos fazer agora."
Em 2018, Miga e seus colegas divulgaram o primeiro mapa completo de um centrômero humano no cromossomo Y. Esse primeiro fechamento de lacuna foi creditado ao acesso a dados ultralongos, que se baseiam na tecnologia de sequenciamento de nanoporos que tem suas origens aqui na UCSC . Ficou claro naquele ponto que a tecnologia emergente e os conjuntos de dados de leitura longa e de alta cobertura tinham o potencial de completar cromossomos inteiros de ponta a ponta, o que levou ao lançamento do T2T Consortium, co-liderado por Phillippy e Miga.
Agora, apenas cinco anos depois, o consórcio T2T preencheu 30 milhões de pares de bases adicionais, além do primeiro genoma humano totalmente sequenciado (todos os autossomos e o cromossomo X) que foi lançado em 2022.
Permitindo novas pesquisas e descobertas
O cromossomo Y é mais comumente associado a indivíduos atribuídos ao sexo masculino no nascimento, mas pode ser encontrado em outros, como pessoas intersexuais. As características sexuais reguladas pelo DNA no cromossomo Y também não são equivalentes à identidade de gênero de um indivíduo. Embora existam relativamente poucos genes no cromossomo Y, os que estão presentes são complexos e dinâmicos e codificam funções importantes como a espermatogênese, a produção de espermatozoides.
A referência completa do cromossomo Y permitirá aos cientistas estudar melhor uma miríade de características sobre esta parte do genoma humano de uma forma que nunca foi possível antes.
A estrutura complexa do cromossomo Y permitiu uma rápida evolução dentro de suas famílias de genes. Na verdade, o cromossomo Y é o cromossomo humano que muda mais rapidamente, e até mesmo o cromossomo que muda mais rapidamente entre os grandes símios. Isto significa que os cromossomas Y de duas pessoas saudáveis ??podem parecer muito diferentes – por exemplo, uma pessoa pode ter 40 cópias de um gene, enquanto outra pessoa tem 19 cópias.
Esta evolução pode agora ser melhor estudada utilizando a nova referência e os métodos estabelecidos para sequenciação dos cromossomas Y. Este poderia ser o foco futuro das clínicas de fertilização in vitro ou de outras pesquisas sobre reprodução e infertilidade.
A sequência ponta a ponta do cromossomo Y é um recurso extremamente importante para aqueles que estudam a evolução e a deriva da população humana. Isso ocorre porque o cromossomo Y é herdado de geração em geração em um grupo de material genético, com muito pouca recombinação fora desse grupo, ao contrário dos autossomos e genes no cromossomo X humano que frequentemente se recombinam e compartilham material genético entre si. Ter uma imagem mais clara do cromossomo Y torna mais fácil rastrear genes através de gerações de herança e aprender como a localização e o conteúdo dos genes mudaram ao longo do tempo.
Os 30 milhões de novas bases adicionadas à referência do cromossomo Y também serão cruciais para o estudo da evolução do genoma. Agora será possível estudar padrões específicos e únicos de sequência do cromossomo Y, como a estrutura dos dois satélites e a localização e o número de cópias dos genes.
Mesmo dentro do cromossomo Y, os genes são divididos em várias regiões, muito diferentes entre si em termos de conteúdo, estrutura e história evolutiva. Compreender as taxas de mudança no cromossomo Y e como interpretar essa mudança são questões intrigantes que agora serão possíveis de estudar usando as técnicas desenvolvidas neste artigo para sequenciar completamente os cromossomos Y humanos.
A referência mais rica que inclui a sequência completa do DNA satélite do cromossomo Y também permitirá aos cientistas entender melhor a relação evolutiva dessas sequências com o DNA satélite encontrado em outras partes do genoma.
"É emocionante poder finalmente ver essas sequências em regiões heterocromáticas [densamente compactadas] pela primeira vez. Finalmente, podemos projetar experimentos para testar o impacto e a função dessas partes anteriormente inexploradas do cromossomo Y", disse Miga. .
Foi demonstrado que as pessoas com cromossomos Y podem perder parte ou todo esse material genético à medida que envelhecem, mas os cientistas nunca entenderam completamente por que isso acontece e os efeitos que pode ter. A referência completa do cromossomo Y pode ajudar a esclarecer esse mistério. Também será mais fácil estudar condições e distúrbios ligados ao cromossomo Y, como a falta de produção de esperma que leva à infertilidade.
Contaminação em genomas bacterianos
Uma descoberta inesperada deste artigo foi que o DNA do cromossomo Y foi repetidamente confundido com o DNA bacteriano em estudos anteriores devido à remoção incompleta da contaminação humana no DNA bacteriano. Essa descoberta promete aprimorar o estudo dos genomas de espécies bacterianas.
O DNA humano pode aparecer como um contaminante nas amostras genômicas de espécies bacterianas porque o DNA bacteriano é frequentemente retirado de amostras de pele humana. Os cientistas usam a referência atual do genoma humano para identificar quais sequências vêm da contaminação humana e removê-las, deixando apenas o DNA bacteriano para seu estudo. Mas, como grandes partes do cromossomo Y humano estavam faltando na referência humana do passado, os cientistas não foram capazes de identificá-los como humanos e, portanto, os confundiram com parte do DNA das espécies que estavam estudando.
Este artigo encontra evidências de que cerca de 5.000 genomas bacterianos em um banco de dados comum provavelmente continham contaminação correspondente às sequências do Y humano. Os grupos que estudam estas espécies bacterianas podem usar a referência Y atualizada para remover corretamente toda a contaminação humana dos seus genomas de referência e obter uma compreensão mais clara do genoma bacteriano.
“Isso foi uma coisa surpreendente”, disse Rhie. "As pessoas estavam adivinhando, mas ninguém conseguiu provar que isso estava acontecendo até agora."
Pangenoma Y e direções futuras
Embora o cromossomo Y humano completo abra as portas para muitas novas descobertas, os pesquisadores planejam melhorar ainda mais o estudo dessa região, incluindo o cromossomo Y em versões futuras do pangenoma humano .
O pangenoma é uma nova referência para a genómica que combina a informação genómica de múltiplas pessoas de várias origens ancestrais para, em última análise, permitir pesquisas e descobertas clínicas mais equitativas, como ajudar a diagnosticar doenças, prever resultados médicos e orientar tratamentos.
Em colaboração com o Consórcio de Referência do Pangenoma Humano, os pesquisadores planejam incorporar sequências completas do cromossomo Y nos genomas individuais que compõem o pangenoma. Isso ajudará os cientistas a entender como o cromossomo Y varia entre pessoas de diferentes origens ancestrais e fornecerá um melhor ponto de referência para entender o Y em toda a diversidade da população humana.
Os pesquisadores esperam poder colaborar com cientistas de todo o mundo para permitir que outros concluam o sequenciamento do cromossomo Y.
“Nosso objetivo é tornar esses dados amplamente acessíveis”, disse Miga. “Ao criar e compartilhar esses importantes catálogos de diferenças genéticas no cromossomo Y, podemos expandir os estudos genéticos de doenças humanas e fornecer novos insights sobre a biologia básica”.
Mais informações: A sequência completa de um cromossomo Y humano, Nature (2023). DOI: 10.1038/s41586-023-06457-y . www.nature.com/articles/s41586-023-06425-6 . No bioRxiv : DOI: 10.1101/2022.12.01.518724
Informações do periódico: bioRxiv , Nature