Saúde

Um 'ora¡culo' para prever a evolução da regulação genanãtica
Pesquisadores criam uma estrutura matemática para examinar o genoma e detectar assinaturas de selea§a£o natural, decifrando o passado evolutivo e o futuro do DNA não codificante.
Por Raleigh McElvery - 13/03/2022


Os pesquisadores desenvolveram um modelo de rede neural capaz de prever como asmudanças nas sequaªncias de DNA não codificantes em leveduras afetam a expressão gaªnica e a aptida£o reprodutiva. O modelo cria mapas, chamados de paisagens fitness, mostrados aqui e renderizados na forma de pa¡ssaros e peixes fossilizados. Essas criaturas de ordem superior evolua­ram como resultado demudanças evolutivas em sequaªncias de DNA não codificantes, como as descritas nas paisagens de fitness. Créditos: Imagem: Martin Krzywinski

Apesar do grande número de genes que cada canãlula humana contanãm, essas chamadas sequaªncias de DNA “codificantes” compreendem apenas 1% de todo o nosso genoma. Os 99% restantes são compostos de DNA “não codificador” osque, ao contra¡rio do DNA codificador, não carrega as instruções para construir protea­nas.

Uma função vital desse DNA não codificante, também chamado de DNA “regulador”, éajudar a ativar e desativar os genes, controlando quanto (se houver) de uma protea­na éproduzida. Com o tempo, a  medida que as células replicam seu DNA para crescer e se dividir, as mutações geralmente surgem nessas regiaµes não codificantes osa s vezes ajustando sua função e mudando a maneira como controlam a expressão gaªnica. Muitas dessas mutações são triviais e algumas são atébenanãficas. Ocasionalmente, poranãm, eles podem estar associados a um risco aumentado de doenças comuns, como diabetes tipo 2, ou mais fatais, incluindo ca¢ncer.

Para entender melhor as repercussaµes de tais mutações, os pesquisadores tem trabalhado arduamente em mapas matema¡ticos que lhes permitem observar o genoma de um organismo, prever quais genes sera£o expressos e determinar como essa expressão afetara¡ as caracteri­sticas observa¡veis ​​do organismo. Esses mapas, chamados de paisagens de aptida£o, foram conceituados cerca de um século atrás para entender como a composição genanãtica influencia uma medida comum de aptida£o do organismo em particular: o sucesso reprodutivo. As primeiras paisagens de fitness eram muito simples, muitas vezes focando em um número limitado de mutações. Conjuntos de dados muito mais ricos estãoagora dispona­veis, mas os pesquisadores ainda precisam de ferramentas adicionais para caracterizar e visualizar esses dados complexos. Essa capacidade não apenas facilitaria uma melhor compreensão de como os genes individuais evolua­ram ao longo do tempo,

Em um novo estudo publicado em 9 de mara§o na Nature , uma equipe de cientistas desenvolveu uma estrutura para estudar as paisagens de aptida£o do DNA regulador. Eles criaram um modelo de rede neural que, quando treinado em centenas de milhões de medições experimentais, foi capaz de prever como asmudanças nessas sequaªncias não codificantes em leveduras afetaram a expressão gaªnica. Eles também criaram uma maneira única de representar as paisagens em duasDimensões , tornando mais fa¡cil entender o passado e prever a evolução futura de sequaªncias não codificantes em organismos além da levedura ose atémesmo projetar padraµes de expressão gaªnica personalizados para terapias genanãticas e aplicações industriais.

“Agora temos um 'ora¡culo' que pode ser consultado para perguntar: e se tenta¡ssemos todas as mutações possa­veis dessa sequaªncia? Ou, que nova sequaªncia devemos projetar para nos dar uma expressão desejada?” diz Aviv Regev, professor de biologia do MIT (de licena§a), membro principal do Broad Institute of Harvard e do MIT (de licena§a), chefe da Genentech Research and Early Development e autor saªnior do estudo. “Os cientistas agora podem usar o modelo para sua própria questãoou cena¡rio evolutivo e para outros problemas, como fazer sequaªncias que controlam a expressão gaªnica de maneiras desejadas. Tambanãm estou animado com as possibilidades para pesquisadores de aprendizado de ma¡quina interessados ​​em interpretabilidade; eles podem fazer suas perguntas ao contra¡rio, para entender melhor a biologia subjacente."

Antes deste estudo, muitos pesquisadores simplesmente treinaram seus modelos em mutações conhecidas (ou pequenas variações delas) que existem na natureza. No entanto, a equipe de Regev queria dar um passo adiante criando seus pra³prios modelos imparciais capazes de prever a aptida£o e a expressão gaªnica de um organismo com base em qualquer sequaªncia de DNA possí­vel osmesmo sequaªncias que nunca tinham visto antes. Isso também permitiria aos pesquisadores usar esses modelos para projetar células para fins farmacaªuticos, incluindo novos tratamentos para câncer e distúrbios autoimunes.

Para atingir esse objetivo, Eeshit Dhaval Vaishnav, estudante de pós-graduação do MIT e co-primeiro autor; Carl de Boer, agora professor assistente da Universidade da Colaºmbia Brita¢nica; e seus colegas criaram um modelo de rede neural para prever a expressão gaªnica. Eles o treinaram em um conjunto de dados gerado pela inserção de milhões de sequaªncias de DNA não codificantes totalmente aleata³rias em levedura e observando como cada sequaªncia aleata³ria afetava a expressão gaªnica. Eles se concentraram em um subconjunto especa­fico de sequaªncias de DNA não codificantes chamadas promotores, que servem como locais de ligação para protea­nas que podem ativar ou desativar genes pra³ximos.

“Este trabalho destaca quais possibilidades se abrem quando projetamos novos tipos de experimentos para gerar os dados certos para treinar modelos”, diz Regev. “No sentido mais amplo, acredito que esses tipos de abordagens sera£o importantes para muitos problemas oscomo entender variantes genanãticas em regiaµes regulata³rias que conferem risco de doença no genoma humano, mas também para prever o impacto de combinações de mutações ou projetar novas moléculas .”

Regev, Vaishnav, de Boer e seus coautores passaram a testar as habilidades preditivas de seu modelo de várias maneiras, a fim de mostrar como ele poderia ajudar a desmistificar o passado evolutivo ose o possí­vel futuro osde certos promotores. “Criar um modelo preciso foi certamente uma conquista, mas, para mim, foi apenas um ponto de partida”, explica Vaishnav.

Primeiro, para determinar se o modelo poderia ajudar em aplicações de biologia sintanãtica, como a produção de antibia³ticos, enzimas e alimentos, os pesquisadores praticaram o uso para projetar promotores que pudessem gerar na­veis de expressão desejados para qualquer gene de interesse. Eles então vasculharam outros artigos cienta­ficos para identificar questões evolutivas fundamentais, a fim de ver se seu modelo poderia ajudar a respondaª-las. A equipe chegou ao ponto de alimentar seu modelo com um conjunto de dados populacionais do mundo real de um estudo existente, que continha informações genanãticas de cepas de levedura em todo o mundo. Ao fazer isso, eles foram capazes de delinear milhares de anos de pressaµes de seleção passadas que esculpiram os genomas da levedura de hoje.

Mas, para criar uma ferramenta poderosa que pudesse sondar qualquer genoma, os pesquisadores sabiam que precisariam encontrar uma maneira de prever a evolução de sequaªncias não codificantes, mesmo sem um conjunto de dados populacional tão abrangente. Para atingir esse objetivo, Vaishnav e seus colegas desenvolveram uma técnica computacional que lhes permitiu trazr as previsaµes de sua estrutura em um gra¡fico bidimensional. Isso os ajudou a mostrar, de uma maneira incrivelmente simples, como qualquer sequaªncia de DNA não codificante afetaria a expressão e a aptida£o dos genes, sem a necessidade de realizar experimentos demorados na bancada do laboratório.

"Um dos problemas não resolvidos nas paisagens de fitness era que não ta­nhamos uma abordagem para visualiza¡-las de uma maneira que capturasse significativamente as propriedades evolutivas das sequaªncias", explica Vaishnav. "Eu realmente queria encontrar uma maneira de preencher essa lacuna, e contribuir para a visão de longa data de criar um cena¡rio de fitness completo.”

Martin Taylor, professor de genanãtica da Unidade de Genanãtica Humana do Conselho de Pesquisa Manãdica da Universidade de Edimburgo, que não esteve envolvido na pesquisa, diz que o estudo mostra que a inteligaªncia artificial pode não apenas prever o efeito dasmudanças regulata³rias no DNA, mas também revelar os princa­pios subjacentes. que governam milhões de anos de evolução.

Apesar do fato de que o modelo foi treinado em apenas uma fração do DNA regulador de levedura em algumas condições de crescimento, ele estãoimpressionado que seja capaz de fazer previsaµes tão aºteis sobre a evolução da regulação genanãtica em mama­feros.

“Existem aplicações a³bvias de curto prazo, como o design personalizado de DNA regulata³rio para levedura na fabricação de cerveja, panificação e biotecnologia”, explica ele. “Mas as extensaµes deste trabalho também podem ajudar a identificar mutações de doenças no DNA regulador humano que atualmente são difa­ceis de encontrar e amplamente ignoradas na cla­nica. Este trabalho sugere que háum futuro brilhante para modelos de IA de regulação de genes treinados em conjuntos de dados mais ricos, mais complexos e mais diversos”.

Mesmo antes de o estudo ser formalmente publicado, Vaishnav começou a receber consultas de outros pesquisadores na esperana§a de usar o modelo para criar sequaªncias de DNA não codificantes para uso em terapias genanãticas.

“As pessoas estudam a evolução regulata³ria e os cenários de condicionamento fa­sico hádécadas”, diz Vaishnav. “Acho que nossa estrutura ajudara¡ bastante a responder a perguntas fundamentais e abertas sobre a evolução e a evolução do DNA regulador de genes 

 

.
.

Leia mais a seguir