MaisConhecer - Novo modelo de inteligência artificial separa mutação e seleção e melhora previsões sobre anticorpos

Novo modelo de inteligência artificial separa mutação e seleção e melhora previsões sobre anticorpos

Estudo mostra que distinguir processos evolutivos no treinamento de algoritmos aumenta a precisão na previsão de efeitos de mutações — avanço pode acelerar o desenvolvimento de terapias baseadas em anticorpos.

Domínio público

Pesquisadores desenvolveram um novo tipo de modelo de inteligência artificial capaz de prever com maior precisão como mutações afetam anticorpos — moléculas centrais do sistema imunológico e base de muitos medicamentos modernos. O avanço, descrito em um estudo publicado nesta quinta-feira (5), na revista científica eLife, demonstra que separar dois processos biológicos fundamentais — mutação genética e seleção natural — melhora significativamente o desempenho de algoritmos usados para analisar sequências de proteínas.

A pesquisa foi liderada por cientistas do Fred Hutchinson Cancer Center e da University of Washington, nos Estados Unidos, e propõe uma abordagem computacional que permite avaliar melhor quais alterações na estrutura de anticorpos podem aumentar ou prejudicar sua função biológica.

Anticorpos são proteínas produzidas por células do sistema imune para reconhecer e neutralizar vírus, bactérias e outras ameaças. Essas moléculas surgem a partir de processos genéticos altamente dinâmicos, que incluem recombinação de genes, mutações e seleção evolutiva dentro de estruturas chamadas centros germinativos. Compreender como pequenas mudanças em sua sequência alteram sua capacidade de ligação a um alvo é uma questão crucial tanto para imunologia quanto para a engenharia de medicamentos.

Nos últimos anos, cientistas passaram a usar modelos de linguagem inspirados em inteligência artificial — semelhantes aos que analisam textos humanos — para estudar sequências de proteínas. Esses algoritmos aprendem padrões presentes em enormes bancos de dados biológicos e tentam prever quais mutações podem ocorrer ou quais variantes são mais prováveis de funcionar.

Mas, segundo os autores do novo estudo, esses modelos têm uma limitação importante: eles misturam efeitos biológicos distintos no mesmo processo de aprendizagem.

“Os modelos atuais aprendem simultaneamente padrões de mutação genética e efeitos funcionais das proteínas”, explicou o pesquisador Frederick A. Matsen, um dos autores principais do trabalho. “Isso significa que parte da previsão pode refletir apenas a probabilidade de uma mutação ocorrer — não necessariamente se ela melhora ou piora a função do anticorpo.”

Um problema escondido nos algoritmos

Grande parte dos modelos atuais é treinada usando um método conhecido como “máscara”. Nesse processo, um aminoácido é ocultado em uma sequência de proteína e o algoritmo tenta prever qual deveria estar naquele lugar.

Essa estratégia funciona bem para linguagem humana, mas no contexto biológico pode gerar distorções. Isso ocorre porque algumas mutações são geneticamente mais fáceis de ocorrer do que outras — por exemplo, quando exigem apenas uma alteração de nucleotídeo no DNA.

O estudo mostrou que modelos existentes tendem a favorecer essas mutações “mais simples”, atribuindo a elas probabilidades muito maiores. Em alguns casos, aminoácidos que exigem várias mudanças no código genético receberam probabilidades quase cem vezes menores, independentemente de seu impacto funcional.

Domínio público

“Isso significa que o algoritmo pode confundir facilidade de mutação com vantagem biológica”, afirmou Matsen.

Esse viés compromete previsões sobre como mutações alteram propriedades importantes, como estabilidade da proteína ou afinidade de ligação a um antígeno.

Separando mutação e seleção

Para resolver o problema, a equipe desenvolveu um novo sistema chamado Deep Amino Acid Selection Model (DASM). Em vez de tentar aprender tudo ao mesmo tempo, o modelo divide explicitamente o problema em duas partes.

Primeiro, um componente fixo estima as probabilidades de mutações genéticas neutras — ou seja, mudanças que podem ocorrer apenas por mecanismos moleculares. Em seguida, uma rede neural profunda calcula separadamente os efeitos de seleção natural sobre cada possível mutação.

Esse segundo componente aprende quais alterações aumentam ou reduzem a funcionalidade do anticorpo.

“O objetivo é quantificar apenas o efeito funcional das mutações, removendo o ruído causado pelo processo genético”, disse Matsen.

Para treinar o sistema, os pesquisadores analisaram cerca de dois milhões de pares de sequências genéticas de anticorpos — representando versões “pais” e “filhas” surgidas durante processos naturais de evolução imunológica.

Mais rápido — e mais preciso

Quando comparado com modelos amplamente usados, o DASM apresentou desempenho superior em vários testes que medem a capacidade de prever efeitos de mutações.

Em experimentos envolvendo grandes bancos de dados de mutações de anticorpos — conhecidos como “deep mutational scanning” — o novo modelo mostrou correlação significativamente maior com medições experimentais de expressão e ligação molecular.

Além da precisão, os pesquisadores destacam a eficiência do sistema. O modelo possui muito menos parâmetros que alguns modelos de linguagem de proteínas existentes, o que o torna mais rápido e acessível.

Segundo os autores, ele pode ser executado em um laptop comum, sem necessidade de unidades gráficas avançadas.

Impacto para medicina e biotecnologia

Anticorpos são a base de dezenas de medicamentos usados no tratamento de câncer, doenças autoimunes e infecções virais. Melhorar a capacidade de prever quais mutações aumentam sua eficácia pode acelerar significativamente o desenvolvimento dessas terapias.

Modelos como o DASM também podem ajudar a entender como o sistema imunológico evolui naturalmente ao enfrentar patógenos.

“Compreender a trajetória evolutiva dos anticorpos pode nos ajudar a projetar moléculas mais eficazes e antecipar como o sistema imune responde a novas ameaças”, disseram os autores no estudo.

Especialistas dizem que o trabalho também aponta um caminho mais amplo para a biologia computacional: incorporar princípios evolutivos explícitos em algoritmos de inteligência artificial.

À medida que bancos de dados biológicos continuam crescendo rapidamente, abordagens híbridas — combinando conhecimento biológico e aprendizado profundo — podem se tornar essenciais para transformar dados genéticos em descobertas médicas.

Se confirmados em aplicações práticas, os resultados sugerem que separar mutação e seleção pode ser a chave para treinar algoritmos mais inteligentes sobre a linguagem da vida.

Referência

Frederico A Matsen, Will Dumm, Kevin Sung, Mackenzie M Johnson, David Rich, Tyler Starr, Música de Yun, Júlia Fukuyama, Hugh K Haddox, 2026. Separando a seleção da mutação em modelos de linguagem de anticorpos eLife 15 : RP109644. https://doi.org/ 10.7554/eLife.109644.2

Saúde

Um problema escondido nos algoritmos

Separando mutação e seleção

Mais rápido — e mais preciso

Impacto para medicina e biotecnologia