Inteligência artificial redesenha medicamentos e supera moléculas existentes em potência
Estudo publicado na revista Nature Communications mostra que modelos de linguagem química conseguem aprender com dados incrementais e criar compostos mais eficazes que referências conhecidas, abrindo uma nova fronteira na descoberta de fármacos

Imagem: Reprodução
Um avanço significativo na interseção entre inteligência artificial e química medicinal está redesenhando o futuro da descoberta de medicamentos. Em um estudo publicado neste sábado (11), na Nature Communications, pesquisadores da Ludwig-Maximilians-Universität München demonstram que modelos de linguagem — similares aos usados para processar textos — podem ser treinados para projetar moléculas com potência superior à de compostos já conhecidos.
O trabalho, liderado por Tim Hörmann e supervisionado por Daniel Merk, introduz uma estratégia inovadora de treinamento incremental que permite aos algoritmos “aprender” como um químico humano: passo a passo, com base em evidências acumuladas. “Nosso objetivo foi mimetizar o processo de descoberta de fármacos, no qual o conhecimento evolui progressivamente a partir de ciclos de teste e refinamento”, afirma Merk no artigo.
Aprendizado químico como linguagem
O estudo se apoia em um conceito emergente conhecido como modelos de linguagem química (CLMs), que tratam moléculas como sequências de caracteres — semelhantes a frases. Esses modelos são treinados inicialmente com grandes bancos de dados, como o ChEMBL, que reúne centenas de milhares de compostos bioativos.
Após essa fase, os pesquisadores aplicaram um refinamento progressivo: o modelo foi alimentado com séries de moléculas organizadas por níveis crescentes de potência biológica. Esse treinamento incremental permitiu ao sistema identificar padrões sutis de relação estrutura-atividade (SAR), fundamentais na química medicinal.
“O diferencial está em incorporar a dimensão da potência como uma trajetória de aprendizado”, explica Domenic Mayer, coautor do estudo. “Isso fornece ao modelo um caminho mais estruturado para explorar o espaço químico.”
Resultados que superam o estado da arte
Os resultados impressionam. Em experimentos com o receptor nuclear PPARy — alvo de medicamentos antidiabéticos — os modelos geraram compostos com atividade até 62 vezes superior a moléculas de referência.
Em termos práticos, todos os nove compostos sintetizados a partir das sugestões do modelo apresentaram alta potência em testes laboratoriais, com valores de EC50 na faixa subnanomolar. Alguns deles superaram significativamente o melhor composto previamente conhecido, evidenciando a capacidade do sistema de extrapolar além dos dados fornecidos.
“O fato de termos obtido nove em nove compostos mais potentes que o padrão é extraordinário”, destaca Max Lewandowski, responsável pela validação experimental.
Além disso, o modelo também foi aplicado ao receptor RORy, relevante em doenças autoimunes. Um dos compostos gerados apresentou potência até 20 vezes maior que moléculas comparáveis, confirmando a robustez da abordagem em diferentes contextos biológicos.
Sem “oráculos”: uma ruptura metodológica
Tradicionalmente, métodos computacionais de design de fármacos dependem de modelos auxiliares — conhecidos como “oráculos” — para avaliar a qualidade das moléculas geradas. Esses sistemas, no entanto, introduzem incertezas e limitações, especialmente quando dados confiáveis são escassos.
A nova abordagem elimina essa dependência. O modelo aprende diretamente com dados experimentais existentes, sem necessidade de validação externa durante a geração das moléculas.
“Isso reduz significativamente a complexidade e o risco de erro”, afirma Andrea Hunklinger. “Estamos mostrando que é possível otimizar moléculas apenas com base no conhecimento químico acumulado.”
O treinamento envolveu mais de 496 mil moléculas extraídas do ChEMBL, posteriormente filtradas para remover qualquer informação prévia sobre os alvos estudados. Isso garantiu que o modelo não tivesse “memória” prévia dos compostos analisados, reforçando a validade dos resultados.
Durante os testes, foram geradas dezenas de milhares de novas moléculas. Entre elas 99% eram quimicamente válidas; 28% eram únicas e 78% pertenciam ao espaço químico desejado

Imagem: Reprodução
Esses números indicam alta eficiência tanto na geração quanto na relevância dos compostos propostos.
Impacto e futuro
O impacto potencial dessa tecnologia é profundo. A descoberta de medicamentos é tradicionalmente lenta e cara, envolvendo ciclos extensos de tentativa e erro. Ao automatizar e acelerar esse processo, modelos como o apresentado podem reduzir drasticamente o tempo necessário para identificar candidatos promissores.
Além disso, a capacidade de capturar dependências estruturais complexas — incluindo interações de longo alcance dentro das moléculas — sugere que esses sistemas podem revelar padrões invisíveis ao olho humano.
“Estamos apenas começando a explorar o que esses modelos podem fazer”, afirma Thomas Wein. “Eles não substituem os químicos, mas ampliam enormemente suas capacidades.”
Uma nova era na química medicinal
O estudo representa um passo decisivo rumo a uma nova era na ciência dos medicamentos, em que algoritmos não apenas auxiliam, mas também inovam de forma autônoma.
Ao combinar aprendizado incremental, grandes volumes de dados e validação experimental rigorosa, a equipe da Ludwig-Maximilians-Universität München demonstra que a inteligência artificial pode não só replicar o raciocínio humano — mas, em certos casos, superá-lo.
Se confirmada em larga escala, essa abordagem pode redefinir a maneira como novos fármacos são concebidos, aproximando a medicina de um futuro mais rápido, preciso e personalizado.
Referência
Hörmann, T., Mayer, D., Lewandowski, M. et al. Otimização estrutural de moléculas de fármacos com modelos de linguagem treinados incrementalmente. Nat Commun (2026). https://doi.org/10.1038/s41467-026-71591-w