Tecnologia Científica

Tirando algumas das conjecturas da descoberta de drogas
Um modelo de aprendizado profundo prevê rapidamente as formas 3D de moléculas semelhantes a drogas, o que poderia acelerar o processo de descoberta de novos medicamentos.
Por Adam Zewe - 06/12/2021


Os pesquisadores do MIT desenvolveram um modelo de aprendizado profundo que pode prever rapidamente as formas 3D prováveis ​​de uma molécula, dado um gráfico 2D de sua estrutura. Essa técnica pode acelerar a descoberta de medicamentos. Créditos: Imagem: Cortesia dos pesquisadores, editada por MIT News

Em sua busca para descobrir novos medicamentos eficazes, os cientistas procuram moléculas semelhantes a drogas que podem se ligar a proteínas causadoras de doenças e alterar sua funcionalidade. É crucial que eles conheçam a forma 3D de uma molécula para entender como ela se liga a superfícies específicas da proteína.

Mas uma única molécula pode se dobrar de milhares de maneiras diferentes, então resolver esse quebra-cabeça experimentalmente é um processo caro e demorado, semelhante a procurar uma agulha em um palheiro molecular.

Os pesquisadores do MIT estão usando o aprendizado de máquina para agilizar essa tarefa complexa. Eles criaram um modelo de aprendizado profundo que prevê as formas 3D de uma molécula com base exclusivamente em um gráfico em 2D de sua estrutura molecular. As moléculas são normalmente representadas como pequenos gráficos.

Seu sistema, GeoMol, processa moléculas em apenas alguns segundos e tem um desempenho melhor do que outros modelos de aprendizado de máquina, incluindo alguns métodos comerciais. GeoMol pode ajudar as empresas farmacêuticas a acelerar o processo de descoberta de drogas, reduzindo o número de moléculas que precisam testar em experimentos de laboratório, diz Octavian-Eugen Ganea, pós-doutorado no Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) e coautor do livro o papel.

“Quando você pensa em como essas estruturas se movem no espaço 3D, na verdade existem apenas certas partes da molécula que são realmente flexíveis, essas ligações rotativas. Uma das principais inovações de nosso trabalho é que pensamos em modelar a flexibilidade conformacional como um engenheiro químico faria. Na verdade, trata-se de tentar prever a distribuição potencial de ligações rotativas na estrutura ”, diz Lagnajit Pattanaik, estudante de graduação no Departamento de Engenharia Química e coautor do artigo.

Outros autores incluem Connor W. Coley, o Professor Assistente de Desenvolvimento de Carreira Henri Slezynger de Engenharia Química; Regina Barzilay, Professora Distinta de IA e Saúde da Escola de Engenharia do CSAIL; Klavs F. Jensen, o professor de Engenharia Química Warren K. Lewis; William H. Green, Professor Hoyt C. Hottel em Engenharia Química; e o autor sênior Tommi S. Jaakkola, o professor Thomas Siebel de Engenharia Elétrica em CSAIL e membro do Instituto de Dados, Sistemas e Sociedade. A pesquisa será apresentada esta semana na Conferência sobre Sistemas de Processamento de Informação Neural.

Mapeando uma molécula

Em um gráfico molecular, os átomos individuais de uma molécula são representados como nós e as ligações químicas que os conectam são arestas. 

O GeoMol utiliza uma ferramenta recente de aprendizado profundo chamada rede neural de passagem de mensagem, que é projetada especificamente para operar em gráficos. Os pesquisadores adaptaram uma rede neural de passagem de mensagem para prever elementos específicos da geometria molecular.

Dado um gráfico molecular, GeoMol inicialmente prevê os comprimentos das ligações químicas entre os átomos e os ângulos dessas ligações individuais. A maneira como os átomos estão organizados e conectados determina quais ligações podem girar.

GeoMol então prevê a estrutura da vizinhança local de cada átomo individualmente e monta pares vizinhos de ligações rotativas calculando os ângulos de torção e, em seguida, alinhando-os. Um ângulo de torção determina o movimento de três segmentos que estão conectados, neste caso, três ligações químicas que conectam quatro átomos.

“Aqui, as ligações giratórias podem assumir uma grande variedade de valores possíveis. Portanto, o uso dessas redes neurais de transmissão de mensagens nos permite capturar muitos dos ambientes locais e globais que influenciam essa previsão. A ligação rotativa pode assumir vários valores, e queremos que nossa previsão seja capaz de refletir essa distribuição subjacente ”, diz Pattanaik.

Superando os obstáculos existentes

Um grande desafio para prever a estrutura 3D das moléculas é modelar a quiralidade. Uma molécula quiral não pode ser sobreposta em sua imagem no espelho, como um par de mãos (não importa como você gire suas mãos, não há como suas características se alinharem exatamente). Se uma molécula for quiral, sua imagem no espelho não interagirá com o ambiente da mesma maneira.

Isso pode fazer com que os medicamentos interajam incorretamente com as proteínas, o que pode resultar em efeitos colaterais perigosos. Os métodos de aprendizado de máquina atuais frequentemente envolvem um processo de otimização longo e complexo para garantir que a quiralidade seja identificada corretamente, diz Ganea.

Como o GeoMol determina a estrutura 3D de cada ligação individualmente, ele define explicitamente a quiralidade durante o processo de predição, eliminando a necessidade de otimização após o fato.

Depois de realizar essas previsões, GeoMol produz um conjunto de estruturas 3D prováveis ​​para a molécula.

“O que podemos fazer agora é pegar nosso modelo e conectá-lo de ponta a ponta a um modelo que prevê esse apego a superfícies específicas de proteínas. Nosso modelo não é um pipeline separado. É muito fácil de integrar com outros modelos de aprendizagem profunda ”, diz Ganea.

Um modelo “super-rápido”

Os pesquisadores testaram seu modelo usando um conjunto de dados de moléculas e as prováveis ​​formas 3D que poderiam assumir, desenvolvido por Rafael Gomez-Bombarelli, o presidente de desenvolvimento de carreira em engenharia de Jeffrey Cheah, e o aluno de pós-graduação Simon Axelrod.

Eles avaliaram quantas dessas estruturas 3D prováveis ​​seu modelo foi capaz de capturar, em comparação com modelos de aprendizado de máquina e outros métodos.

Em quase todos os casos, o GeoMol superou os outros modelos em todas as métricas testadas.

“Descobrimos que nosso modelo é super-rápido, o que foi muito empolgante de ver. E, o que é mais importante, à medida que você adiciona mais ligações giratórias, espera que esses algoritmos diminuam significativamente. Mas nós realmente não vimos isso. A velocidade varia muito com o número de ligações rotativas, o que é promissor para o uso desses tipos de modelos no futuro, especialmente para aplicações onde você está tentando prever rapidamente as estruturas 3D dentro dessas proteínas ”, diz Pattanaik.

No futuro, os pesquisadores esperam aplicar GeoMol à área de triagem virtual de alto rendimento, usando o modelo para determinar pequenas estruturas de moléculas que interagiriam com uma proteína específica. Eles também querem continuar refinando o GeoMol com dados de treinamento adicionais para que ele possa prever com mais eficácia a estrutura de moléculas longas com muitas ligações flexíveis.

“A análise conformacional é um componente-chave de inúmeras tarefas no projeto de medicamentos auxiliado por computador e um componente importante no avanço das abordagens de aprendizado de máquina na descoberta de medicamentos”, disse Pat Walters, vice-presidente sênior de computação da Relay Therapeutics, que não esteve envolvido nisso pesquisar. “Estou animado com os avanços contínuos no campo e agradeço ao MIT por contribuir para um aprendizado mais amplo nesta área.”

Esta pesquisa foi financiada pelo consórcio Machine Learning for Pharmaceutical Discovery and Synthesis.

 

.
.

Leia mais a seguir