Tecnologia Científica

O algoritmo de aprendizado de máquina de Stanford prevê estruturas biológicas com mais precisão do que nunca
Os pesquisadores de Stanford desenvolvem métodos de aprendizado de máquina que prevêem com precisão as formas 3D de alvos de drogas e outras moléculas biológicas importantes, mesmo quando apenas dados limitados estão disponíveis.
Por Isabel Swafford - 27/08/2021

Determinar as formas 3D das moléculas biológicas é um dos problemas mais difíceis na biologia moderna e na descoberta médica. As empresas e instituições de pesquisa costumam gastar milhões de dólares para determinar uma estrutura molecular - e mesmo esses esforços massivos são frequentemente malsucedidos.

Um novo algoritmo de inteligência artificial pode escolher a forma 3D de uma
molécula de RNA a partir de formas incorretas. A previsão computacional
das estruturas nas quais os RNAs se dobram é particularmente importante - e
particularmente difícil - porque tão poucas estruturas são conhecidas.
(Crédito da imagem: Camille LL Townshend)

Usando novas técnicas de aprendizado de máquina inteligentes, os alunos de PhD da Universidade de Stanford Stephan Eismann e Raphael Townshend, sob a orientação de Ron Dror , professor associado de ciência da computação, desenvolveram uma abordagem que supera esse problema ao prever estruturas precisas computacionalmente.

Mais notavelmente, sua abordagem é bem-sucedida mesmo ao aprender com apenas algumas estruturas conhecidas, tornando-a aplicável aos tipos de moléculas cujas estruturas são mais difíceis de determinar experimentalmente.

Seu trabalho é demonstrado em dois artigos detalhando aplicações para moléculas de RNA e complexos multiproteicos, publicados na Science em 27 de agosto de 2021 e em Proteins em dezembro de 2020, respectivamente. O artigo na Science é uma colaboração com o laboratório de Stanford de Rhiju Das , professor associado de bioquímica.

“A biologia estrutural, que é o estudo das formas das moléculas, tem esse mantra de que a estrutura determina a função”, disse Townshend, que é coautor dos dois artigos.

O algoritmo projetado pelos pesquisadores prevê estruturas moleculares precisas e, ao fazê-lo, pode permitir aos cientistas explicar como funcionam as diferentes moléculas, com aplicações que vão desde a pesquisa biológica fundamental até práticas informadas de design de drogas.

“As proteínas são máquinas moleculares que realizam todos os tipos de funções. Para executar suas funções, as proteínas geralmente se ligam a outras proteínas ”, disse Eismann, coautor dos dois artigos. “Se você sabe que um par de proteínas está implicado em uma doença e sabe como elas interagem em 3D, você pode tentar direcionar essa interação muito especificamente com uma droga.”

Eismann e Townshend são coautores do artigo da Science com o estudioso de pós-doutorado de Stanford, Andrew Watkins, do laboratório Das, e também coautores do  artigo Proteins com o ex-aluno de PhD de Stanford Nathaniel Thomas.

Projetando o algoritmo

Em vez de especificar o que torna uma previsão estrutural mais ou menos precisa, os pesquisadores permitem que o algoritmo descubra essas características moleculares por si mesmo. Eles fizeram isso porque descobriram que a técnica convencional de fornecer tal conhecimento pode influenciar um algoritmo a favor de certos recursos, impedindo-o de encontrar outros recursos informativos.

“O problema com esses recursos feitos à mão em um algoritmo é que o algoritmo se torna tendencioso em relação ao que a pessoa que escolhe esses recursos pensa ser importante, e você pode perder algumas informações que precisaria fazer melhor”, disse Eismann.

“A rede aprendeu a encontrar conceitos fundamentais que são essenciais para a formação da estrutura molecular, mas sem ser explicitamente instruída a fazê-lo”, disse Townshend. “O aspecto interessante é que o algoritmo recuperou claramente coisas que sabíamos que eram importantes, mas também recuperou características que não conhecíamos antes.”

Tendo mostrado sucesso com proteínas, os pesquisadores aplicaram seu algoritmo a outra classe de moléculas biológicas importantes, os RNAs. Eles testaram seu algoritmo em uma série de “quebra-cabeças de RNA” de uma competição de longa data em seu campo e, em todos os casos, a ferramenta superou todos os outros participantes do quebra-cabeça sem ter sido projetada especificamente para estruturas de RNA.

Aplicações mais amplas

Os pesquisadores estão entusiasmados para ver onde mais sua abordagem pode ser aplicada, já tendo obtido sucesso com complexos de proteínas e moléculas de RNA.

“A maioria dos avanços dramáticos recentes no aprendizado de máquina exigiu uma quantidade enorme de dados para o treinamento. O fato de este método ter sucesso com muito poucos dados de treinamento sugere que métodos relacionados podem resolver problemas não resolvidos em muitos campos onde os dados são escassos ”, disse Dror, que é autor sênior do artigo Proteins e, com Das, coautor sênior do Artigo científico .

Especificamente para a biologia estrutural, a equipe diz que está apenas arranhando a superfície em termos de progresso científico a ser feito.

“Depois de ter essa tecnologia fundamental, você está aumentando seu nível de compreensão em mais uma etapa e pode começar a fazer o próximo conjunto de perguntas”, disse Townshend. “Por exemplo, você pode começar a projetar novas moléculas e medicamentos com esse tipo de informação, que é uma área que entusiasma muito as pessoas”.

O pesquisador de pós-doutorado Andrew Watkins do laboratório Das e o ex-aluno de PhD de Stanford Nathaniel Thomas também são coautores dos artigos Science e Proteins, respectivamente. Outros coautores do artigo da Science incluem os alunos de Stanford PhD Ramya Rangan e Maria Karelina. Outros coautores do artigo Proteins incluem os ex-alunos de Stanford Milind Jagota e Bowen Jing. Das também é membro do Stanford Bio-X e do Wu Tsai Neurosciences Institute . Dror também é membro do Stanford Bio-X, do Institute for Computational and Mathematical Engineering (ICME) , do Wu Tsai Neurosciences Institute e do Stanford Artificial Intelligence Laboratory , um corpo docente afiliado do Instituto de Inteligência Artificial Centrada no Homem (HAI) e membro do corpo docente de Stanford ChEM-H .

A pesquisa foi financiada pela National Science Foundation, pelo Departamento de Energia dos EUA, pela Stanford Bio-X Bowes Fellowship , pelo Army Research Office, pelo Air Force Office of Scientific Research, pela Intel Corporation, pela Stanford Bio-X seed grant e pelo National Institutos de Saúde.

 

.
.

Leia mais a seguir