Tecnologia Científica

O algoritmo de aprendizado de ma¡quina de Stanford prevaª estruturas biológicas com mais precisão do que nunca
Os pesquisadores de Stanford desenvolvem manãtodos de aprendizado de ma¡quina que prevaªem com precisão as formas 3D de alvos de drogas e outras moléculas biológicas importantes, mesmo quando apenas dados limitados estãodispona­veis.
Por Isabel Swafford - 27/08/2021

Determinar as formas 3D das moléculas biológicas éum dos problemas mais difa­ceis na biologia moderna e na descoberta médica. As empresas e instituições de pesquisa costumam gastar milhões de da³lares para determinar uma estrutura molecular - e mesmo esses esforços massivos são frequentemente malsucedidos.

Um novo algoritmo de inteligaªncia artificial pode escolher a forma 3D de uma
molanãcula de RNA a partir de formas incorretas. A previsão computacional
das estruturas nas quais os RNAs se dobram éparticularmente importante - e
particularmente difa­cil - porque tão poucas estruturas são conhecidas.
(Crédito da imagem: Camille LL Townshend)

Usando novas técnicas de aprendizado de ma¡quina inteligentes, os alunos de PhD da Universidade de Stanford Stephan Eismann e Raphael Townshend, sob a orientação de Ron Dror , professor associado de ciência da computação, desenvolveram uma abordagem que supera esse problema ao prever estruturas precisas computacionalmente.

Mais notavelmente, sua abordagem ébem-sucedida mesmo ao aprender com apenas algumas estruturas conhecidas, tornando-a aplica¡vel aos tipos de moléculas cujas estruturas são mais difa­ceis de determinar experimentalmente.

Seu trabalho édemonstrado em dois artigos detalhando aplicações para moléculas de RNA e complexos multiproteicos, publicados na Science em 27 de agosto de 2021 e em Proteins em dezembro de 2020, respectivamente. O artigo na Science éuma colaboração com o laboratório de Stanford de Rhiju Das , professor associado de bioquímica.

“A biologia estrutural, que éo estudo das formas das molanãculas, tem esse mantra de que a estrutura determina a função”, disse Townshend, que écoautor dos dois artigos.

O algoritmo projetado pelos pesquisadores prevaª estruturas moleculares precisas e, ao fazaª-lo, pode permitir aos cientistas explicar como funcionam as diferentes molanãculas, com aplicações que va£o desde a pesquisa biológica fundamental até prática s informadas de design de drogas.

“As protea­nas são ma¡quinas moleculares que realizam todos os tipos de funções. Para executar suas funções, as protea­nas geralmente se ligam a outras protea­nas ”, disse Eismann, coautor dos dois artigos. “Se vocêsabe que um par de protea­nas estãoimplicado em uma doença e sabe como elas interagem em 3D, vocêpode tentar direcionar essa interação muito especificamente com uma droga.”

Eismann e Townshend são coautores do artigo da Science com o estudioso de pa³s-doutorado de Stanford, Andrew Watkins, do laboratório Das, e também coautores do  artigo Proteins com o ex-aluno de PhD de Stanford Nathaniel Thomas.

Projetando o algoritmo

Em vez de especificar o que torna uma previsão estrutural mais ou menos precisa, os pesquisadores permitem que o algoritmo descubra essas caracteri­sticas moleculares por si mesmo. Eles fizeram isso porque descobriram que a técnica convencional de fornecer tal conhecimento pode influenciar um algoritmo a favor de certos recursos, impedindo-o de encontrar outros recursos informativos.

“O problema com esses recursos feitos a  ma£o em um algoritmo éque o algoritmo se torna tendencioso em relação ao que a pessoa que escolhe esses recursos pensa ser importante, e vocêpode perder algumas informações que precisaria fazer melhor”, disse Eismann.

“A rede aprendeu a encontrar conceitos fundamentais que são essenciais para a formação da estrutura molecular, mas sem ser explicitamente instrua­da a fazaª-lo”, disse Townshend. “O aspecto interessante éque o algoritmo recuperou claramente coisas que saba­amos que eram importantes, mas também recuperou caracteri­sticas que não conheca­amos antes.”

Tendo mostrado sucesso com protea­nas, os pesquisadores aplicaram seu algoritmo a outra classe de moléculas biológicas importantes, os RNAs. Eles testaram seu algoritmo em uma sanãrie de “quebra-cabea§as de RNA” de uma competição de longa data em seu campo e, em todos os casos, a ferramenta superou todos os outros participantes do quebra-cabea§a sem ter sido projetada especificamente para estruturas de RNA.

Aplicações mais amplas

Os pesquisadores estãoentusiasmados para ver onde mais sua abordagem pode ser aplicada, já tendo obtido sucesso com complexos de protea­nas e moléculas de RNA.

“A maioria dos avanços drama¡ticos recentes no aprendizado de ma¡quina exigiu uma quantidade enorme de dados para o treinamento. O fato de este manãtodo ter sucesso com muito poucos dados de treinamento sugere que manãtodos relacionados podem resolver problemas não resolvidos em muitos campos onde os dados são escassos ”, disse Dror, que éautor saªnior do artigo Proteins e, com Das, coautor saªnior do Artigo cienta­fico .

Especificamente para a biologia estrutural, a equipe diz que estãoapenas arranhando asuperfÍcie em termos de progresso cienta­fico a ser feito.

“Depois de ter essa tecnologia fundamental, vocêestãoaumentando seunívelde compreensão em mais uma etapa e pode comea§ar a fazer o pra³ximo conjunto de perguntas”, disse Townshend. “Por exemplo, vocêpode comea§ar a projetar novas moléculas e medicamentos com esse tipo de informação, que éuma área que entusiasma muito as pessoas”.

O pesquisador de pa³s-doutorado Andrew Watkins do laboratório Das e o ex-aluno de PhD de Stanford Nathaniel Thomas também são coautores dos artigos Science e Proteins, respectivamente. Outros coautores do artigo da Science incluem os alunos de Stanford PhD Ramya Rangan e Maria Karelina. Outros coautores do artigo Proteins incluem os ex-alunos de Stanford Milind Jagota e Bowen Jing. Das também émembro do Stanford Bio-X e do Wu Tsai Neurosciences Institute . Dror também émembro do Stanford Bio-X, do Institute for Computational and Mathematical Engineering (ICME) , do Wu Tsai Neurosciences Institute e do Stanford Artificial Intelligence Laboratory , um corpo docente afiliado do Instituto de Inteligaªncia Artificial Centrada no Homem (HAI) e membro do corpo docente de Stanford ChEM-H .

A pesquisa foi financiada pela National Science Foundation, pelo Departamento de Energia dos EUA, pela Stanford Bio-X Bowes Fellowship , pelo Army Research Office, pelo Air Force Office of Scientific Research, pela Intel Corporation, pela Stanford Bio-X seed grant e pelo National Institutos de Saúde.

 

.
.

Leia mais a seguir