O aprendizado de ma¡quina revela receita para a construção de proteanas artificiais
Quando a equipe construiu essas proteanas artificiais no laboratório, eles descobriram que realizavam químicas tão bem que rivalizavam com as encontradas na natureza.

Domanio paºblico
As proteanas são essenciais para a vida das células, realizando tarefas complexas e catalisando reações químicas. Os cientistas e engenheiros hámuito procuram aproveitar esse poder projetando proteanas artificiais que podem executar novas tarefas, como tratar doena§as, capturar carbono ou coletar energia, mas muitos dos processos projetados para criar essas proteanas são lentos e complexos, com uma alta falha. taxa.
Em uma descoberta que pode ter implicações nos setores de saúde, agricultura e energia, uma equipe liderada por pesquisadores da Escola de Engenharia Molecular (PME) da Pritzker da Universidade de Chicago desenvolveu um processo baseado em inteligaªncia artificial que usa big data para projetar novas proteanas.
Ao desenvolver modelos de aprendizado de ma¡quina que podem revisar informações sobre proteanas retiradas de bancos de dados gena´micos, os pesquisadores descobriram regras de design relativamente simples para a construção de proteanas artificiais . Quando a equipe construiu essas proteanas artificiais no laboratório, eles descobriram que realizavam químicas tão bem que rivalizavam com as encontradas na natureza.
"Todos nosnos perguntamos como um processo simples como a evolução pode levar a um material de alto desempenho como uma proteana", disse Rama Ranganathan, Joseph Regenstein, professor do Departamento de Bioquímica e Biologia Molecular, Pritzker Molecular Engineering e College. "Descobrimos que os dados do genoma contem enormes quantidades de informações sobre as regras ba¡sicas da estrutura e função das proteanas, e agora conseguimos engarrafar as regras da natureza para criar as próprias proteanas".
Os resultados foram publicados em 24 de julho na revista Science .
Usando inteligaªncia artificial para aprender regras de design
As proteanas são constituadas por centenas ou milhares de aminoa¡cidos , e essas sequaªncias de aminoa¡cidos especificam a estrutura e a função da proteana. Mas entender como construir essas sequaªncias para criar novas proteanas tem sido um desafio. Trabalhos anteriores resultaram em manãtodos que podem especificar estrutura, mas a função tem sido mais elusiva.
O que Ranganathan e seus colaboradores perceberam nos últimos 15 anos éque os bancos de dados gena´micos - que estãocrescendo exponencialmente - contem enormes quantidades de informações sobre as regras ba¡sicas da estrutura e função das proteanas. Seu grupo desenvolveu modelos matema¡ticos com base nesses dados e começou a usar manãtodos de aprendizado de ma¡quina para revelar novas informações sobre as regras ba¡sicas de design das proteanas.
Â
Para esta pesquisa, eles estudaram a familia das enzimas metaba³licas da chorismate mutase, um tipo de proteana que éimportante para a vida em muitas bactanãrias, fungos e plantas. Usando modelos de aprendizado de ma¡quina, os pesquisadores foram capazes de revelar as regras simples de design por trás dessas proteanas.
O modelo mostra que apenas a conservação nas posições dos aminoa¡cidos e as correlações na evolução dos pares de aminoa¡cidos são suficientes para prever novas sequaªncias artificiais que teriam as propriedades da familia das proteanas.
"Geralmente assumimos que, para construir algo, vocêprecisa primeiro entender profundamente como ele funciona", disse Ranganathan. "Mas se vocêtiver exemplos de dados suficientes, podera¡ usar manãtodos de aprendizado profundo para aprender as regras do design, mesmo que esteja entendendo como ele funciona ou por que foi construado dessa maneira".
Ele e seus colaboradores criaram genes sintanãticos para codificar as proteanas, clonaram-nas em bactanãrias e observaram enquanto as bactanãrias produziam as proteanas sintanãticas usando sua maquinaria celular normal. Eles descobriram que as proteanas artificiais tinham a mesma função catalatica que as proteanas naturais da mutase corismato.
Uma plataforma para entender outros sistemas complexos
Como as regras de design são relativamente simples, o número de proteanas artificiais que os pesquisadores poderiam criar com elas éextremamente grande.
"As restrições são muito menores do que imagina¡vamos que seriam", disse Ranganathan. "Ha¡ uma simplicidade nas regras de design da natureza, e acreditamos que abordagens semelhantes podem nos ajudar a procurar modelos para o design em outros sistemas complexos da biologia, como ecossistemas ou o cérebro".
Embora a inteligaªncia artificial tenha revelado as regras de design, Ranganathan e seus colaboradores ainda não entendem completamente por que os modelos funcionam. Em seguida, eles trabalhara£o para entender como os modelos chegaram a essa conclusão. "Ha¡ muito mais trabalho a ser feito", disse ele.
Enquanto isso, eles também esperam usar essa plataforma para desenvolver proteanas que possam resolver problemas sociais prementes, como asmudanças climáticas. Ranganathan e Assoc. Andrew Ferguson criou uma empresa chamada Evozyne que comercializara¡ essa tecnologia com aplicações em energia, meio ambiente, cata¡lise e agricultura. Ranganathan trabalhou com o Centro Polsky de Empreendedorismo e Inovação da UChicago para registrar patentes e licenciar o IP para a empresa.
"Esse sistema nos fornece uma plataforma para projetar racionalmente moléculas de proteana de uma maneira que sempre sonhamos que poderaamos", disse ele. "Nãosão pode nos ensinar a física de como as proteanas funcionam e como elas evoluem, mas também pode nos ajudar a encontrar soluções para questões como captura de carbono e captação de energia. Ainda mais geralmente, os estudos em proteanas podem aténos ajudar a ensinar como o profundo neural redes por trás do aprendizado de ma¡quina moderno realmente funcionam ".