Tecnologia Científica

Novas técnicas de química computacional aceleram a previsão de moléculas e materiais
Com sua arquitetura de rede neural desenvolvida recentemente, os pesquisadores do MIT podem extrair mais informações dos cálculos de estrutura eletrônica.
Por Steve Nadis - 15/01/2025


Uma abordagem de aprendizado de máquina multitarefa foi desenvolvida para prever as propriedades eletrônicas das moléculas, conforme demonstrado no fluxo de trabalho computacional ilustrado aqui. Créditos: Imagem cortesia dos pesquisadores.


Antigamente — os realmente antigos — a tarefa de projetar materiais era trabalhosa. Investigadores, ao longo de mais de 1.000 anos, tentaram fazer ouro combinando coisas como chumbo, mercúrio e enxofre, misturados no que esperavam que fossem as proporções certas. Até cientistas famosos como Tycho Brahe, Robert Boyle e Isaac Newton tentaram suas mãos no esforço infrutífero que chamamos de alquimia.

A ciência dos materiais, é claro, percorreu um longo caminho. Nos últimos 150 anos, os pesquisadores tiveram o benefício da tabela periódica de elementos para recorrer, que lhes diz que diferentes elementos têm propriedades diferentes, e um não pode magicamente se transformar em outro. Além disso, na última década, as ferramentas de aprendizado de máquina aumentaram consideravelmente nossa capacidade de determinar a estrutura e as propriedades físicas de várias moléculas e substâncias. Uma nova pesquisa de um grupo liderado por Ju Li — o professor de engenharia nuclear da Tokyo Electric Power Company no MIT e professor de ciência e engenharia de materiais — oferece a promessa de um grande salto em capacidades que podem facilitar o design de materiais. Os resultados de sua investigação são relatados em uma  edição de dezembro de 2024 da Nature Computational Science .

Atualmente, a maioria dos modelos de aprendizado de máquina usados para caracterizar sistemas moleculares são baseados na teoria funcional da densidade (DFT), que oferece uma abordagem mecânica quântica para determinar a energia total de uma molécula ou cristal observando a distribuição da densidade eletrônica — que é, basicamente, o número médio de elétrons localizados em uma unidade de volume ao redor de cada ponto dado no espaço perto da molécula. (Walter Kohn, que coinventou essa teoria há 60 anos, recebeu um Prêmio Nobel de Química por ela em 1998.) Embora o método tenha sido muito bem-sucedido, ele tem algumas desvantagens, de acordo com Li: "Primeiro, a precisão não é uniformemente grande. E, segundo, ele só diz uma coisa: a menor energia total do sistema molecular."

“Terapia de casal” para o resgate

Sua equipe agora está contando com uma técnica de química computacional diferente, também derivada da mecânica quântica, conhecida como teoria de cluster acoplado, ou CCSD(T). "Este é o padrão ouro da química quântica", comenta Li. Os resultados dos cálculos CCSD(T) são muito mais precisos do que os obtidos com cálculos DFT, e podem ser tão confiáveis quanto aqueles atualmente obtidos com experimentos. O problema é que realizar esses cálculos em um computador é muito lento, ele diz, "e a escala é ruim: se você dobrar o número de elétrons no sistema, os cálculos se tornam 100 vezes mais caros". Por esse motivo, os cálculos CCSD(T) normalmente são limitados a moléculas com um pequeno número de átomos — na ordem de cerca de 10. Qualquer coisa muito além disso levaria muito tempo.

É aí que entra o aprendizado de máquina. Os cálculos CCSD(T) são primeiro realizados em computadores convencionais, e os resultados são então usados para treinar uma rede neural com uma nova arquitetura especialmente concebida por Li e seus colegas. Após o treinamento, a rede neural pode realizar esses mesmos cálculos muito mais rápido aproveitando as técnicas de aproximação. Além disso, seu modelo de rede neural pode extrair muito mais informações sobre uma molécula do que apenas sua energia. "Em trabalhos anteriores, as pessoas usaram vários modelos diferentes para avaliar diferentes propriedades", diz Hao Tang, um aluno de doutorado do MIT em ciência e engenharia de materiais. "Aqui usamos apenas um modelo para avaliar todas essas propriedades, e é por isso que chamamos isso de abordagem 'multitarefa'."

A “Multi-task Electronic Hamiltonian network,” ou MEHnet, lança luz sobre uma série de propriedades eletrônicas, como os momentos dipolo e quadripolo, a polarizabilidade eletrônica e a lacuna de excitação óptica — a quantidade de energia necessária para levar um elétron do estado fundamental para o estado excitado mais baixo. “A lacuna de excitação afeta as propriedades ópticas dos materiais”, explica Tang, “porque determina a frequência da luz que pode ser absorvida por uma molécula”. Outra vantagem do modelo treinado em CCSD é que ele pode revelar propriedades não apenas de estados fundamentais, mas também de estados excitados. O modelo também pode prever o espectro de absorção infravermelho de uma molécula relacionado às suas propriedades vibracionais, onde as vibrações dos átomos dentro de uma molécula são acopladas umas às outras, levando a vários comportamentos coletivos.

A força da abordagem deles deve muito à arquitetura da rede. Com base no trabalho da Professora Assistente do MIT Tess Smidt , a equipe está utilizando uma chamada rede neural de grafos E(3)-equivariante, diz Tang, “na qual os nós representam átomos e as arestas que conectam os nós representam as ligações entre átomos. Também usamos algoritmos personalizados que incorporam princípios da física — relacionados a como as pessoas calculam propriedades moleculares na mecânica quântica — diretamente em nosso modelo.”

Teste, 1, 2 3

Quando testado em sua análise de moléculas de hidrocarbonetos conhecidas, o modelo de Li et al. superou os equivalentes DFT e correspondeu de perto aos resultados experimentais retirados da literatura publicada.

Qiang Zhu — um especialista em descoberta de materiais na Universidade da Carolina do Norte em Charlotte (que não fez parte deste estudo) — está impressionado com o que foi realizado até agora. “O método deles permite um treinamento eficaz com um pequeno conjunto de dados, ao mesmo tempo em que alcança precisão e eficiência computacional superiores em comparação aos modelos existentes”, diz ele. “Este é um trabalho empolgante que ilustra a poderosa sinergia entre química computacional e aprendizado profundo, oferecendo novas ideias para desenvolver métodos de estrutura eletrônica mais precisos e escaláveis.”

O grupo baseado no MIT aplicou seu modelo primeiro a elementos pequenos e não metálicos — hidrogênio, carbono, nitrogênio, oxigênio e flúor, dos quais compostos orgânicos podem ser feitos — e desde então passou a examinar elementos mais pesados: silício, fósforo, enxofre, cloro e até platina. Depois de ser treinado em moléculas pequenas, o modelo pode ser generalizado para moléculas cada vez maiores. “Anteriormente, a maioria dos cálculos se limitava a analisar centenas de átomos com DFT e apenas dezenas de átomos com cálculos CCSD(T)”, diz Li. “Agora estamos falando sobre lidar com milhares de átomos e, eventualmente, talvez dezenas de milhares.”

Por enquanto, os pesquisadores ainda estão avaliando moléculas conhecidas, mas o modelo pode ser usado para caracterizar moléculas que não foram vistas antes, bem como para prever as propriedades de materiais hipotéticos que consistem em diferentes tipos de moléculas. “A ideia é usar nossas ferramentas teóricas para escolher candidatos promissores, que satisfaçam um conjunto particular de critérios, antes de sugeri-los a um experimentalista para verificar”, diz Tang.

É tudo sobre os aplicativos

Olhando para o futuro, Zhu está otimista sobre as possíveis aplicações. “Essa abordagem tem potencial para triagem molecular de alto rendimento”, ele diz. “Essa é uma tarefa em que atingir precisão química pode ser essencial para identificar novas moléculas e materiais com propriedades desejáveis.”

Uma vez que eles demonstrem a capacidade de analisar grandes moléculas com talvez dezenas de milhares de átomos, Li diz, “nós deveríamos ser capazes de inventar novos polímeros ou materiais” que podem ser usados em design de fármacos ou em dispositivos semicondutores. O exame de elementos de metais de transição mais pesados pode levar ao advento de novos materiais para baterias — atualmente uma área de necessidade aguda.

O futuro, como Li o vê, está bem aberto. “Não se trata mais de apenas uma área”, ele diz. “Nossa ambição, em última análise, é cobrir toda a tabela periódica com precisão de nível CCSD(T), mas com menor custo computacional do que DFT. Isso deve nos permitir resolver uma ampla gama de problemas em química, biologia e ciência dos materiais. É difícil saber, no momento, quão ampla essa gama pode ser.”

Este trabalho foi apoiado pelo Honda Research Institute. Hao Tang reconhece o apoio da Mathworks Engineering Fellowship. Os cálculos neste trabalho foram realizados, em parte, no simulador atomístico universal de alta velocidade Matlantis, no Texas Advanced Computing Center, no MIT SuperCloud e no National Energy Research Scientific Computing.

 

.
.

Leia mais a seguir