A técnica poderia resolver eficientemente equações diferenciais parciais para inúmeras aplicações
Em áreas como física e engenharia, equações diferenciais parciais (PDEs) são usadas para modelar processos físicos complexos para gerar insights sobre como funcionam alguns dos sistemas físicos e naturais mais complicados do mundo.
Domínio público
Em áreas como física e engenharia, equações diferenciais parciais (PDEs) são usadas para modelar processos físicos complexos para gerar insights sobre como funcionam alguns dos sistemas físicos e naturais mais complicados do mundo.
Para resolver essas equações difíceis, os pesquisadores usam solucionadores numéricos de alta fidelidade, que podem consumir muito tempo e ser computacionalmente caros para serem executados. A alternativa simplificada atual, modelos substitutos baseados em dados, calcula a propriedade do objetivo de uma solução para PDEs em vez de toda a solução. Eles são treinados em um conjunto de dados gerado pelo solucionador de alta fidelidade, para prever a saída dos PDEs para novas entradas. Isso exige muitos dados e é caro porque sistemas físicos complexos exigem um grande número de simulações para gerar dados suficientes.
Em um novo artigo , "Substitutos profundos aprimorados pela física para equações diferenciais parciais ", publicado em dezembro na Nature Machine Intelligence , um novo método é proposto para o desenvolvimento de modelos substitutos baseados em dados para sistemas físicos complexos em áreas como mecânica, óptica, térmica. transporte, dinâmica de fluidos, físico-química e modelos climáticos .
O artigo foi de autoria do professor de matemática aplicada do MIT, Steven G. Johnson, juntamente com Payel Das e Youssef Mroueh do MIT-IBM Watson AI Lab e IBM Research; Chris Rackauckas do Julia Lab; e Raphaël Pestourie, ex-pós-doutorado do MIT que agora está na Georgia Tech. Os autores chamam seu método de "substituto profundo aprimorado pela física" (PEDS), que combina um simulador de física explicável e de baixa fidelidade com um gerador de rede neural. O gerador de rede neural é treinado de ponta a ponta para corresponder à saída do solucionador numérico de alta fidelidade.
“Minha aspiração é substituir o processo ineficiente de tentativa e erro por simulação e otimização sistemáticas auxiliadas por computador”, diz Pestourie. "Avanços recentes em IA, como o grande modelo de linguagem do ChatGPT, dependem de centenas de bilhões de parâmetros e exigem grandes quantidades de recursos para treinar e avaliar. Em contraste, o PEDS é acessível a todos porque é incrivelmente eficiente em recursos de computação e tem um desempenho muito baixa barreira em termos de infraestrutura necessária para usá-lo."
No artigo, eles mostram que os substitutos PEDS podem ser até três vezes mais precisos do que um conjunto de redes neurais feedforward com dados limitados (aproximadamente 1.000 pontos de treinamento) e reduzir os dados de treinamento necessários em pelo menos um fator de 100 para atingir um resultado. erro alvo de 5%. Desenvolvido usando a linguagem de programação Julia projetada pelo MIT, esse método científico de aprendizado de máquina é, portanto, eficiente tanto em computação quanto em dados.
Os autores também relatam que o PEDS fornece uma estratégia geral baseada em dados para preencher a lacuna entre uma vasta gama de modelos físicos simplificados com solucionadores numéricos de força bruta correspondentes que modelam sistemas complexos. Essa técnica oferece precisão, velocidade, eficiência de dados e insights físicos sobre o processo.
Diz Pestourie: "Desde a década de 2000, à medida que as capacidades de computação melhoraram, a tendência dos modelos científicos tem sido aumentar o número de parâmetros para ajustar melhor os dados, às vezes ao custo de uma menor precisão preditiva. O PEDS faz o oposto, escolhendo seus parâmetros de forma inteligente. Ele aproveita a tecnologia de diferenciação automática para treinar uma rede neural que torna preciso um modelo com poucos parâmetros. "
“O principal desafio que impede que modelos substitutos sejam usados mais amplamente na engenharia é a maldição da dimensionalidade – o fato de que os dados necessários para treinar um modelo aumentam exponencialmente com o número de variáveis do modelo”, diz Pestourie. "O PEDS reduz essa maldição ao incorporar informações dos dados e do conhecimento de campo na forma de um solucionador de modelos de baixa fidelidade."
Os pesquisadores dizem que o PEDS tem o potencial de reviver todo um conjunto de literatura anterior a 2000 dedicada a modelos mínimos – modelos intuitivos que o PEDS poderia tornar mais precisos e, ao mesmo tempo, ser preditivos para aplicações de modelos substitutos.
“A aplicação da estrutura PEDS vai além do que mostramos neste estudo”, diz Das. "Sistemas físicos complexos governados por PDEs são onipresentes, desde modelagem climática até modelagem sísmica e muito mais. Nossos modelos substitutos rápidos e explicáveis, inspirados na física, serão de grande utilidade nessas aplicações e desempenharão um papel complementar a outras técnicas emergentes, como modelos de fundação ."
Mais informações: Raphaël Pestourie et al, Substitutos profundos aprimorados pela física para equações diferenciais parciais, Nature Machine Intelligence (2023). DOI: 10.1038/s42256-023-00761-y . PDF de acesso aberto: hdl.handle.net/1721.1/153164
Informações do periódico: Nature Machine Intelligence