MaisConhecer - Quando o ruído revela a biologia: inteligência artificial aprende não apenas o crescimento da vida, mas também suas incertezas

Quando o ruído revela a biologia: inteligência artificial aprende não apenas o crescimento da vida, mas também suas incertezas

Novo método desenvolvido na Universidade de Oxford permite que redes neurais descubram simultaneamente as leis biológicas de crescimento e os padrões ocultos de variabilidade dos dados, ampliando a capacidade de interpretar sistemas vivos complexos.

Imagem: Reprodução

Cientistas sempre trataram o ruído nos dados biológicos como um problema a ser eliminado. Flutuações em medições de populações, ecossistemas ou células eram vistas principalmente como imperfeições experimentais que obscureciam os mecanismos reais da natureza. Agora, um estudo liderado por pesquisadores da University of Oxford propõe uma mudança de paradigma: e se o ruído também contivesse informação biológica valiosa?

Publicado no repositório científico arXiv, o trabalho apresenta uma nova estrutura computacional capaz de aprender simultaneamente as leis que governam o crescimento de sistemas biológicos e a forma como a incerteza varia ao longo desse crescimento. A pesquisa foi conduzida por Rebecca M. Crossley e Ruth E. Baker, do Instituto de Matemática de Oxford.

O método, denominado NLL-BINN (Negative Log-Likelihood Biologically-Informed Neural Network), representa uma evolução das chamadas Redes Neurais Biologicamente Informadas (BINNs), uma classe de inteligência artificial desenvolvida para extrair leis mecanísticas diretamente de conjuntos de dados limitados e ruidosos.

Segundo as autoras, o objetivo foi superar uma limitação importante dos modelos atuais: a suposição de que o ruído experimental possui intensidade constante ao longo do tempo.

“A variabilidade é frequentemente tratada como um incômodo a ser minimizado, em vez de um componente potencialmente informativo da dinâmica biológica”, afirmam Crossley e Baker no artigo.

Aprendendo a dinâmica e o ruído ao mesmo tempo

A inovação central da pesquisa é permitir que a rede neural descubra, diretamente dos dados, como a magnitude dos erros e flutuações muda de acordo com o estado do sistema observado.

Em termos biológicos, isso é crucial. Populações de organismos, por exemplo, frequentemente apresentam níveis de variabilidade que aumentam à medida que crescem. Em muitos casos, sistemas maiores exibem oscilações mais intensas do que sistemas pequenos.

Para capturar esse comportamento, os pesquisadores incorporaram ao modelo uma função matemática capaz de descrever diferentes regimes de ruído: aditivo, intermediário e multiplicativo. Em vez de definir previamente qual deles está presente, a inteligência artificial aprende essa relação automaticamente durante o treinamento.

O estudo utilizou três modelos clássicos de crescimento populacional amplamente conhecidos na biologia matemática: o modelo Logístico, o modelo de Gompertz e o modelo de Richards. Embora produzam curvas de crescimento semelhantes, cada um possui mecanismos internos distintos, tornando a tarefa de identificação particularmente desafiadora.

Resultados impressionantes em testes controlados

Para avaliar o desempenho da nova abordagem, as autoras criaram conjuntos sintéticos de dados contendo 26 pontos temporais distribuídos ao longo de 100 unidades de tempo e geraram dez réplicas independentes para cada cenário experimental. Diferentes níveis e padrões de ruído foram adicionados artificialmente aos dados.

Os resultados mostraram que o NLL-BINN foi capaz de:

- Reconstruir com precisão as trajetórias reais de crescimento populacional;

- Identificar corretamente as leis matemáticas subjacentes;

- Recuperar a estrutura de ruído presente nos dados;

- Produzir estimativas confiáveis de incerteza.

Em todos os cenários testados, os parâmetros aprendidos pelo sistema permaneceram muito próximos dos valores reais utilizados na geração dos dados. A rede neural distinguiu adequadamente ruídos constantes, intermediários e dependentes da densidade populacional.

Outro resultado relevante foi a calibração estatística das previsões. Os intervalos de confiança produzidos pelo modelo apresentaram cobertura próxima dos valores teóricos esperados, indicando que as estimativas de incerteza refletem adequadamente a realidade observada.

Mais precisão do que métodos convencionais

Os pesquisadores também compararam sua abordagem com BINNs tradicionais treinadas usando erro quadrático médio (RMSE), um procedimento amplamente empregado em aprendizado de máquina.

A diferença foi significativa.

O NLL-BINN apresentou menor erro mecanístico — uma métrica que avalia quão fielmente as equações inferidas reproduzem a dinâmica biológica verdadeira — e também exibiu menor variabilidade entre diferentes execuções do treinamento.

Segundo as autoras, isso ocorre porque o novo método atribui pesos diferentes às observações dependendo do nível de ruído associado a cada uma delas.

“Os resultados mostram que a modelagem explícita da estrutura de ruído melhora tanto a precisão quanto a robustez da recuperação das dinâmicas subjacentes”, destacam.

Teste no mundo real: recifes da Grande Barreira de Coral

Além das simulações, a equipe aplicou o método a um problema ecológico real: o crescimento de corais duros em dois recifes próximos à Ilha Lady Musgrave, na Australia, região integrante da Grande Barreira de Coral.

Esses dados apresentavam um desafio adicional: não havia medições replicadas. Isso significa que o padrão de variabilidade não podia ser estimado diretamente por métodos estatísticos convencionais.

Mesmo assim, o NLL-BINN conseguiu reconstruir curvas de regeneração compatíveis com o comportamento ecológico esperado e inferir padrões de ruído dependentes da densidade populacional dos corais.

Os resultados sugeriram uma relação mais forte que a multiplicativa entre crescimento e variabilidade, com expoentes estimados próximos de 1,57 e 1,64 para os dois locais analisados.

Embora as autoras alertem que diferentes mecanismos podem produzir explicações plausíveis para os mesmos dados, o estudo demonstra que é possível extrair informações sobre incerteza mesmo quando não existem experimentos repetidos.

Uma nova visão sobre a incerteza

Talvez a contribuição mais profunda do trabalho esteja em sua perspectiva conceitual.

Tradicionalmente, a incerteza é considerada um subproduto inevitável das medições. Neste estudo, ela passa a ser tratada como uma propriedade do próprio sistema biológico.

“A abordagem reposiciona a incerteza como um componente integral da inferência mecanística”, escrevem as pesquisadoras.

Essa mudança pode ter implicações amplas para áreas que vão da ecologia à biologia celular, passando por epidemiologia, medicina personalizada e modelagem de sistemas complexos.

À medida que conjuntos de dados biológicos se tornam cada vez maiores e mais detalhados, compreender não apenas o que os organismos fazem, mas também como e por que variam, poderá ser tão importante quanto entender suas leis fundamentais de crescimento.

O trabalho de Crossley e Baker sugere que a próxima geração de inteligência artificial científica não será construída apenas para encontrar padrões. Ela também será capaz de interpretar as incertezas que acompanham esses padrões — e talvez descobrir, nelas, novas pistas sobre o funcionamento da vida.

Referência

Uma estrutura baseada em verossimilhança para aprender simultaneamente o ruído e a dinâmica de crescimento usando redes neurais bioinspiradas. Rebecca M. Crossley , Ruth E. Baker. https://doi.org/10.48550/arXiv.2606.13475