Um jogo de xadrez exige que seus jogadores pensem vários movimentos à frente, uma habilidade que os programas de computador dominaram ao longo dos anos. Em 1996, um supercomputador da IBM derrotou o então campeão mundial de xadrez Garry Kasparov.

Esta arte gerada por IA representa um jogo de xadrez que exigiria milhares ou milhões de movimentos para vencer, semelhante ao número de etapas necessárias para resolver alguns problemas matemáticos difíceis. Crédito: Sergei Gukov (Este gráfico inclui arte gerada por IA)
Um jogo de xadrez exige que seus jogadores pensem vários movimentos à frente, uma habilidade que os programas de computador dominaram ao longo dos anos. Em 1996, um supercomputador da IBM derrotou o então campeão mundial de xadrez Garry Kasparov. Mais tarde, em 2017, um programa de inteligência artificial (IA) desenvolvido pelo Google DeepMind, chamado AlphaZero, triunfou sobre os melhores mecanismos de xadrez computadorizados da época após treinar-se para jogar o jogo em questão de horas.
Mais recentemente, alguns matemáticos começaram a perseguir ativamente a questão de se programas de IA também podem ajudar a resolver alguns dos problemas matemáticos mais difíceis do mundo. Mas, enquanto um jogo médio de xadrez dura cerca de 30 a 40 movimentos, esses problemas matemáticos de nível de pesquisa exigem soluções que levam um milhão ou mais de passos, ou movimentos.
Em um artigo de pré-impressão , uma equipe liderada por Sergei Gukov , do Caltech , o Professor John D. MacArthur de Física Teórica e Matemática, descreve o desenvolvimento de um novo tipo de algoritmo de aprendizado de máquina que pode resolver problemas matemáticos que exigem sequências extremamente longas de etapas. Eles usaram seu novo algoritmo para resolver famílias de problemas relacionados a um problema matemático abrangente de décadas chamado conjectura de Andrews–Curtis. Em essência, o algoritmo pode pensar mais à frente do que até mesmo programas avançados como o AlphaZero.
"Nosso programa visa encontrar longas sequências de passos que são raros e difíceis de encontrar", diz o primeiro autor do estudo, Ali Shehper, um acadêmico de pós-doutorado na Rutgers University que em breve se juntará ao Caltech como cientista pesquisador. "É como tentar encontrar seu caminho através de um labirinto do tamanho da Terra. Esses são caminhos muito longos que você tem que testar, e há apenas um caminho que funciona."
O uso de IA para resolver problemas de matemática tem se tornado cada vez mais popular. O AlphaProof do Google DeepMind teve desempenho de medalhista de prata na Olimpíada Internacional de Matemática de 2024, uma competição de matemática de nível colegial. E o programa o3 da OpenAI recentemente raciocinou seu caminho por meio de problemas de referência em matemática, ciências e programação de computadores.
Os matemáticos liderados pelo Caltech não estão se concentrando em problemas de rotina, mas sim nos mais difíceis em seu campo. No novo estudo, eles usaram IA para resolver duas famílias de problemas dentro da conjectura de Andrews–Curtis, um problema de teoria de grupos proposto pela primeira vez há 60 anos.
Embora não tenham resolvido a conjectura principal em si, eles refutaram famílias de problemas, chamadas de potenciais contraexemplos, que permaneceram abertas por aproximadamente 25 anos; eles também fizeram progressos significativos em outra família de contraexemplos que está aberta há 44 anos. Contraexemplos são basicamente casos matemáticos que refutariam uma conjectura original. Se os próprios contraexemplos forem refutados, então a conjectura original ainda pode ser verdadeira.
"Descartar alguns dos contraexemplos nos dá confiança na validade da conjectura original e ajuda a construir nossa intuição sobre o problema principal. Isso nos dá novas maneiras de pensar sobre isso", diz Shehper.
Gukov diz que navegar por esses problemas matemáticos é como "ir de A a B" por rotas complicadas que exigem milhares, milhões ou até bilhões de passos. Ele compara os problemas a resolver um cubo mágico incrivelmente complexo.
"Você consegue pegar esse cubo mágico embaralhado e complicado e fazê-lo voltar ao seu estado original? Você tem que testar essas sequências muito longas de movimentos, e você não saberá se está no caminho certo até o final", diz Gukov, que também é o diretor do novo Richard N. Merkin Center for Pure and Applied Mathematics do Caltech .
O programa de IA da equipe aprendeu a criar longas sequências de movimentos — o que os pesquisadores chamaram de "super movimentos" — que são inesperados, ou o que os pesquisadores chamam de outliers. Isso contrasta com a forma como programas de IA como o ChatGPT operam.
"Se você pedir ao ChatGPT para escrever uma carta, ele vai inventar algo típico. É improvável que ele invente algo único e altamente original. É um bom papagaio", diz Gukov. "Nosso programa é bom em inventar outliers."
Para treinar seu programa de IA, os pesquisadores usaram um modelo de aprendizado de máquina conhecido como aprendizado por reforço. Primeiro, a equipe mostrou à IA problemas fáceis de resolver e, então, progressivamente, deu a ela problemas cada vez mais difíceis. "Ela tenta vários movimentos e é recompensada por resolver os problemas", explica Shehper. "Nós encorajamos o programa a fazer mais do mesmo, mantendo ainda algum nível de curiosidade. No final, ele desenvolve novas estratégias que são melhores do que as que os humanos podem fazer. Essa é a mágica do aprendizado por reforço."
Atualmente, os programas de IA normalmente não são muito bons em prever eventos raros e remotos que têm consequências dramáticas, como quedas no mercado financeiro. O novo algoritmo da equipe também não consegue fazer previsões como essa, mas pode conter as sementes do que seria necessário para fazer previsões inteligentes dessa natureza. "Basicamente, nosso programa sabe como aprender a aprender", diz Gukov. "É pensar fora da caixa."
O novo algoritmo da equipe já causou um grande impacto na comunidade matemática. "Fizemos muitas melhorias em uma área da matemática que tinha décadas", diz Gukov. "O progresso tinha sido relativamente lento, mas agora está agitado e agitado." Na verdade, três novos matemáticos se juntaram à equipe — Lucas Fagan e Zhenghan Wang da UC Santa Barbara e Yang Qiu da Universidade Nankai em Tianjin, China — e o grupo publicou outro artigo de pré-impressão que relata a resolução de ainda mais famílias de potenciais contrafactuais pertencentes à conjectura de Andrews-Curtis.
Em vez de escalar os modelos de IA, a abordagem da equipe tem sido encontrar novos truques e estratégias inteligentes que não exijam grandes quantidades de poder de computação. "Tentamos demonstrar um bom desempenho em computadores de pequena escala, facilmente acessíveis a uma pequena colaboração acadêmica, para que qualquer um dos nossos colegas ao redor do mundo possa reproduzir facilmente esses resultados."
Este projeto foi possível graças ao apoio de doadores privados. As doações também ajudaram a estabelecer um novo grupo de matemática e IA no Caltech focado no desenvolvimento de sistemas de IA que podem lidar com problemas matemáticos difíceis de nível de pesquisa.
Outros autores do primeiro estudo de pré-impressão intitulado "O que torna os problemas de matemática difíceis para o aprendizado por reforço: um estudo de caso " são Anibal M. Medina-Mardones da Western University no Canadá, Bart?omie Lewandowski e Piotr Kucharski da Universidade de Varsóvia na Polônia, e Angus Gruen (PhD '23) da Polygon Zero.