Uma IA da Google resolveu problemas de matemática abertos há 56 anos por algumas centenas de dólares

Um sistema de investigação da Google DeepMind produziu demonstrações completas e verificadas por máquina para nove problemas em aberto propostos pelo matemático Paul Erdős, dois deles por resolver há 56 anos. O mesmo sistema fechou 44 conjeturas retiradas da Enciclopédia Online de Sequências de Inteiros, resolveu uma questão de geometria algébrica aberta há 15 anos e afinou um limite conhecido em otimização convexa. A contagem vistosa importa menos do que o método. Cada uma destas demonstrações foi verificada por uma máquina, e não apenas afirmada por ela.

Erdős, falecido em 1996, deixou centenas de perguntas precisas e teimosas, muitas fáceis de enunciar e brutalmente difíceis de fechar. Ao longo de décadas tornaram-se uma espécie de exame permanente para a área. As conjeturas de sequências vêm de uma base de dados pública que os matemáticos percorrem à procura de padrões, onde uma fórmula intuída pode ficar sem prova durante anos. Não são testes de laboratório feitos para lisonjear um modelo. São o verdadeiro atraso da matemática em aberto.

Essa distinção é toda a história. O sistema, chamado AlphaProof Nexus, escreve os seus argumentos em Lean, uma linguagem formal cujo compilador rejeita qualquer passo que não consiga confirmar. Uma demonstração passa ou não passa, sem espaço para um parágrafo confiante que depois se revela errado. Para quem tenta avaliar se uma ‘descoberta’ de IA é real, esta é a fronteira entre um comunicado de imprensa e um resultado.

Por baixo, o demonstrador corre sobre o Gemini 3.1 Pro, com um modelo mais leve a tratar das tarefas de classificação. O ciclo é quase aborrecido. O modelo redige uma prova em Lean, o compilador devolve os erros e esses erros alimentam a tentativa seguinte. O que mantém a honestidade é o retorno simbólico, não a prosa fluente. A equipa construiu quatro versões de complexidade crescente, uma delas capaz de gerar e ordenar esboços de demonstração rivais. Ainda assim, a versão mais simples, um mero ciclo de modelo e compilador, resolveu sozinha os nove problemas de Erdős.

A economia é a parte silenciosamente surpreendente. Cada problema resolvido custou algumas centenas de dólares em tempo de computação. Perguntas que consumiram carreiras inteiras foram fechadas por sensivelmente o preço de uma escapadela de fim de semana. Isto não reforma o matemático. Alguém ainda tem de escolher que problemas vale a pena atacar, formulá-los de uma forma que o sistema consiga ler e decidir o que significa uma resposta. O que muda é a aritmética do que vale a pena tentar.

As ressalvas pesam mais do que o título. Nove resolvidos em 353 problemas de Erdős tentados é uma taxa de acerto de cerca de 2,5 por cento. O número das sequências, 44 em 492, fica abaixo de nove por cento. Os autores admitem sem rodeios que a maioria destes problemas continua fora de alcance, e mais ainda os que exigem teoria nova e extensa, e que os acertos se concentram onde a biblioteca matemática do Lean já é profunda. Retire-se esse andaime construído por humanos e a lista curada de alvos, e ao sistema resta pouco chão firme.

A cautela é merecida. Num episódio muito ridicularizado, um laboratório rival anunciou que o seu modelo tinha resolvido dez problemas de Erdős, até os matemáticos repararem que as respostas já constavam da literatura publicada. O modelo encontrara-as, não as demonstrara. O AlphaProof Nexus foi construído para ser imune a esse erro. Uma prova em Lean de um resultado conhecido continua válida, e uma prova em Lean de algo genuinamente novo não se pode fingir. Demis Hassabis, à frente da DeepMind, fez questão de dizer que o trabalho não é inteligência artificial geral, uma nota de prudência invulgar numa empresa raramente tímida com os seus modelos.

Há um ganho mais subtil que os investigadores sublinham. Até os fracassos foram úteis. Como cada prova parcial é verificada formalmente, os matemáticos puderam ver com exatidão que submetas o sistema conseguia e não conseguia fechar, sem reverificar o argumento inteiro à mão. A máquina deixa de ser um oráculo e passa a ser uma colaboradora incansável que mostra o próprio trabalho e aponta onde a parte difícil ainda se esconde.

O resultado não vem sozinho. Coincide com outra alegação de um modelo de raciocínio rival, que terá refutado uma conjetura de Erdős com cerca de 80 anos em geometria discreta, um achado que matemáticos no ativo refinaram e subscreveram. Dois laboratórios, dois métodos, um apoiado na verificação formal e o outro em cadeias de raciocínio em bruto, chegaram à mesma fronteira com semanas de diferença. A disputa já não é sobre chatbots que soam espertos.

O trabalho foi detalhado num artigo publicado este mês, e os métodos apoiam-se em ferramentas abertas, nomeadamente o Lean e a sua biblioteca construída pela comunidade, de modo que grupos externos podem inspecionar e voltar a correr as demonstrações em vez de confiar num blogue empresarial. A DeepMind não disse se o sistema chegará a investigadores de fora da empresa. O número a vigiar não é nove. É se esses 2,5 por cento se tornam dez, e depois vinte, porque no dia em que isso acontecer, a discussão sobre para que servem estas máquinas terá de recomeçar do zero.

Etiquetas: inteligência artificial, Google, Gemini, Paul Erdős, AlphaProof Nexus, Automated Theorem Proving