Claude Fable 5 chega ao público sem aquilo em que é melhor

Durante 27 anos, uma única falha permaneceu intacta dentro do OpenBSD, um dos sistemas operativos em que confiam bancos, firewalls e os servidores por detrás dos sites do quotidiano. Quem conseguisse alcançar a máquina através de uma rede podia derrubá-la, e durante quase três décadas ninguém reparou. Um modelo da Anthropic chamado Mythos reparou. Agora esse modelo tem um rosto público: a Anthropic disponibilizou o Claude Fable 5, a primeira versão do seu sistema mais capaz a que qualquer pessoa se pode inscrever para usar.

O que torna o Fable 5 digno de atenção não é uma posição num ranking. É que o modelo subjacente lê software como um auditor experiente lê um contrato, até isolar a única cláusula que faz ruir tudo. No âmbito de um programa de investigação a que a Anthropic chama Project Glasswing, a versão preliminar percorreu mais de mil projetos de código aberto, esse código livre e partilhado que move grande parte da internet, e assinalou mais de 23.000 problemas. Mais de 10.000 eram suficientemente graves para serem classificados como elevados ou críticos.

O pormenor que perturbou até os próprios investigadores da Anthropic é que ninguém ensinou o modelo a fazê-lo. A empresa sustenta que a capacidade de encontrar e explorar fragilidades nunca foi um objetivo de treino: surgiu por si só, à medida que o modelo raciocinava melhor sobre código. O FFmpeg é o exemplo mais claro. Uma falha escondia-se havia 16 anos nesse software de processamento de vídeo, o motor por detrás de inúmeras aplicações de streaming e leitores multimédia, alojada numa linha de código que as ferramentas de teste automático tinham acionado cinco milhões de vezes sem nunca dar pelo perigo. O modelo deu.

Para a maioria das pessoas, nada disto se vê. O software auditado pelo Mythos é infraestrutura invisível: o motor do navegador, o núcleo do sistema operativo, a biblioteca multimédia enterrada dentro de um telemóvel. Mas o invisível é exatamente o problema. As falhas trazidas a público tinham sobrevivido porque viviam em código demasiado antigo, demasiado aborrecido ou demasiado profundo para que alguém continuasse a relê-lo. Uma ferramenta capaz de o reler todo, sem se cansar, altera as probabilidades para quem mantém os alicerces da internet e, em mãos erradas, para quem os quisesse atacar.

Números assim só significam algo perante uma bitola. No CyberGym, um teste que mede se um modelo consegue reproduzir uma vulnerabilidade de segurança real, o motor Mythos dentro do Fable obtém 83,1 por cento, contra 66,6 por cento do anterior Claude Opus 4.6: mais ou menos a diferença entre um analista júnior competente e um especialista que raramente erra. Os ganhos não se ficam pela segurança. A empresa de analítica Hex referiu que o Fable foi o primeiro modelo a ultrapassar os 90 por cento no seu teste interno, e os primeiros utilizadores descrevem saltos semelhantes no desenvolvimento de software, na análise de dados e no desenho de interfaces.

Depois chega a reviravolta. O Fable 5 público não fará precisamente aquilo que o torna notável. A Anthropic vedou quatro áreas, cibersegurança, biologia, química e uma técnica de cópia conhecida por destilação, e quando um pedido se aproxima delas, o Fable entrega em silêncio a conversa ao modelo mais antigo e mais seguro, o Claude Opus 4.8. A empresa diz que isso acontece poucas vezes, e que os primeiros dados mostram pelo menos 95 por cento das sessões a correr inteiramente no Fable. O resultado é um produto invulgar: o modelo mais capaz que a Anthropic alguma vez lançou, impedido de propósito de usar a sua aptidão mais afiada.

Esse desenho deixa perguntas que o lançamento não resolve por completo. Uma barreira que se afasta 5 por cento das vezes continua a ser uma barreira com costuras, e a linha entre explicar como funciona um software e explicar como o quebrar raramente é limpa. A Anthropic afirma que um programa externo de recompensas por falhas correu mais de 1.000 horas sem encontrar uma via universal para contornar os limites, mas esses são números da própria empresa, sem revisão de qualquer regulador externo. Há ainda um custo que a maioria sentirá primeiro: o Fable 5 fica em 10 dólares por milhão de tokens de entrada e 50 por milhão de saída, as unidades aproximadas que um modelo cobra por ler e escrever, o dobro do Opus 4.8. E quem o usa abdica de algo mais silencioso, porque a Anthropic guarda agora 30 dias de dados de utilização mesmo para clientes que normalmente pagam para não guardar nenhum, apresentando-o como defesa contra o abuso.

Por agora, o acesso depende de como já usa o Claude. Quem programa chega ao Fable 5 de imediato através da interface de programação da Anthropic, e uma versão separada, chamada Mythos 5, foi entregue a um grupo restrito de organizações aprovadas previamente, a par de uma coligação da indústria que inclui Apple, Google, Microsoft, Nvidia e a Linux Foundation, todas a trabalhar para corrigir o que o modelo encontra antes dos atacantes. A Anthropic comprometeu 100 milhões de dólares em créditos de modelo e 4 milhões em donativos diretos aos grupos de segurança de código aberto que fazem essa reparação.

A disponibilização mais ampla segue um calendário. Os assinantes dos planos Pro, Max, Team e Enterprise por lugar da Anthropic recebem o Fable 5 sem custo adicional até 22 de junho; a partir de 23 de junho, usá-lo consome créditos. Saber se as barreiras aguentarão quando milhões de novos utilizadores as empurrarem é a parte ainda por resolver. O facto mais notável não é. Uma máquina já consegue ler o código por baixo da vida moderna e encontrar as fendas que escaparam a toda a gente durante uma geração, e a pergunta que se segue já não é se consegue, mas quem tem o direito de lho pedir.

Etiquetas: cibersegurança, Anthropic, tech-en1, modelos de IA, Project Glasswing, Claude Fable 5