Tecnologia

Claude Fable 5 regressa após 18 dias: Anthropic bloqueou a falha, não o modelo

Adrian Kessler

Claude Fable 5, o modelo de inteligência artificial mais poderoso publicado pela Anthropic, está novamente disponível em todo o mundo. O regresso ocorre após dezoito dias de suspensão total, iniciada quando o governo americano impôs controlos de exportação que obrigavam a Anthropic a verificar em tempo real a nacionalidade dos seus utilizadores. Sem conseguir cumprir esse requisito à escala global da Claude, a empresa optou por suspender completamente o acesso em vez de cumprir parcialmente.

A técnica que desencadeou os controlos foi um método de jailbreak descoberto por investigadores da Amazon. O método usava Fable 5 para mapear vulnerabilidades de software de formas que as restrições de exportação americanas proíbem para determinados cidadãos estrangeiros. A investigação interna revelou algo que complica a lógica regulatória: as mesmas categorias de vulnerabilidades podiam ser identificadas com modelos muito menos capazes — incluindo Opus 4.8, GPT-5.5 e Kimi K2.7. A capacidade em causa não era exclusiva do Fable 5.

A solução que desbloqueou os controlos

O que mudou é um novo classificador de segurança treinado especificamente para bloquear a técnica documentada pela Amazon. A Anthropic indica que o classificador identifica o método divulgado em mais de 99 por cento dos casos. Não é uma garantia de proteção total contra futuros jailbreaks — é uma correção direcionada para uma vulnerabilidade conhecida. O classificador atua ao nível da entrada, redirecionando os pedidos que correspondem aos padrões documentados antes de atingirem o modelo.

A implicação mais ampla é relevante para a forma como a regulação da IA vai evoluir. Os controlos de exportação foram aplicados ao Fable 5 não porque o modelo fosse o único capaz de causar o dano, mas porque uma técnica conhecida o explorava. Foram levantados não porque o quadro regulatório resolvesse essa questão, mas porque um classificador fechou a lacuna documentada. A Anthropic trabalha com Amazon, Microsoft e Google num framework partilhado para avaliar a gravidade dos jailbreaks de IA, com base em quatro critérios: ganho de capacidade, amplitude desse ganho, facilidade de weaponização e capacidade de descoberta. Esse framework ainda não existe como norma pública.

O que o modelo faz e quanto custa

O modelo em si não mudou. Fable 5 está concebido para raciocínio exigente de longo alcance e trabalho agêntico — tarefas que requerem planeamento, execução e correção de curso em sequências extensas sem aprovação humana em cada passo. A janela de contexto é de um milhão de tokens, que é também o valor predefinido. A produção máxima por resposta é de 128 000 tokens. O raciocínio está sempre ativo e é devolvido como resumo legível em vez de cadeia de pensamento bruta.

O acesso está sujeito a condições que não existiam antes da suspensão. Fable 5 exige agora retenção de dados de 30 dias — não está disponível ao abrigo de acordos de retenção zero. Isso afeta organizações de saúde, jurídicas e governamentais onde os acordos de retenção zero são frequentemente o requisito de base para a adoção de ferramentas de IA. O preço situa-se acima do nível Opus: dez dólares por milhão de tokens de entrada, cinquenta por milhão de saída. Pedidos que ativem os classificadores de segurança podem ser atendidos por um modelo alternativo em vez de recusados, e a visibilidade dessa substituição para o utilizador final depende da configuração de cada operador.

Disponibilidade

Fable 5 tem um modelo irmão, Claude Mythos 5, com as mesmas capacidades de base e o mesmo preço, mas com funções ofensivas de cibersegurança que Fable 5 não possui. Mythos 5 está disponível através do Project Glasswing. O acesso a Mythos 5 foi reposto para certas organizações americanas uma semana antes do regresso global do Fable 5.

Fable 5 está disponível agora na plataforma Claude, Claude.ai, Claude Code e Claude Cowork. Para os planos Pro, Max, Team e alguns Enterprise, o modelo está incluído até 50 por cento dos limites de utilização semanais até 7 de julho, data a partir da qual transita para preços por créditos. O acesso através de AWS, Google Cloud e Microsoft Foundry está a ser reposto de forma faseada. O framework que vai determinar a resposta à próxima técnica de bypass ainda está em construção.

Etiquetas: , , , , ,

Discussão

Existem 0 comentários.