Tecnologia

LongCat 2.0, o modelo de IA chinês que superou o GPT-5.5 sem chips Nvidia

Susan Hill

O LongCat 2.0 tem 1,6 biliões de parâmetros, processa uma janela de contexto de um milhão de tokens e acaba de superar o GPT-5.5 da OpenAI no principal benchmark para engenharia de software real. Foi construído pela Meituan — uma empresa que a maioria das pessoas fora da China conhece, quando muito, como uma aplicação de entrega de comida.

O modelo obteve 59,5 no SWE-bench Pro contra 58,6 do GPT-5.5. A margem pode parecer pequena, mas o contexto é o que torna o feito notável: a Meituan treinou o LongCat 2.0 em mais de 50.000 aceleradores de IA de fabrico chinês, sem hardware da Nvidia, que a China não pode importar em quantidade desde 2022. O fabricante não foi confirmado oficialmente, mas a comunidade técnica aponta para o Huawei Ascend 910B. Se for esse o caso, seria a primeira vez que um modelo treinado em chips Huawei atinge desempenho de fronteira em benchmarks públicos verificáveis.

O LongCat 2.0 utiliza uma arquitectura Mixture-of-Experts: apenas entre 33 mil milhões e 56 mil milhões de parâmetros são activados por consulta, o que mantém a inferência rápida sem exigir hardware de topo. A janela de contexto de um milhão de tokens permite ler uma base de código completa numa única sessão. No SWE-bench Multilingual obteve 77,3; no Terminal-Bench, que avalia a navegação num ambiente Unix real, atingiu 70,8.

Antes do anúncio oficial, o modelo correu discretamente na OpenRouter com o nome “Owl Alpha” durante cerca de dois meses. Os programadores que o utilizaram notaram as suas capacidades invulgares em codificação sem saber a sua origem. A Meituan confirmou após o lançamento que o Owl Alpha era o LongCat 2.0 em fase de avaliação.

A licença MIT não conta tudo. Apesar de ser uma das mais abertas e permissivas disponíveis, os pesos do modelo ainda não foram publicados. Tanto o repositório no GitHub como a ficha no Hugging Face indicam “em breve”. De momento, o acesso ao LongCat 2.0 faz-se apenas por API alojada — não é possível fazer download, ajuste fino ou execução local.

A Meituan processa mais de 50 milhões de encomendas alimentares por dia e já tinha desenvolvido internamente um modelo de linguagem chamado Zhichi. O LongCat 2.0 é o seu primeiro modelo público e, pelo desempenho nos benchmarks, um dos sistemas de codificação mais capazes disponíveis sob licença aberta.

Quando os pesos chegarem, o LongCat 2.0 entrará em comparação directa com o Llama 4.1 da Meta e o DeepSeek-V4 Pro. A questão sobre quais chips domésticos tornaram isto possível terá consequências muito além da comunidade de IA.

Etiquetas: , , , , ,

Discussão

Existem 0 comentários.