A DeepSeek tornou a IA barata, e a bolha americana apostava no contrário

A DeepSeek, um laboratório chinês saído de um fundo de investimento quantitativo, insiste em fazer aquilo que a indústria americana de IA dava como impossível. Constrói modelos que rendem perto da fronteira tecnológica, treina-os por uma fração do que gastam os rivais nos Estados Unidos e depois publica os pesos para qualquer pessoa descarregar e executar. Cada lançamento reabre o mesmo debate: a avaliação de todo o setor americano de IA assenta numa premissa que a DeepSeek vai desmontando, a de que a inteligência tem de continuar cara.

Essa premissa não é abstrata. Sustenta centenas de milhares de milhões de dólares em centros de dados em construção, a cotação dos fabricantes de chips e dos fornecedores de nuvem presentes em quase todos os fundos de índice, e a subscrição mensal que muitos leitores já pagam por um chatbot. Se um concorrente entrega resultados comparáveis por muito menos e oferece o software, o prémio associado a uma capacidade de cálculo escassa e dispendiosa parece menos um fosso de proteção e mais uma aposta.

A alegação da DeepSeek é de eficiência, não de magia. Os seus engenheiros apostaram numa arquitetura de mistura de especialistas que ativa apenas uma parte do modelo em cada pedido, no uso intensivo de cálculos de menor precisão e em treinos afinados para correr com menos chips e, em parte, com chips sujeitos às restrições à exportação. O número mais repetido para um dos seus treinos principais ficou abaixo dos seis milhões de dólares. Os treinos americanos equivalentes custam muitas vezes esse valor quando se soma a conta completa.

Conta tanto a forma como o modelo é publicado como o que custou. A DeepSeek disponibiliza pesos abertos, pelo que quem programa em São Paulo, um laboratório universitário em Varsóvia ou uma start-up em Seul podem descarregar o modelo e corrê-lo nas próprias máquinas, sem pagar a um fornecedor americano por cada pedido e sem enviar os seus dados para o estrangeiro. Há uma ironia nisto: os controlos à exportação pensados para travar a IA chinesa cortando-lhe os chips mais potentes parecem ter empurrado a DeepSeek a tirar mais de menos, e esses métodos económicos viajam agora para todo o lado para onde vão os pesos abertos.

Para quem apenas usa estas ferramentas, o efeito imediato é poder escolher. Modelos mais baratos pressionam em baixa os preços das subscrições, levam assistentes mais capazes a computadores e telemóveis comuns e enfraquecem o argumento para ficar preso a um único fornecedor. O que parecia um serviço alugado começa a parecer software que se pode possuir.

O discurso da bolha exige grandes reservas. Esse número abaixo dos seis milhões de dólares cobre um único treino final, não a investigação, os becos sem saída, os salários nem o hardware que o tornaram possível, pelo que compará-lo com a despesa total de um laboratório americano é comparar coisas diferentes. Pesos abertos também não são código aberto; os dados de treino e o método completo continuam privados. E o argumento da eficiência corta para os dois lados. Questionada sobre a DeepSeek, a direção da Microsoft recorreu ao paradoxo de Jevons, a velha observação de que, quando um recurso fica mais barato de usar, o consumo total tende a subir em vez de descer. Inteligência mais barata pode significar apenas que o mundo compra muito mais dela, o que seria boa notícia para quem vende capacidade de cálculo, não má.

Também não é a primeira vez que se declara a bolha morta. Esse mesmo laboratório já provocou a maior perda de valor bolsista num único dia da história dos Estados Unidos, apagou cerca de seiscentos mil milhões de dólares de um fabricante de chips numa tarde e depois viu a ação recuperar quase tudo em semanas. As grandes empresas americanas de IA não responderam gastando menos. Angariaram mais e construíram maior. Qualquer afirmação de que a bolha finalmente rebentou tem de sobreviver ao facto de que quem tem mais dinheiro em jogo continua a redobrar a aposta.

O que a DeepSeek fez na verdade é mais difícil de dramatizar do que uma bolha que rebenta. Retirou o conforto de supor que os principais laboratórios americanos estão protegidos por um muro de capital que mais ninguém consegue escalar. Se uma capacidade de fronteira pode ser aproximada barata e distribuída de graça, o valor deixa de estar em possuir o modelo. Desloca-se para a distribuição, para os produtos construídos à volta do modelo e para quem controla o cliente. O próximo teste já está no calendário, mesmo sem data marcada: cada novo lançamento da DeepSeek reabre a mesma pergunta e cai num mercado que se comprometeu a gastar mais, não menos, convencido de que a escala ainda vence. Vai resolver-se nas contas trimestrais e nas previsões de investimento dos próximos meses, não num tópico de fórum que já dá a luta por terminada.

Etiquetas: inteligência artificial, nvidia, microsoft, DeepSeek, AI bubble, open-weight AI