Startup chinesa DeepSeek pode ter gastado US$ 1,6 Bilhão em IA, não apenas US$ 5,5 Milhões como informado
Por Sandro Felix
Publicado em 03/02/25 às 16:14
A DeepSeek, uma startup chinesa emergente no setor de inteligência artificial, causou um verdadeiro terremoto na indústria ao anunciar seu modelo R1, supostamente treinado com apenas 2.048 GPUs Nvidia H800 e um orçamento de US$ 5,576 milhões. A notícia chocou o mercado e levou a uma queda histórica de US$ 600 bilhões no valor das ações da Nvidia, levantando questionamentos sobre o real custo da criação de modelos avançados de IA. No entanto, novas informações sugerem que a realidade pode ser bem diferente do que foi inicialmente divulgado.
De acordo com um relatório da empresa de inteligência de mercado SemiAnalysis, a DeepSeek não apenas gastou significativamente mais do que os US$ 5,5 milhões relatados, como também possui acesso a uma impressionante infraestrutura de hardware, composta por cerca de 50.000 GPUs Hopper. Entre esses equipamentos, estão 10.000 unidades da Nvidia H800 e outras 10.000 H100, além de pedidos adicionais da versão H20, desenvolvida especificamente para o mercado chinês. O relatório aponta que essas GPUs são compartilhadas entre a DeepSeek e a High-Flyer, um fundo de hedge quantitativo que está por trás da startup, sendo utilizadas para operações de trading, inferência, treinamento e pesquisa.
O verdadeiro custo do desenvolvimento do modelo R1 seria muito maior do que o alegado pela DeepSeek. Enquanto a cifra de US$ 5,5 milhões se referia apenas a uma pequena fração dos custos de pré-treinamento, os investimentos totais da empresa em servidores teriam ultrapassado US$ 1,6 bilhão. Desses, cerca de US$ 944 milhões foram destinados a despesas operacionais, enquanto mais de US$ 500 milhões foram investidos especificamente em GPUs. Em comparação, o treinamento do modelo Claude 3.5 Sonnet, da Anthropic, exigiu dezenas de milhões de dólares, mas a empresa precisou levantar bilhões em investimentos de gigantes como Google e Amazon para sustentar suas operações.
Outro fator que diferencia a DeepSeek de outras empresas chinesas de IA é sua estratégia de recrutamento. Ao contrário de companhias como a Huawei, que buscam talentos internacionais, a DeepSeek concentra sua força de trabalho exclusivamente na China. Para atrair os melhores profissionais, a empresa estaria oferecendo salários de mais de US$ 1,3 milhão por ano, valores bem acima da média do setor no país.
Além disso, a DeepSeek também se destaca pela autonomia em infraestrutura. Diferente de muitas startups que dependem de provedores de nuvem externos, a empresa opera majoritariamente seus próprios datacenters. Esse controle permite maior liberdade para experimentação e inovação em toda a sua linha de produtos de IA, o que, segundo a SemiAnalysis, faz da DeepSeek o laboratório de “pesos abertos” mais avançado do momento, superando iniciativas como Llama, da Meta, e Mistral.
A revelação de que a DeepSeek teria investido bilhões em infraestrutura de IA e não apenas os poucos milhões inicialmente divulgados levanta dúvidas sobre a transparência da empresa e os impactos no setor. Se, por um lado, seu rápido crescimento ameaça o domínio das gigantes ocidentais, por outro, seu modelo de negócios e fontes de financiamento ainda são um mistério. O mercado segue atento às próximas movimentações da startup, que pode redefinir o futuro da inteligência artificial global.