Lar >  Notícias >  Deepseek: AI Revolution a um custo premium

Deepseek: AI Revolution a um custo premium

by Elijah Feb 19,2025

O modelo de IA surpreendentemente barato de Deepseek desafia os gigantes da indústria. A startup chinesa afirma ter treinado sua poderosa rede neural Deepseek V3 por meros US $ 6 milhões, utilizando apenas 2048 GPUs, subcotando significativamente os concorrentes. Esse custo aparentemente baixo, no entanto, esconde um investimento muito mais substancial.

DeepSeek Testimagem: ensigame.com

A arquitetura inovadora da DeepSeek V3 contribui para sua eficiência. As principais tecnologias incluem previsão de vários toques (MTP), que prevê várias palavras simultaneamente; Mistura de especialistas (MOE), empregando 256 redes neurais para treinamento acelerado; e atenção latente de várias cabeças (MLA), concentrando-se nos elementos cruciais da frase para melhorar a precisão.

DeepSeek V3imagem: ensigame.com

No entanto, um relatório de semiânica revela uma infraestrutura muito maior: aproximadamente 50.000 GPUs da NVIDIA, avaliadas em aproximadamente US $ 1,6 bilhão, com custos operacionais quase 944 milhões. Isso contradiz a reivindicação de custo inicial da DeepSeek, que é responsável apenas pelo uso de GPU pré-treinamento, omitir pesquisas, refinamento, processamento de dados e despesas gerais de infraestrutura.

A independência e a estrutura enxuta da Deepseek, uma subsidiária do High-Flyer Hedge Fund, permitem inovação rápida e alocação de recursos eficientes. Ao contrário dos concorrentes dependentes de serviços em nuvem, a Deepseek possui seus data centers, maximizando o controle e a velocidade. Sua natureza autofinanciada aumenta ainda mais a agilidade. Altos salários, excedendo US $ 1,3 milhão anualmente para alguns pesquisadores, atraem os melhores talentos das universidades chinesas.

DeepSeekimagem: ensigame.com

Embora o número de custos de treinamento de US $ 6 milhões da Deepseek seja enganoso, o investimento geral da empresa excede US $ 500 milhões. Seu sucesso decorre de investimentos substanciais, avanços tecnológicos e uma força de trabalho qualificada, não apenas da eficiência orçamentária. Apesar disso, seus custos permanecem significativamente menores que os concorrentes; O modelo R1 da Deepseek custou US $ 5 milhões em comparação com os US $ 100 milhões da ChatGPT4.

DeepSeekimagem: ensigame.com

O exemplo da Deepseek mostra uma empresa de IA independente bem-sucedida e bem financiada competindo efetivamente com os players estabelecidos. No entanto, a narrativa da relação custo-benefício revolucionário requer uma compreensão mais sutil de sua verdadeira escala de investimento.