by Elijah Feb 19,2025
O modelo de IA surpreendentemente barato de Deepseek desafia os gigantes da indústria. A startup chinesa afirma ter treinado sua poderosa rede neural Deepseek V3 por meros US $ 6 milhões, utilizando apenas 2048 GPUs, subcotando significativamente os concorrentes. Esse custo aparentemente baixo, no entanto, esconde um investimento muito mais substancial.
imagem: ensigame.com
A arquitetura inovadora da DeepSeek V3 contribui para sua eficiência. As principais tecnologias incluem previsão de vários toques (MTP), que prevê várias palavras simultaneamente; Mistura de especialistas (MOE), empregando 256 redes neurais para treinamento acelerado; e atenção latente de várias cabeças (MLA), concentrando-se nos elementos cruciais da frase para melhorar a precisão.
imagem: ensigame.com
No entanto, um relatório de semiânica revela uma infraestrutura muito maior: aproximadamente 50.000 GPUs da NVIDIA, avaliadas em aproximadamente US $ 1,6 bilhão, com custos operacionais quase 944 milhões. Isso contradiz a reivindicação de custo inicial da DeepSeek, que é responsável apenas pelo uso de GPU pré-treinamento, omitir pesquisas, refinamento, processamento de dados e despesas gerais de infraestrutura.
A independência e a estrutura enxuta da Deepseek, uma subsidiária do High-Flyer Hedge Fund, permitem inovação rápida e alocação de recursos eficientes. Ao contrário dos concorrentes dependentes de serviços em nuvem, a Deepseek possui seus data centers, maximizando o controle e a velocidade. Sua natureza autofinanciada aumenta ainda mais a agilidade. Altos salários, excedendo US $ 1,3 milhão anualmente para alguns pesquisadores, atraem os melhores talentos das universidades chinesas.
imagem: ensigame.com
Embora o número de custos de treinamento de US $ 6 milhões da Deepseek seja enganoso, o investimento geral da empresa excede US $ 500 milhões. Seu sucesso decorre de investimentos substanciais, avanços tecnológicos e uma força de trabalho qualificada, não apenas da eficiência orçamentária. Apesar disso, seus custos permanecem significativamente menores que os concorrentes; O modelo R1 da Deepseek custou US $ 5 milhões em comparação com os US $ 100 milhões da ChatGPT4.
imagem: ensigame.com
O exemplo da Deepseek mostra uma empresa de IA independente bem-sucedida e bem financiada competindo efetivamente com os players estabelecidos. No entanto, a narrativa da relação custo-benefício revolucionário requer uma compreensão mais sutil de sua verdadeira escala de investimento.
"Clair obscur: Expedição 33 hits 1 milhão de vendas em 3 dias"
Top 10 filmes de Liam Neeson classificados
Roblox Deep Descent: Janeiro de 2025 Códigos revelados
Ragnarok V: Retorna Guia para iniciantes - aulas, controles, missões, jogabilidade explicada
Como alimentar os moradores necessários
BitLife: Como completar o desafio do Renascença
Guia do Herói Bahiti: Dominando o atirador épico em sobrevivência de Whiteout
익스페디션 33 패치로 소프트록 버그 수정 완료
Samsung lança cartões MicroSD Express mais acessíveis
May 04,2026
Novo jogo roguelike Trimo Heroes se funde para salvar a galáxia
May 04,2026
Jogo de Construção de Cidades Islanders: Novas Terras Chega ao Móvel Este Mês!
May 03,2026
Shuwatch: Novo jogo de quebra-cabeça do Ultraman marca os 60 anos da série
May 02,2026
Persona 5 Phantom X Chega ao Mobile
May 01,2026