>  訊息 >  DeepSeek:AI革命以溢價成本

DeepSeek:AI革命以溢價成本

by Elijah Feb 19,2025

DeepSeek令人驚訝的是,廉價的AI模型挑戰了行業巨頭。這家中國初創公司聲稱已經培訓了其強大的DeepSeek V3神經網絡,僅利用2048 GPU,大大削弱了競爭對手,僅需600萬美元。然而,這似乎很低的成本掩蓋了更多的投資。

DeepSeek Test圖像:ensigame.com

DeepSeek V3的創新架構有助於其效率。關鍵技術包括多言預測(MTP),該預測同時預測了多個單詞;專家(MOE)的混合物,采用256個神經網絡進行加速培訓;和多頭潛在注意力(MLA),重點是至關重要的句子元素以提高準確性。

DeepSeek V3圖像:ensigame.com

但是,一份半分析報告顯示,基礎設施更大:大約50,000個NVIDIA GPU,價值約16億美元,運營成本接近9.44億美元。這與DeepSeek的初始成本索賠相矛盾,該索賠僅說明了培訓的GPU使用情況,省略了研究,改進,數據處理和整體基礎設施費用。

DeepSeek的獨立性和精益結構是高飛行對衝基金的子公司,可以快速創新和有效的資源分配。與依賴雲服務的競爭對手不同,DeepSeek擁有其數據中心,從而最大程度地發揮了控製和速度。它的自資助性質進一步增強了敏捷性。對於一些研究人員來說,高薪高薪,每年超過130萬美元,吸引了中國大學的頂尖人才。

DeepSeek圖像:ensigame.com

盡管DeepSeek的600萬美元培訓成本數字具有誤導性,但該公司的整體投資超過5億美元。它的成功源於大量投資,技術進步和熟練的勞動力,而不僅僅是預算效率。盡管如此,它的成本仍大大低於競爭對手; DeepSeek的R1型號的價格為500萬美元,而Chatgpt4的1億美元。

DeepSeek圖像:ensigame.com

DeepSeek的示例展示了一家成功,資金充足的獨立AI公司,與知名參與者有效競爭。但是,革命成本效益的敘述需要對其真正的投資量表有更細微的理解。