首頁 新聞 DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

作者 : Andrew Feb 26,2025

DeepSeek令人驚訝的是,廉價的AI模型挑戰了行業巨頭。該公司聲稱,僅使用2048 GPU培訓了其強大的DeepSeek V3神經網絡,僅需600萬美元,大大削弱了競爭對手。但是,這個數字具有誤導性。

DeepSeek Test圖像:ensigame.com

DeepSeek V3利用創新技術:多token預測(MTP),以提高準確性和效率; 專家(MOE)的混合物,利用256個神經網絡,加速培訓並提高績效; 多頭的潛在注意力(MLA)專注於關鍵句子元素,從而最大程度地減少信息丟失。

DeepSeek V3圖像:ensigame.com

與最初的主張相反,半分析顯示DeepSeek廣泛的基礎設施,包括多個數據中心的大約50,000個NVIDIA HOPPER GPU,總投資約為16億美元,運營成本為9.44億美元。這包括對人員進行大量投資,一些研究人員每年收入超過130萬美元。

DeepSeek圖像:ensigame.com

中國對衝基金High-Flyer的子公司DeepSeek擁有其數據中心,提供了更大的控製和更快的創新實施。這種自資助的方法有助於其敏捷性。這筆600萬美元的數字僅反映了培訓前的GPU成本,不包括研究,改進,數據處理和基礎架構。 DeepSeek對AI開發的實際投資超過5億美元。

DeepSeek圖像:ensigame.com

盡管DeepSeek的成功源於大量投資,技術進步和熟練的團隊,但其“預算友好”的敘述是過分簡化的。但是,即使有了校正的數字,與競爭對手相比,DeepSeek的成本仍然蒼白。例如,DeepSeek的R1型號的培訓花費了500萬美元,而Chatgpt-4的售價為1億美元。但是,盡管涉及大量投資,但該公司的效率和集中的結構使其能夠與行業巨頭有效競爭。