研究:DeepSeek硬體成本逾百億
中國新創科技公司DeepSeek(深度求索)號稱以低成本,就訓練出媲美西方先進AI(人工智慧)模型的產品,引發熱議。不過,有報告指出,DeepSeek僅在硬體上的成本就遠高於5億美元(約新台幣164億元)。此外,其研發成本和總成本應該也很高。
DeepSeek的研究人員稱,2025年1月10日推出的DeepSeek-V3模型,在多項數據上超越國內外一眾大模型產品,他們使用輝達的非高端H800晶片訓練,且訓練成本僅557萬美元;1月20日發布的推理模型DeepSeek-R1,性能則是比肩OpenAI o1正式版。
半導體研究和諮詢公司SemiAnalysis在1月31日發表的一份研究報告中表示,DeepSeek僅在GPU(繪圖處理器)方面的硬體支出就超過5億美元,伺服器總資本支出約16億美元,其中高達9.44億美元用於運行其晶片集群。
據悉,DeepSeek的主要投資方、中國對沖基金「幻方量化」(High-Flyer)早在2021年美國出口管制生效前,就囤積了1萬顆輝達的A100 GPU。
專家:不是重大價格突破
矽谷科技投資公司Altimeter Capital創辦人葛斯納(Brad Gerstner)在X平台上表示,OpenAI、Anthropic等美國科技公司耗資數十億開發出AI工具,報導說DeepSeek用不到600萬美元就研發出相匹敵的產品,這是「假新聞」。
首先,OpenAI並未公開其AI產品「o1」的研發投入。根據葛斯納的推測,「o1」成本在1,500萬美元左右,所以要比較OpenAI與DeepSeek的訓練成本,應該是1,500萬美元相比600萬美元。
其次,考慮到DeepSeek的發布時間比OpenAI晚了近一年,成本理應降低50%以上。Anthropic最新報告,DeepSeek的性能落後其7至10個月。按照常理,隨著技術成本下降,每年會帶來3至4倍的效率改進。
葛斯納告訴CNBC,也就是說,DeepSeek只能算普遍符合預期,「這不是一個重大的價格突破」。
訓練成本與研發成本有別
不過,DeepSeek自身的報告也表明,不到600萬美元的成本僅包括DeepSeek-V3的正式訓練(只計算了輝達GPU的租賃價格),並不包括先前在架構、演算法或數據方面的研究和實驗等成本。
訓練成本往往跟整個研發成本不成比例。例如Anthropic的Claude 3.5 Sonnet訓練成本「高達數千萬美元」,但為此它需要從亞馬遜和谷歌籌集數十億美元。SemiAnalysis報告表示,「這是因為他們必須進行實驗、提出新的架構、收集和理清數據、支付薪資等。」
工研院政策與區域研究組組長李冠樺對《大紀元》表示,DeepSeek的低成本模式,事實上是因為利用了別人已經訓練好的模型,進行進一步的優化。這種低成本嚴格來說,其實是別人幫它分攤的。「它事實上是站在別人的肩膀上再往上走,不應該把它跟OpenAI等同看待。它更像是在OpenAI基礎模型上面,做了一些更有針對性的優化。」
美國資本公司Archerman Capital指出,Meta和OpenAI等花費高是因為前沿探路,而後發追趕是站在別人的肩膀上,當然可以避開很多浪費。「打個不恰當的比方,創新藥的研發需要十年幾十億美元,而仿製藥的研發一定會更快更省,另外成本的統計口徑也沒有統一的標準,可以有很大的差別。」◇