華為晶片不夠力 DeepSeek延後發表新模型

最新消息指出,中國人工智慧(AI)新創公司DeepSeek(深度求索),因在使用華為晶片進行訓練時遭遇技術故障,被迫延後推出R2模型。此事突顯北京在推進本土化AI發展方面仍面臨嚴峻挑戰。
《金融時報》報導,三位知情人士透露,DeepSeek在今年1月推出R1模型後,應監管部門「鼓勵」,改用華為昇騰(Ascend)處理器取代美國輝達(Nvidia)系統。
但在R2訓練過程中,昇騰晶片反覆出現穩定性與性能問題,最終DeepSeek只能採取「訓練用輝達、推理用華為」的折衷方案,原定5月的發布時程被迫延後,錯失市場時機。
訓練是指透過大量數據讓模型學習並優化參數的過程;推理則是利用已完成訓練的模型生成結果或預測,例如聊天機器人的回覆。
報導稱,華為曾派遣工程師團隊駐紮DeepSeek辦公室協助開發,但仍未能在昇騰晶片上完成一次成功的完整訓練。DeepSeek仍在與華為合作,嘗試讓R2模型在推理階段完全適用昇騰晶片。
知情人士表示,DeepSeek創辦人梁文峰對R2的研發進度不滿,並推動加大資源投入,以打造能保持領先優勢的先進模型。
北京施壓中企減少採購H20
輝達近日與美國政府達成協議,同意將H20晶片銷售收入的15%上繳美方,以換取出口許可。該公司強調,若完全退出中國市場及開發者社群,將削弱美國的全球經濟競爭力與科技影響力。
然而,中共國家網信辦(國家互聯網信息辦公室)7月約談輝達,要求解釋H20晶片是否存在可遠端追蹤或關閉的「後門」。輝達隨後堅決否認旗下晶片含有後門、遠端開關或間諜軟體。
美國媒體「The Information」8月12日報導,兩名接近中共網信辦的人士透露,幾個月來,輝達被其中國競爭對手和客戶投訴,稱輝達晶片有安全疑慮,或將敏感數據從中國傳輸到美國。
路透社報導,中共當局雖未正式全面禁止企業購買H20,但已明令要求騰訊、字節跳動、百度等主要科技業在使用H20時需提交「合理說明」,尤其涉及政府或敏感用途時。
彭博社也引述匿名知情人士的消息報導,網信辦的指導意見尤其「強烈禁止」國有企業或私營公司在與政府或國家安全的工作中使用H20晶片。該指導意見標誌著中共加強施壓國內企業轉用華為等國產晶片。
中國自產AI晶片效能不足
但產業分析師普遍認為,中國的AI企業仍然對H20晶片垂涎三尺,因為它們在某些關鍵的AI應用中表現相當出色。
H20晶片的計算能力不如輝達的頂級產品,但其強大的內建頻寬非常適合AI開發的推理階段,即模型進行「模式識別」並產生結論,例如從圖片中辨認人臉。
H20晶片一直是阿里巴巴和騰訊等中國公司下單的熱門產品,而華為等中企難以生產足夠的先進設備來滿足市場需求。
彭博社引述一名前官員的估計,若無法使用輝達晶片,中企在AI模型上進行推理的成本將增加三到六倍。這名拜登政府官員曾考慮、但最終未管制H20的銷售。
隆奧銀行(Lombard Odier)駐新加坡高級宏觀策略師李浩民(Homin Lee,音譯)告訴彭博社,中國製造商的晶片品質正在提升,但在中國AI產業希望專注的特定工作負載方面,它們不是那麼好用,因此輝達及超微(AMD)的晶片在中國仍面臨「強勁」需求。◇