華為晶片不夠力 DeepSeek延後發表新模型

2025年08月15日 | 要聞

傳中國人工智慧公司DeepSeek，在使用華為晶片開發模型時遭遇技術故障，因此延後推出新模型。Deepseek資料照。（記者宋碧龍／攝影）

【記者王君宜、林燕／綜合報導】

最新消息指出，中國人工智慧（AI）新創公司DeepSeek（深度求索），因在使用華為晶片進行訓練時遭遇技術故障，被迫延後推出R2模型。此事突顯北京在推進本土化AI發展方面仍面臨嚴峻挑戰。

《金融時報》報導，三位知情人士透露，DeepSeek在今年1月推出R1模型後，應監管部門「鼓勵」，改用華為昇騰（Ascend）處理器取代美國輝達（Nvidia）系統。

但在R2訓練過程中，昇騰晶片反覆出現穩定性與性能問題，最終DeepSeek只能採取「訓練用輝達、推理用華為」的折衷方案，原定5月的發布時程被迫延後，錯失市場時機。

訓練是指透過大量數據讓模型學習並優化參數的過程；推理則是利用已完成訓練的模型生成結果或預測，例如聊天機器人的回覆。

報導稱，華為曾派遣工程師團隊駐紮DeepSeek辦公室協助開發，但仍未能在昇騰晶片上完成一次成功的完整訓練。DeepSeek仍在與華為合作，嘗試讓R2模型在推理階段完全適用昇騰晶片。

知情人士表示，DeepSeek創辦人梁文峰對R2的研發進度不滿，並推動加大資源投入，以打造能保持領先優勢的先進模型。

北京施壓中企減少採購H20

輝達近日與美國政府達成協議，同意將H20晶片銷售收入的15%上繳美方，以換取出口許可。該公司強調，若完全退出中國市場及開發者社群，將削弱美國的全球經濟競爭力與科技影響力。

然而，中共國家網信辦（國家互聯網信息辦公室）7月約談輝達，要求解釋H20晶片是否存在可遠端追蹤或關閉的「後門」。輝達隨後堅決否認旗下晶片含有後門、遠端開關或間諜軟體。

美國媒體「The Information」8月12日報導，兩名接近中共網信辦的人士透露，幾個月來，輝達被其中國競爭對手和客戶投訴，稱輝達晶片有安全疑慮，或將敏感數據從中國傳輸到美國。

路透社報導，中共當局雖未正式全面禁止企業購買H20，但已明令要求騰訊、字節跳動、百度等主要科技業在使用H20時需提交「合理說明」，尤其涉及政府或敏感用途時。

彭博社也引述匿名知情人士的消息報導，網信辦的指導意見尤其「強烈禁止」國有企業或私營公司在與政府或國家安全的工作中使用H20晶片。該指導意見標誌著中共加強施壓國內企業轉用華為等國產晶片。

中國自產AI晶片效能不足

但產業分析師普遍認為，中國的AI企業仍然對H20晶片垂涎三尺，因為它們在某些關鍵的AI應用中表現相當出色。

H20晶片的計算能力不如輝達的頂級產品，但其強大的內建頻寬非常適合AI開發的推理階段，即模型進行「模式識別」並產生結論，例如從圖片中辨認人臉。

H20晶片一直是阿里巴巴和騰訊等中國公司下單的熱門產品，而華為等中企難以生產足夠的先進設備來滿足市場需求。

彭博社引述一名前官員的估計，若無法使用輝達晶片，中企在AI模型上進行推理的成本將增加三到六倍。這名拜登政府官員曾考慮、但最終未管制H20的銷售。

隆奧銀行（Lombard Odier）駐新加坡高級宏觀策略師李浩民（Homin Lee，音譯）告訴彭博社，中國製造商的晶片品質正在提升，但在中國AI產業希望專注的特定工作負載方面，它們不是那麼好用，因此輝達及超微（AMD）的晶片在中國仍面臨「強勁」需求。◇