歐洲媒體研究:AI查證新聞 錯誤率近半

歐洲廣播聯盟22日公布的大規模研究顯示,ChatGPT之類的人工智慧(AI)助理在回答有關新聞事件的問題時,約有半數出現錯誤。示意圖。(Nicolas Maeterlinck_Belga Mag_AFP via Getty Images)
歐洲廣播聯盟22日公布的大規模研究顯示,ChatGPT之類的人工智慧(AI)助理在回答有關新聞事件的問題時,約有半數出現錯誤。示意圖。(Nicolas Maeterlinck_Belga Mag_AFP via Getty Images)

【記者張雲清/綜合報導】

歐洲廣播聯盟22日公布的大規模研究顯示,ChatGPT之類的人工智慧(AI)助理在回答有關新聞事件的問題時,約有半數出現錯誤。法新社報導,這些錯誤包括將新聞與諷刺內容混淆、日期錯誤,甚至憑空捏造事件。

據中央社報導,歐洲廣播聯盟(European Broadcasting Union)的報告研究中有四款廣泛使用的AI助理,包括OpenAI的ChatGPT、微軟(Microsoft)的Copilot、谷歌(Google)的Gemini以及Perplexity。

報告說,整體而言,45%的AI答覆「至少有一項重大問題」,而且不分語言或來源國家,每5則答覆中就有1則「存在嚴重的正確性問題,包括虛構細節與過時資訊」。

4款AI助理之中,「Gemini的表現最差,76%的回應中出現重大問題,比率是其他助理的兩倍以上,主要和資訊來源表現不佳有關。」

今年5月底至6月初,來自18個以歐洲為主國家的22家公共媒體向這些AI助理提出相同的新聞問題。在3千則答覆中,過時的資訊是最常見的問題之一。

例如問到「教宗是誰」時,ChatGPT告訴芬蘭國家廣播公司(Yle)是「方濟各」(Francis),Copilot和Gemini給荷蘭廣播基金會(NOS)和荷蘭公共廣播(NPO)的答案也是「方濟各」,但當時他已過世,由良十四世(Leo XIV)接任。

歐洲廣播聯盟副祕書長坦德(Jean Philip De Tender)與英國廣播公司(BBC)AI主管阿契爾(Pete Archer)表示:「AI助理仍不是獲取和瀏覽新聞的可靠方式。」

即便有這些缺陷,AI助理在獲取資訊方面的使用率仍持續增加,尤其受到年輕人青睞。

根據路透新聞學研究所(Reuters Institute for the Study of Journalism)6月發布的全球報告,25歲以下族群中有15%的人每週會用AI助理取得新聞摘要。◇

★相關閱讀:
延伸閱讀
10月消費信心微跌至63.96點
2025年10月27日 | 3天前
Meta裁減AI部門600人
2025年10月23日 | 6天前
9月工業生產指數連19紅 AI一枝獨秀
2025年10月23日 | 6天前
台經院:9月製造業測驗點連3揚
2025年10月23日 | 7天前
金融在地化AI語言模型 明年底上線
2025年10月22日 | 8天前
連8紅!9月外銷訂單破7百億創紀錄
2025年10月21日 | 8天前
2028年AI實力 台灣拚全球前14名
2025年10月20日 | 9天前
取消