歐洲媒體研究：AI查證新聞錯誤率近半

2025年10月28日 | 綜合

歐洲廣播聯盟22日公布的大規模研究顯示，ChatGPT之類的人工智慧（AI）助理在回答有關新聞事件的問題時，約有半數出現錯誤。示意圖。（Nicolas Maeterlinck_Belga Mag_AFP via Getty Images）

【記者張雲清／綜合報導】

歐洲廣播聯盟22日公布的大規模研究顯示，ChatGPT之類的人工智慧（AI）助理在回答有關新聞事件的問題時，約有半數出現錯誤。法新社報導，這些錯誤包括將新聞與諷刺內容混淆、日期錯誤，甚至憑空捏造事件。

據中央社報導，歐洲廣播聯盟（European Broadcasting Union）的報告研究中有四款廣泛使用的AI助理，包括OpenAI的ChatGPT、微軟（Microsoft）的Copilot、谷歌（Google）的Gemini以及Perplexity。

報告說，整體而言，45%的AI答覆「至少有一項重大問題」，而且不分語言或來源國家，每5則答覆中就有1則「存在嚴重的正確性問題，包括虛構細節與過時資訊」。

4款AI助理之中，「Gemini的表現最差，76%的回應中出現重大問題，比率是其他助理的兩倍以上，主要和資訊來源表現不佳有關。」

今年5月底至6月初，來自18個以歐洲為主國家的22家公共媒體向這些AI助理提出相同的新聞問題。在3千則答覆中，過時的資訊是最常見的問題之一。

例如問到「教宗是誰」時，ChatGPT告訴芬蘭國家廣播公司（Yle）是「方濟各」（Francis），Copilot和Gemini給荷蘭廣播基金會（NOS）和荷蘭公共廣播（NPO）的答案也是「方濟各」，但當時他已過世，由良十四世（Leo XIV）接任。

歐洲廣播聯盟副祕書長坦德（Jean Philip De Tender）與英國廣播公司（BBC）AI主管阿契爾（Pete Archer）表示：「AI助理仍不是獲取和瀏覽新聞的可靠方式。」

即便有這些缺陷，AI助理在獲取資訊方面的使用率仍持續增加，尤其受到年輕人青睞。

根據路透新聞學研究所（Reuters Institute for the Study of Journalism）6月發布的全球報告，25歲以下族群中有15%的人每週會用AI助理取得新聞摘要。◇