研究:AI模型看不懂時鐘及日曆

英國愛丁堡大學的研究顯示,大多數AI模型看不懂時鐘和日曆。圖為鬧鐘示意圖。(Shutterstock)
英國愛丁堡大學的研究顯示,大多數AI模型看不懂時鐘和日曆。圖為鬧鐘示意圖。(Shutterstock)

【記者陳俊村/綜合報導】

近年來,人工智慧(AI)被廣泛應用在多種領域,替人類解決了不少問題,但這種炙手可熱的技術並非萬能。最近就有研究發現,AI尚未掌握人們能輕易完成的一些技能,比如說,大多數AI模型看不懂人們熟悉的時鐘和日曆。

英國愛丁堡大學(University of Edinburgh)的研究團隊表示,最先進的AI模型無法翔實的解釋時鐘指針的位置,以及正確回答有關日曆上日期的問題。有別於簡單的識別形狀,看懂時鐘和日曆需要結合空間意識、背景和基礎數學,這對AI來說仍具有挑戰性。

該團隊測試了處理文字和圖像的AI系統,稱為「多模態大型語言模型」(Multimodal Large Language Model),是否可以經由查看時鐘或日曆的圖片來回答與時間相關的問題。

他們測試了各種時鐘設計,包括帶有羅馬數字的時鐘、帶有和不帶有秒針的時鐘以及具有不同顏色的錶盤的時鐘。結果發現,AI系統準確判斷時鐘指針位置的次數不到1/4,當時鐘上有羅馬數字或格式化的指針時,更容易發生錯誤。

當時鐘的秒針被移除時,AI系統的表現也沒有任何改善,這意味著這些系統對於秒針的檢測和角度的解讀存在著根深蒂固的問題。

而在日曆方面,研究人員要求AI模型回答一系列與日曆有關的問題,例如識別假期以及計算過去和未來的日期。結果發現,即使是表現最好的AI模型,也有1/5的次數會出現日期計算錯誤,比如說,當被問到「今年的第153天是哪一天?」時,AI模型的錯誤率還挺高的。

這項研究的主要報告撰寫人、該校研究人員薩克塞納(Rohit Saxena)說:「大多數人從小就能分辨時間和使用日曆。我們的研究結果突顯了AI在執行人類基本技能方面所存在的巨大差距。」他認為,如果人們想把AI成功的融入現實世界中對時間很敏感的應用領域(例如排程和自動化)的話,這些問題就必須解決。

該校另一名研究人員傑瑪(Aryo Gema)說:「當今的AI研究經常強調複雜的推理任務,但諷刺的是,許多系統仍難以執行比較簡單的日常任務。」

上述研究成果發表在線上預印本資料庫arXiv上。研究人員也在今年4月28日舉行的國際表徵學習大會上發表了該研究論文。◇

延伸閱讀
取消