上傳照片就能模仿本人聲音 中國新AI模型涉侵權爭議
中國科技巨頭字節跳動近日推出人工智慧(AI)影片生成模型Seedance 2.0,引發熱議,知名中國影音創作者「影視颶風」創辦人潘天鴻實測發現,這款AI竟然在未經授權的情況下,光憑一張面部圖像,就能生成與本人高度匹配的聲音特徵。
於2月低調上線的Seedance 2.0可同步生成影片與聲音,只需輸入指令或上傳參考圖,就能在60秒內產出帶完整原生音軌的多鏡頭影片,功能強大引發討論。
Seedance 2.0被爆2大恐怖
然而,中國科技自媒體影視颶風在YouTube上傳一支影片表示,試用Seedance 2.0後所發現的「恐怖」之處。
首先,潘天鴻表示,他把自己的照片上傳到Seedance 2.0後,生成影片就自動為這張臉配上他的聲音,「這個AI它會自動用我的聲音說話」;但他沒有提供聲音文件,指令中也沒有透露他的身分資訊,甚至沒有告訴系統,照片對應的人是誰,「但AI竟然知道這張臉的聲音是我的這個聲音」。
再來,潘天鴻還發現,他上傳一張帶有公司部分場景的全身照,但Seedance 2.0生成的影片,竟能以人物為中心進行運鏡,轉向大樓的另一面,而且與現實場景幾乎一模一樣。
「這不恐怖嗎?它(指AI)知道我背後的東西是什麼,即便我沒有告訴它。」潘天鴻認為,Seedance 2.0大量使用他們公司的影片進行訓練,但卻沒有對相關素材申請授權,也沒有字節跳動的工作人員聯繫他進行版權申請。
字節跳動急限制生成真人功能
潘天鴻也提醒,當一個人上傳到網路的資訊進入AI數據集,並且AI能百分之百模擬出一個人的任何形態以及聲音,「那請問這樣的內容,你的家人分得出真假嗎?」
影片下方網友留言表示,「現在除了比誰錢多買晶片,就是比誰道德底線更低、盜用更多東西訓練模型」、「AI最終不是技術問題,而是道德和侵權問題」。
面對相關爭議,中國媒體《中國經營報》表示,字節跳動已於9日暫停支持用戶上傳真人圖片或影片作為主體參考,並限制僅在完成活體認證後方可生成真人形象影片,同時對名人、知名IP的影片生成進行嚴格審核。
專家:立法速度遠落後科技
陽明交大資工系終身講座教授林一平接受《大紀元》採訪時坦言,這類技術真的非常厲害,是多種AI能力整合的結果,包括語音合成、聲紋辨識、少樣本學習、影像辨識與場景推測等。只要網路上已有公開影片與聲音資料,系統便可透過爬蟲抓取並建立聲音模型,再輸入任意文字生成近似本人語音。
「如果是網紅,公開影片本來就很多,AI學習並不困難。」林一平表示,這與人類模仿他人聲音的原理類似,只是機器模仿的精準度遠高於人類。
至於照片生成全景的技術,林一平說,AI可透過影像辨識公司標誌、建築特徵,甚至讀取照片內的GPS定位資訊(EXIF資料),再比對公開資料庫進行場景補完。「這不是偷到機密,而是利用公開資訊拼湊重建。」
然而,技術突破也讓法律面臨挑戰。林一平表示,目前最大問題在於「法律定義已落後於技術能力」。他解釋,AI學的是公開資料,如果沒有明確法律禁止,就很難說它違法,真正構成違法的往往不是模仿本身,而是用途,例如涉及誹謗、詐騙、深偽不雅影像等。
AI深偽恐成選舉干擾工具
更令人憂心的是,這類技術可能被用於認知作戰與政治操作。林一平表示,以目前技術水準,完全可以製作逼真的假候選人影片或錄音,在選舉期間散布假訊息,「這已不是單純科技問題,而是國安問題」。
林一平表示,若AI資料庫設於境外、甚至敵對國家,則風險更為複雜,包括:聲紋資料大量蒐集、個資整合分析、精準詐騙、認知戰操作、選舉干擾等,「技術上做得到,至於會不會發生,取決於政治與法律防線是否跟得上。」
防AI盜用 個資盡量別傳網路
至於該如何防範個資遭AI盜用?林一平表示,政府除了要加速制定主權AI、資安防治、訂定專法之外,他建議民眾盡量不要把個資放到網路上,即便只是上傳一張照片,都會附帶GPS的定位資訊,以當前科技無所不在的環境,若真想完全杜絕,可能只有回歸傳統,用紙本印刷的方式才行。◇













