上傳照片就能模仿本人聲音中國新AI模型涉侵權爭議

2026年02月12日 | 焦點

AI生成技術快速發展，幾乎到了以假亂真的地步。示意圖。（大紀元製圖）

【記者吳旻洲／台北報導】

中國科技巨頭字節跳動近日推出人工智慧（AI）影片生成模型Seedance 2.0，引發熱議，知名中國影音創作者「影視颶風」創辦人潘天鴻實測發現，這款AI竟然在未經授權的情況下，光憑一張面部圖像，就能生成與本人高度匹配的聲音特徵。

於2月低調上線的Seedance 2.0可同步生成影片與聲音，只需輸入指令或上傳參考圖，就能在60秒內產出帶完整原生音軌的多鏡頭影片，功能強大引發討論。

Seedance 2.0被爆2大恐怖

然而，中國科技自媒體影視颶風在YouTube上傳一支影片表示，試用Seedance 2.0後所發現的「恐怖」之處。

首先，潘天鴻表示，他把自己的照片上傳到Seedance 2.0後，生成影片就自動為這張臉配上他的聲音，「這個AI它會自動用我的聲音說話」；但他沒有提供聲音文件，指令中也沒有透露他的身分資訊，甚至沒有告訴系統，照片對應的人是誰，「但AI竟然知道這張臉的聲音是我的這個聲音」。

再來，潘天鴻還發現，他上傳一張帶有公司部分場景的全身照，但Seedance 2.0生成的影片，竟能以人物為中心進行運鏡，轉向大樓的另一面，而且與現實場景幾乎一模一樣。

「這不恐怖嗎？它（指AI）知道我背後的東西是什麼，即便我沒有告訴它。」潘天鴻認為，Seedance 2.0大量使用他們公司的影片進行訓練，但卻沒有對相關素材申請授權，也沒有字節跳動的工作人員聯繫他進行版權申請。

AI生成技術快速發展，幾乎到了以假亂真的地步。示意圖。（Shutterstock）

潘天鴻也提醒，當一個人上傳到網路的資訊進入AI數據集，並且AI能百分之百模擬出一個人的任何形態以及聲音，「那請問這樣的內容，你的家人分得出真假嗎？」

影片下方網友留言表示，「現在除了比誰錢多買晶片，就是比誰道德底線更低、盜用更多東西訓練模型」、「AI最終不是技術問題，而是道德和侵權問題」。

面對相關爭議，中國媒體《中國經營報》表示，字節跳動已於9日暫停支持用戶上傳真人圖片或影片作為主體參考，並限制僅在完成活體認證後方可生成真人形象影片，同時對名人、知名IP的影片生成進行嚴格審核。

陽明交大資工系終身講座教授林一平接受《大紀元》採訪時坦言，這類技術真的非常厲害，是多種AI能力整合的結果，包括語音合成、聲紋辨識、少樣本學習、影像辨識與場景推測等。只要網路上已有公開影片與聲音資料，系統便可透過爬蟲抓取並建立聲音模型，再輸入任意文字生成近似本人語音。

「如果是網紅，公開影片本來就很多，AI學習並不困難。」林一平表示，這與人類模仿他人聲音的原理類似，只是機器模仿的精準度遠高於人類。

至於照片生成全景的技術，林一平說，AI可透過影像辨識公司標誌、建築特徵，甚至讀取照片內的GPS定位資訊（EXIF資料），再比對公開資料庫進行場景補完。「這不是偷到機密，而是利用公開資訊拼湊重建。」

然而，技術突破也讓法律面臨挑戰。林一平表示，目前最大問題在於「法律定義已落後於技術能力」。他解釋，AI學的是公開資料，如果沒有明確法律禁止，就很難說它違法，真正構成違法的往往不是模仿本身，而是用途，例如涉及誹謗、詐騙、深偽不雅影像等。

AI生成技術快速發展，幾乎到了以假亂真的地步。示意圖。（123RF）

更令人憂心的是，這類技術可能被用於認知作戰與政治操作。林一平表示，以目前技術水準，完全可以製作逼真的假候選人影片或錄音，在選舉期間散布假訊息，「這已不是單純科技問題，而是國安問題」。

林一平表示，若AI資料庫設於境外、甚至敵對國家，則風險更為複雜，包括：聲紋資料大量蒐集、個資整合分析、精準詐騙、認知戰操作、選舉干擾等，「技術上做得到，至於會不會發生，取決於政治與法律防線是否跟得上。」

至於該如何防範個資遭AI盜用？林一平表示，政府除了要加速制定主權AI、資安防治、訂定專法之外，他建議民眾盡量不要把個資放到網路上，即便只是上傳一張照片，都會附帶GPS的定位資訊，以當前科技無所不在的環境，若真想完全杜絕，可能只有回歸傳統，用紙本印刷的方式才行。◇