臺科大研發AI去背專家 3千萬畫素1秒即完成
為降低廣告成本,國立臺灣科技大學組成團隊利用深度學習(Deep Learning)研發「MainBody:去背專家」,製作出可精確去除各種圖片背景的AI(人工智慧)系統,3千萬畫素圖片只需1秒即可完成去背,這項技術讓臺科大獲得2022年「全國大專校院智慧創新暨跨域整合創作競賽」電商與金融科技第一名。
臺科大說明,「MainBody:去背專家」是自動、互動式AI圖片、影片的去背系統,可將圖片中動物、人物髮絲、網狀細節等的背景去除乾淨。同時,高達3千萬畫素的圖片辨識速度,大約僅需1秒,此項技術可廣泛應用在任何需要去背應用情境。
例如商業攝影、需要準備圖片素材的新聞媒體業,或電商平臺需要上架商品、製作廣告。另外,針對超級複雜的環境中,無法100%完美去背時,系統擁有互動式AI去背功能,讓使用者簡便的輔助標示主體或保留的區域,流暢的達成去背工作。
參與研發的資工系學生林鼎傑說,雖然作品是一個去背網頁,但實際上包含了去背模型和去背系統。這平臺使用數據驅動的方法,自行收集了約20萬張的圖片,先用模型初步預測後,再人工修正標註,取得答案,而製作資料集也花了很多時間精力。
林鼎傑表示,簡單來說,如果使用者希望修改去背結果的主題,就能直接透過互動式的操作,點選希望保留或刪除的部分,讓AI重新判斷去背結果,這是現有去背軟體較少實現的項目。而坊間的軟體問題在於難以編輯,或是專業人士使用美編軟體去背,需要花費大量時間,此一技術可以加速流程,減輕負擔。
參與研發的資工系學生林于婷說,目前「MainBody:去背專家」尚未面世,會把參賽得獎的10萬元獎金,拿來繼續研發,希望能發展出主體前景的光影能隨背景變化,使合成圖片更自然。◇