主權AI再邁步 數發部拚資料共享立法

為推動人工智慧(AI)發展與資料共享法制化,數位發展部近日提出「促進資料創新利用發展條例」草案,公開徵詢社會意見至8月15日。該法草案以擴大政府資料開放、強化跨部會與產業資料共享為核心,建立資料創新利用制度基礎,同時為台灣主權AI的發展提供關鍵支撐。
數發部15日上午召開記者會說明草案內容,數發部政務次長林宜敬、資料創新司司長莊明芬出席。
林宜敬表示,AI發展迅速,而訓練AI模型需仰賴大量資料,數發部正積極推動政府與民間釋出擁有著作權的資料。政府方面則透過修法,在不損害個資前提下,讓公務員能安心釋出政府擁有著作權的資料,希望藉此訓練出更多具有台灣觀點的AI模型。
莊明芬表示,推動這部法案,主要是為了確立資料開放與創新應用的法制基礎,因應AI發展需求,強化資料共享與再利用力道,並打破資料孤島,建立完整的產業應用生態系。草案一大重點是擴大政府資料開放,以助攻AI模型訓練。目前政府的開放資料已有5萬多筆,但AI模型訓練所需的,多為語意連貫、內容完整的文本型資料,這類資料較易涉及著作權,因此數發部正研擬授權條款,協助各機關盤點並依法釋出具潛力的內部資料。
她也指出,草案中明定行政院所屬二級機關、獨立機關、直轄市及縣(市)政府應設置「資料長」,負責推動內部資料的協調與溝通,強調跨域整合與資料創新應用。此外,草案重點還包括鼓勵產業建立可互通的資料共享機制,以及透過節省資料取得費用等誘因,促進資料創新利用,強化整體資料應用效能。
為推動主權AI發展,數位發展部近期積極建置「主權AI訓練語料庫」,莊明芬表示,語料庫將納入政府擁有著作權的資料,因此數發部正研擬非專屬授權條款,協助行政院各部會盤點可釋出的資料內容。語料庫系統建置完成後,將可上架資料,預計於今年第四季對外釋出。◇