記者陳柏翰∕台北報導
AI(人工智慧)議題正夯,而展現主權AI之一的關鍵就是大語言模型。針對台灣AI語料庫未來將如何發展,數發部次長葉寧十四日指出,國科會先前已為AI語料庫申請科專計畫四千萬元經費,目前語料庫資料主要來自政府,未來希望民間電子出版品廠商一起投入,讓台灣出版品成為語料庫的一部分。
國民黨立委葛如鈞十四日在立法院教育委員會上質詢時表示,目前台灣的語料庫都是政府單位資料,但是民間也有很多寶貴資料,他關注語料庫何時會開放給民間公司做AI訓練。
葉寧回應,目前民間電子出版品廠商也表現出高度興趣,希望電子出版品能夠成為語料庫的一部分;並表示未來也希望民間可以一起來投入語料庫。
國民黨立委柯志恩認為,針對開發AI語料庫的部分,誰擁有資料庫(Data Base),誰就擁有話語權,是否會影響主權中立,也需要考量;她認為,在建構資料庫的過程中,要審慎處理。