林之晨:政府應打造繁體中文資料庫 為主權AI打基礎

電信業今天拜會數發部,台灣大總經理林之晨受訪表示,他提議數發部可與其他部會合作,建立高品質的繁體中文共同資料庫,提供給國內外業者使用,繁體中文的AI發展才能大躍進,不僅是為主權AI打基礎,也能重新啟動數位產業動能。

3大電信業者今天下午拜會數發部長黃彥男,電信業者包含中華電信董事長郭水義、總經理林昭陽,台灣大哥大董事長蔡明忠、總經理林之晨,以及遠傳電信董事長徐旭東、總經理井琪均親自拜訪。

媒體關注業者拜會數發部討論議題,林之晨會後受訪時表示,電信同業有提到打詐、阻詐、識詐議題,他則是建議數發部可以與其他部會合作,台灣應該要打造自己的繁體中文共同資料庫(Common Data Set)。

林之晨指出,目前數位產業進入換檔期,近年可看到電商、數位廣告等年成長下降到10%,電商近期甚至下降到個位數成長,數位發展部現在很關鍵,必須重新啟動數位產業發展,AI也扮演關鍵角色。

林之晨表示,台灣發展AI產業,但缺乏繁體中文的共同資料庫。例如,現在使用ChatGPT跟Gemini等模型,雖然回答繁體中文內容,但中文語法怪怪的,因模型本身並非使用台灣的語料。

他建議,數發部可以跟其他會合作,建立一個繁體中文的共同資料庫,資料庫也可提供給國內外業者使用,相信可以讓繁體中文的AI發展大躍進,重新啟動數位產業動能。

林之晨說明,打造主權AI前要先有繁體中文資料庫,現在業界模型表現很接近,主因是背後使用的是英語世界類似的共同資料庫,因此只要投入資源,都可以訓練出一個表現還可以的AI。台灣如果沒有高品質的繁體中文共同資料庫,根本訓練不出主權AI,因此或許台灣可以集合政府與民間力量,打造資料庫。

至於數發部對此議題的態度,林之晨轉述,部長黃彥男也同意重要性,這部分也會是數發部的任務,不過,要從開放資料到共同資料庫還有很大的距離,也有意跟電信業者合作。

至於其他建議,林之晨說,同業也提到希望採用綠電,頻率使用費可以有所減免,並希望AI領航推動計畫第二期計畫可擴大舉行,但會中並未提到明年希望釋出新頻譜等議題。


最新財經新聞
人氣財經新聞
行動版 電腦版