AI語音數據資料集上線 助攻語音語意技術突破

AI語音數據資料集上線 助攻語音語意技術突破

AI語音數據資料集上線 助攻語音語意技術突破

科技部今天舉辦AI語音數據資料集上線發表會,首批釋出「科技大擂台與AI對話」競賽所使用的語音題庫資料,共有400小時,預計將大幅縮短發展語音過程中所需的資料標註人力與時間,國內企業、學術界可以免費取得授權,用在AI相關技術研發突破,提升台灣競爭力。

AI語音數據資料集第一批釋出400小時「科技大擂台與AI對話」競賽所使用的語音題庫資料,除了自行錄製的資料外,更結合警察廣播電臺及教育廣播電臺提供的相關語音資料,由台北科技大學協助進行語音資料標註,可以加速AI的訓練與精進,科技部次長許有進表示,「科技大擂台與AI對話」挑戰AI的語意理解和語音對話,期望能夠加速開發中文語音對話的核心技術,讓機器人可以參與對話甚至回應,這次推出的AI語音數據資料庫,將提供業界、學界運用。

科技部進一步說明,資料庫可以幫助業界進行AI語音演算法訓練,提升語音辨識理解力及準確度,未來可以在智慧型手機、智慧家庭、自動駕駛等方面廣泛應用,預計在今年底之前將陸續釋放2000個小時精確標註的語音訓練資料,降低相關技術的發展門檻,資料集在國家實驗研究院高速網路與計算中心資料及平台上架,期望藉此吸引更多企業、學術研究機構投入,共同推動語音AI技術,協助台灣企業進行數位轉型。
機器人:機器人(英語:Robot)包括一切模擬人類行為或思想與模擬其他生物的機械(如機器狗,機器貓等)。 ...更多

社群回應
PChome會員回應