開發AI口說學習平台 EZ Talking助攻語言教學升級

ChatGPT的問世,可以說在AI(Artificial Intelligence,人工智慧)領域一石激起千層浪。在龐大資料庫以及前期訓練的支援下,AI的精準度日益提高,而AI語音辨識運用範疇也越來越廣泛,從智慧音箱到智慧家庭,再拓展至不同領域,加上行動載具的便利性,更讓語音辨識的應用觸手可及,包括導航、語音助理、會議記錄,甚至運用在醫療上,近年來更影響了「語言學習」的型態。
針對不同語言開發的App(Application的縮寫,泛指手機或電腦上的應用程式)琳瑯滿目,讓自學語言變得更為容易且便利。而導入AI的App,則進一步讓使用者除了可以大量反覆聽、讀、錄音練習外,還可以及時評分並給予反饋,對於學習者產生很大的激勵作用,讓許多不敢開口的人勇於開口練習。「易晨智能」公司推出的EZ Talking,以及「人人說」公司推出的教育新創品牌Sensay,均是在此大環境下衍生的產物。

易晨智能共同創辦人許永昌(右)與翁祥紘(左)。葉俊宏攝影


AI逐漸成熟》ChatGPT進化到超過12歲智商
早在2012年便投身AI研究的「易晨智能」創辦人暨執行長許永昌表示,大家最耳熟能詳的語音辨識系統,莫過於蘋果的Siri或是安卓的OK Google,這類型語音助手推展到智慧家庭,使用情境相當廣泛,讓生活變得更便利。但AI的應用在台灣相對走得比較慢。
對於AI運用的狀況,許永昌做了分析。2012年左右,市場對AI的技術還很陌生,2017年才較成熟。截至目前,因為數據量大,訓練的效果讓AI更聰明,許永昌比喻:「2015年如果AI具備3歲孩童的智商,2017年便是6歲,2021年大概是9歲。現在因為ChatGPT問世,AI大概具備12歲到15歲的智商。」
AI需要訓練,才能做準確的判讀,三大要素為:特徵、數據、演算法。根據不同領域提供關鍵字、專業知識,並對內容、情境進行定義,才能走向該領域進行專有名詞的判讀。許永昌舉例,過去曾與消防局做過救護車的緊急醫療專案,由於救護員兩隻手都很忙,沒時間做筆記,所以要用講的。傳統方式是先錄音,事後再根據錄音做整理與摘要,要花很長時間。語音辨識功能可以將語音同步轉錄成文字,並完成摘要,截取病患生理指數提供救護人員使用,許永昌說:「過去要花三小時的事情,現在也許三分鐘就做完了。」

軟體即服務》老師變孫悟空,AI催生教育界Uber
「易晨智能」成立於2019年,許永昌一直以來便想要將語音辨識功能發展成產品,先是推出智慧音箱概念的「故事機」,但不敵小米的低價競爭,市場上幾無立足之地。但他並沒有因此而退縮,反而在2021年找到教育這塊市場。
「台灣一直在喊2030年雙語政策,可是我們看到一個問題點:師資不夠充裕,整個大環境,即使有幾百億的預算,可是沒有這麼多師資,不可能三、五年把整個空缺填滿,所以AI是最好的角色。」
許永昌比喻:「老師有點像孫悟空,一個老師可以帶一百個虛擬助教,這一百個虛擬助教可以應付一百個學生,等於有一萬個老師。」他認為語音辨識剛好可以拿來做語言學習,可以做發音的校正。
在參考大量語言學習軟體諸如Quizlet、VoiceTube之後,易晨智能著手研發自己的系統,加入AI的優勢,推出EZ Talking AI口說App,彌補市場上語言學習軟體不具備AI評分功能的空缺。
「軟體即服務」SaaS(Software as a Service)的型態,使得EZ Talking有如「教育界的Uber」,許永昌說明:「Uber不開餐廳、不養廚師、不買菜,我們不開補習班、不養老師、不編教材,透過讓老師自己上圖片、文字、音檔等內容的方式,讓學生可以學習,讓補習班省卻開發App的麻煩。」

教育3.0時代》減輕老師負擔,專注因材施教
EZ Talking平台主要的合作對象為補習班與學校,搭配不同訂閱方案,讓老師可以上傳專屬的內容,並由AI將上傳的文字自動生成音檔,以便學生能自我練習。當學生開啟AI口說錄音時,AI還會及時評分並提供反饋,大大增加了便利性、機動性,同時激勵了學習意願。平台亦可串接影片,讓自學者擁有大量的學習資源。
不僅如此,與EZ Talking合作的補習班、老師、學校,透過後台可看到數據分析,接收使用者學習量、學習程度、發音正確度、流利度等訊息,以及程度預測參考。
許永昌強調,在教育3.0的時代,講究的是「精準學習」,現在的孩子資料量很多,EZ Talking想要解決這一問題,「過去想要了解學生的口語能力,多半採用聽學生錄音的方式,需要耗費大量的心力,一個孩子花10分鐘,10個孩子100分鐘。有沒有辦法做到10分鐘,針對10個孩子快速掃視?」
透過AI先判讀,先過濾、分析一次,老師再從後台看數據,更容易找出特別需要協助的學生。在AI的輔助下,減輕老師負擔後,才有時間再去好好的因材施教,許永昌很有自信:「我把老師的工作量降到最低,讓老師能聚焦教學,針對成績不好的去拉高他的水平;成績好的去微調他,讓他變精英。」

學生開啟口說錄音,AI會給予評分,透過不斷練習,可以達到進步。手機擷圖


優化產品》接受反饋意見,工程師團隊多方調教
易晨智能推出EZ Talking後,幾經調校才發展成現在的樣貌。導入第一批用戶時,曾發生App當機、語音辨識不準、無法評分、伺服器回應時間過長等問題。所幸易晨智能擁有自己的工程師團隊,可以很快地進行修正,許永昌形容:「上午提出問題,下午分析、明天改、後天上線。」
許永昌表示,最初開發軟體時設定的目標是5,000人使用,因此並未設想太多學生同時上線。未料使用量體超乎預期,由於瞬間流量太大,造成伺服器當機,他笑說:「一個上午就把伺服器流量衝爆!」經過修改程式,並大改伺服器架構之後,現在能同一時間容納10萬台設備上線。
通過不少使用者提供的反饋意見,也讓易晨智能得以針對不同作業系統、數據分析、操作介面問題等進行調校,提升數據分析準確度,調整演算法,力求逼近真人發音。許永昌說:「操作介面也改了不下50個版本。產品出來很簡單,真的要活下來才是最難的。」
EZ Talking到第二個半年就成熟了,聽到的反饋轉變為:這個很好用,可是我想要什麼功能;或是評分很準,可是可不可以解決什麼問題?多一些什麼?甚至有老師反饋EZ Talking的AI變爛了。對此,許永昌說:「我就很緊張,我說怎麼會?我們現在用戶很多,而且每次改版只會進化,不會退化。」反饋者回應說:「是我們學生變強了,你有沒有更好的功能?」透過各方的反饋,許永昌對於「科技輔助教學」的理念更有自信,認為可以繼續往下走。

易晨智能團隊期許EZ Talking從「教育界的Uber」轉為「教育界的7-11」。葉俊宏攝影


營收成長亮眼》從教育界的Uber到教育界的7-11
EZ Talking推出後,儘管前半年只有不到20家補習班導入,會員數不到500個,但後半年便迅速突破,不少美語教學連鎖體系或學校,如皇家菁英美語、芝麻街、高雄女中、清大英語師資培育中心等,均與其合作,而六都教育局也都導入該系統。截至目前,與EZ Talking配合的補習班約200家,學校約180所,註冊會員超過5萬,每天活躍用戶25,000人,每個月的數據量超過100萬次。相關數據顯示學生的口語能力有顯著的提升,顯示AI在輔助語言學習上起到了良好的作用。
隨著產品的優化與深化,以及使用者的實際使用印證,AI口說的確能有效提升學生的口語能力。因此,易晨智能力求將AI輔助學習的走向變廣,朝向語言學習的四個面向:聽、說、讀、寫同時發展,EZ Talking的定位也從「教育界的Uber」,轉為「教育界的7-11」。許永昌認為,要成為教育界的7-11,在這個領域具有分量,他十分歡迎業者來跟易晨智能探討相關問題。
快速的會員增長也為易晨智能帶來亮眼的營收成長,去年約創造1,000萬的年營收,今年預計達到3,000萬;公司員工則從原本的3人,成長到近20人。易晨智能同時也開始拓展海外市場,目前越南已開設分公司,使用人數5,000名,日本也有經銷商洽談中。未來海外將主打東南亞市場,許永昌認為,只要學英文的地方都有機會拓展,目前也在進行其他語種的開發。許永昌預計2025年底能首次公開募股(IPO,Initial Public Offering),邁向上市公司行列。

口說App市占第一》把顧客服務好,消費者願意用
許永昌表示,EZ Talking目前已是台灣AI口說App市占第一的產品,短短一年便有這樣的成果,他歸結原因為,一個產品只要把顧客服務好,消費者願意用,便不會失敗,「把客戶服務好是管理學的理論:顧客旅程、顧客體驗。你只要做到這一點就好了,好的產品,客戶使用對了,你做得有成就感、有意義,基本上不會失敗。」
EZ Talking解決需求大量師資的問題,同時又能幫助孩子真的開口說話,讓孩子學習有所成長,產品也越來越多的人使用。許永昌認為,自己專研十多年的語音辨識,的確在語言學習上起到了好的效果,所帶來的喜悅與成就感,已經遠遠大於對營利的追求。他希望未來可以把數據提供給教育部,協助做精準的分析:哪一區的學生程度好、為什麼好、好在哪裡,發音哪邊不好等等,「我們幫這群孩子提升他的能力,國家才會進步。」他強調:「不給我錢也沒關系,但我幫你分析。因為你做不到,我做,這是成就感。」


【本文摘自《看》雜誌第245期,更多內容請見http://www.watchinese.com】
(請尊重智慧財產權,如需轉載請註明來源:《看》雜誌 第245期)謝謝!