理解人類語言成為AI突破關鍵,下一步是小數據人工智慧



IBM全球副總裁暨Watson首席技術長Robert High(攝影/洪政偉)。

說到今年最火紅的技術名詞,一定會有AI一詞的身影,各家廠商和企業紛紛推出自家的AI解決方案,或是宣稱採用了AI技術,讓自家產品變得更加聰明,甚至將機器學習、深度學習、電腦視覺、自然語言處理等技術,通通混為一談,統稱為AI技術,不過,「現實是很多廠商提供的AI技術,並不是真的AI!」掌管IBM所有核心認知系統服務技術的全球副總裁暨Watson首席技術長Robert High提醒。

Robert High指出,他習慣將AI稱之為Augmented Intelligence(擴增智慧),而非人工智慧,AI技術依照功能性分為兩類,第一類是基本的認知技術(Foundational cognitive skills),另一種則是較高階的推論技術 (Prior reasoning skills),基本的認知技術大部分都是辨識類的技術,包含語言、語音、視覺和Empathy辨識,而高階的推論技術涵蓋對話和知識探索 (Discovery),以及對比式分析(Comparing analysis)。

依照他的判斷,許多廠商所謂的AI技術,其實是一些「簡單的」辨識型任務,像是語音、影像、文字,以及語意辨識等,並不算是真正的AI技術,Robert High認為,真正的AI技術,需要藉由基本的辨識,發展出推論(Reasoning)的能力,推論的運作是一種歸納(Inductive)過程,但是,並非只是簡單地將事物分類,而是要了解其他潛在的可能性,理解出未被發掘的相關的訊息。

因此,「實現複製人腦運作的AI,並不是永遠都有用。」Robert High指出,人類對事物的理解,並不是來自腦袋的運作,而是從生活中的經驗學習而來的,他以數學為例,人類理解數學原理,但針對醫療、金融等特定問題,需要什麼樣的數學方程式來解決問題,如何歸納出抽象規則,是需要經驗推理,而這個推論就像是AI推論的過程一樣。

AI技術一躍而起的關鍵是能真正理解人類語言

但是AI到底要怎麼理解人類的問題,進而衍生出推理的能力?Robert High表示,AI技術的概念已經存在數10個年頭了,卻一直沒有適當的用途,也無法符合人類期望的結果,不過,近來,AI之所以能夠突破,從實驗室走到業界,開始成為企業能採用的技術,「關鍵在於AI能夠真正理解人類的語言!」Robert High解釋,過去的AI依賴規則或是語義的知識本體(Semantic ontology)來了解人類語言,但是,現在科學家更專注於用語言學(Linguistics)來了解語義,於是,AI才開始能在不同的場景,發揮功用,「這是最根本的改變!」他說。

用語言學的概念來設計AI系統,Robert High指出,最大的不同在於,能夠真正了解人類說話的邏輯,AI並不是只有研究單詞,而是研究人類怎麼將這些單字組合在一起,變成一個語意模式(Pattern of meaning),包括哪些單詞常會組合在一起、單詞之間的距離、標點符號的用法等語言學的屬性。

他進一步解釋,人類了解對方的話語,並非在腦中默記一本厚重的字典,找尋每個單字的意思,再把每個字的意思拼湊在一起,來理解對方講話的意思,而是人類的腦已經被訓練成能夠了解語意模式和語言的特性,即使文法不正確,或是字句並非字面上的意思,對方都能夠理解。

另外,Robert High還表示,人類的語言還用了許多比喻法,只是就連人類自己都沒有察覺,舉例來說,英文中常用的「Back」一詞,最原始的意思是人體的背部,之後這個詞即是用了背部在人體後面的比喻,而衍生出許多不同的用法,不管是語意模式或是比喻的用法,這些語言學的特性,都讓AI有了很大的突破,尤其是對話式AI系統。

AI目前最成熟的2大應用領域

AI對語言理解的突破,讓對話型的AI系統能夠在企業的實際案例中,有不錯的成果,「對話系統是擴增智慧很好的展現!」Robert High認為,對話互動的過程中,不只可以辨識用戶的情緒、人格特質,還能用對話系統,來驅動對話變成對企業更有意義、更有價值的系統。人類會因為偏見或是既有的習慣,無法跳脫看待事物的慣性,有時藉由對話系統,或許能帶給企業不同的啟發。

除了對話系統之外,另外一個比較成熟的應用則是知識探索(Discovery),Robert High指出,大多數的企業內部都有許多檔案庫存放著企業的知識資產,但是,往往遇到問題時,人類沒有足夠的時間從眾多資訊中,翻找出該問題的解決答案,知識探索型AI則可以根據當下的問題,從知識庫中尋找最合適的答案,有時或許還會給予未預期的回覆,讓使用者從不同的角度來看待問題。

企業該如何選擇AI技術?又該怎麼開始開發AI應用?

Robert High認為,對話型AI和知識探索型AI在企業中是比較成熟的兩大應用,但是還沒開始導入AI應用的企業,又要如何開始?「我認為企業要解決的問題,和技術之間是有很強烈的關聯,」首先,對企業的IT團隊來說,要先快速地研究一下目前AI相關可用的技術,市面上有許多廠商提供的解決方案,甚至是已經有些針對不同產業需求訂製的解決方案,還有一些第三方服務,或是企業也可以自行建立AI演算法打造應用。

依照Robert High觀察,目前企業比較常見的場景是客服中心和知識管理,企業如果是要解決基礎的客服中心支援或是銷售等問題,就能夠用對話式AI的技術,如果想要更進一步,在企業既有的文件檔案中,找到解決問題的答案,則可以加入知識探索AI,只要依照企業需要的場景,選擇適合自家的AI技術並不難,如果企業適用的場景非前兩者,企業則可以從比較底層的認知系統技術開始,像是一些辨識的系統,來組合出企業需要的功能。

企業選定好需要解決問題的場景與技術之後,才可以開始部署AI技術的工作,以對話式系統為例,Robert High提倡簡單又快速地開始,第一階段,企業可以先從辨識10個對話的意圖開始,通常在幾周內就能部署好對話式系統,接著企業可以再多加入更多新意圖。

接下來,企業就需要花點時間來整合後端的服務,了解企業內部有什麼樣的交易系統可以與對話式系統介接,並且思考在什麼樣的情況下,需要由AI客服轉真人客服,除此之外,企業還能更進階,設計與客戶社交互動的頻率,保持與客戶的交流。最後,對話系統經由每一次與客戶的互動,不斷重複改進,設計出更好的對話系統,維繫客戶與企業的關係。

IBM全球副總裁暨Watson首席技術長Robert High表示,AI能理解人類語言才真正崛起,未來AI系統所需的訓練資料將會變得更少(攝影/洪政偉)。


Watson面臨的挑戰

他也以自家Watson為例,來談AI在企業應用上的挑戰,即便現階段Watson已有企業真實應用場景,Robert High也坦言,Watson還是面臨技術和業務上的挑戰,他指出,IBM並沒有聚焦在發展特定一個AI的技術上,而是將整體的目標放在擴增人類的認知,最重要的原則就是要能夠幫助業務,尤其是商業的決策,或是企業和客戶、員工、合作夥伴互動的過程,都能夠因為AI有所幫助,協助企業處理業務上的問題,就連隱藏的問題,也能讓企業藉由AI更了解企業的資訊,找到解決問題的方法。

以技術上來說,目前Watson面臨的挑戰就是訓練所需的資料量,這也是目前IBM持續努力的方向,希望可以找到一個方法,將所需的訊訓練的資料量減到最少,目前Watson能用5個例句訓練出1個意圖,「但是我們希望還可以更少!」若能用更少資料量完成訓練,將能夠擴大AI系統運用的範圍,企業也不需要在採用時,花費太多時間來訓練。

從業務面來看,對話AI系統的挑戰是如何真正幫助人類理解,什麼樣的意圖和例句才是最具有代表性的,也就是說,企業在訓練AI對話系統時,應該要給予系統什麼樣的例句才是理想的,因為使用者和該領域的專家表達的方式截然不同,企業要如何了解這些差距,也是挑戰之一,並且還要建立出一套人類真正對話的流程,是非常具有挑戰性的,Robert High也表示,這方面的困難,Watson也尚未解決。

IT界Help desk與網路安全影響最大,AI將顛覆所有產業

身處在IT界長達36年的Robert High觀察,AI近來的崛起, Help desk與網路安全受到的影響最大,企業可以用AI技術,來處理Help desk的工作,Help desk的工作其實跟客服類似,使用者的資訊系統有問題,就會打電話請相關的IT人員處理,排除問題的過程也有一套可循的規則,因此,多數的Help desk工作都能用AI來解決。

另一方面,Robert High認為,網路安全的偵測AI已經開始產生巨大的轉變,像是威脅的偵測、威脅回應(Threat response)都能夠透過AI來處理,由於現在網路威脅層出不窮,AI系統可以幫助辨識惡意軟體,並且找到最好的防禦方式,且大多數的威脅與人的行為有關,會有一些固定的攻擊的來源、路徑,以及手法,駭客可能在社群媒體上有溝通和交流的記錄,AI系統可以協助偵測惡意軟體的攻擊跡象。

「每一個只有有人的產業都會被AI顛覆!」Robert High解釋,每個需要人來從事的任務,都能夠透過AI有更好的表現,舉例來說,AI提供相關的知識,可以讓人類了解到事情更多的面向,甚至是一些以前可能不了解的面向,從比較大的面向來看,像是企業應該要做什麼樣的投資,到非常小的面向,像是每天執行的活動該如何進行,都可以受到AI的輔助。

AI下一個突破是用更少資料來訓練

未來,Robert High認為,AI的下一步是小數據人工智慧,也就是用更少的資料就能完成AI系統的訓練,前陣子DeepMind 釋出不需要學習人類下棋,擁有自學能力的AlphaGo Zero,讓許多人認為AI是否已經具備自學能力,只需要少量的資料就能完成訓練,「答案是不行!」Robert High解釋,AlphaGo Zero採用的增強式學習(Reinforcement learning)只適用於解決的問題,結果是非常精確且絕對的。

因此,遊戲就是強化式學習非常理想的應用案例,因為遊戲並沒有任何輸贏的不確定性,規則也非常的精準,強化式學習就可以讓系統與自己練習上百次、上千次,來理解出一套模式,最後贏得比賽。

《全文請見iThome(https://www.ithome.com.tw/people/118225)》