吃大餐或被吃?3大策略掌握AI淘金術
《數位時代》於1999年7月的創刊號當中,有一個〈活氧計畫〉(Oxygen Plan)專題,內容是關於美國麻省理工學院(MIT)的電腦科學實驗室(Lab for Computer Science)提出的一項宏偉實驗:投資五年時間和4千萬美元,將電腦科技大幅推進,能看、能聽、能懂使用者的需求並回應,但不需要使用者費力去學會複雜操作,而是讓電腦科技來服務你,「像氧氣一樣,無所不在、不可或缺、但又感覺不到,達到花更少時間做更多事(Doing more by doing less.)的目的。」
把當年〈活氧計畫〉的八大研究領域拆開來看,就是電腦視覺、機器翻譯、語音辨識、自然語言處理和機器學習等技術,和目前熱門的人工智慧(AI)概念如出一轍。活氧計畫就是1999年的人工智慧計畫,雖然對外說明時幾乎不用AI這個詞,或許和先前1960和1990年代的兩次AI產業泡沫有關,避免外界一聽到AI就覺得又是狼來了。
當時的活氧計畫副主持人舒維都是語音辨識專家,主持建立了一套對話系統,使用者可以打電話進來,用英語詢問天氣、交通路況和航班資料,電腦聽完後會到事先建置好的資料庫中尋找合適答案,再用英語回覆。
為了準確回答當天甚至特定時間的即時詢問,資料庫就必須和氣象局以及各大航空公司連線。要讓這套系統具有商業價值,還必須把其他語言如中文、日語、西班牙語和法語也放進來,而且回答範圍不能只限美國當地的天氣和航班,而是世界主要國家甚至每個國家,但在1999年這麼做成本非常高。
從專家系統到機器學習
AI從2014年捲土重來,到2017年累計三年多,全世界已投入400億美元在相關研究上,是活氧計畫的1千倍,而且還在加碼。
AI這頭狼真地來了,關鍵是大數據(Big data)和機器學習(Machine Learning)這兩項技術的大幅提升。在舒維都的對話系統中,最困難的有兩塊:首先是辨別使用者提出的問題(處理不同口音和模糊語意等等,即便口音和語意通過,如果問的是附近哪裡有星巴克,系統也要判別無法回答或轉給其他相關系統),再來是資料庫中的資料量要大、更新要快,才容易找到合適的答案回覆,這也是人工智慧其他領域的共同難題。
2007年由蘋果iPhone帶動的智慧手機上網、結合2010年應用市場吹起的行動網際網路(Mobile Internet)風潮,提供了大數據來源。
行動上網帶來大數據
智慧手機比起電腦更容易操作,促成更多初次用戶上網以及花更多時間在上頭使用多種功能,而每一項在App和網站上的操作,都會在後台留下紀錄,可再被整理分析,對個別使用者可歸納出使用偏好,而集合大量個別使用者的偏好,再進一步分析可得到對應某種使用行為的模式。
這些上千萬、甚至上億或數十億筆的海量數據,以前不容易產生及取得,現在由世界各地的手機上網者每時每刻都在產生,並主動提供給各種新聞、社交、搜尋引擎和電子商務網站,而他們也善加利用,以改善用戶體驗增加黏著度和再回頭的機率。
當這些經過分析而得到的使用偏好和行為模式,被導引到人工智慧相關研究中,不但充實他們的答案庫,也讓問題識別更容易。
假設詢問天氣的方法有100種,傳統研究方法是釐清這100種並將每一種都給予定義,當詢問產生時,電腦去判定屬於哪一種,並將設定好的相應答案找出。但如果是在這100種以外的詢問方法呢?或者是界於第52種和53種之間的呢?這就有賴大量相關數據的提供,將詢問方法擴大為1千種甚至1萬種,並且以機率統計取代事先設定,在某項詢問無法準確辦識的情況下,按機率判定最有可能是那一種。這牽涉龐大的計算量和新的演算法,在能處理更複雜問題以及提供更準確答案的同時,時間不但不能增加還要縮短。
從0到第100種方法,勉強可以靠專家去設定,當擴大到1千、1萬甚至10萬種方法時,就必須教會電腦自行去設定,從持續輸入的數據中,重複分析並和過往資料比對,自行歸納擴充新的方法,這是機器學習的基本概念,也協助AI從實驗室走進市場。
AI是現在進行式
機場的護照查驗,不再是對照片看人,而是以人臉辨識機器完成;到搜尋引擎上查資料,除了關鍵詞,還可輸入整個句子,結果會根據最貼近的答案依次排列;通訊社用自動寫稿系統來處理簡單或突發的新聞,銀行信用卡部門用人工智慧來審核發卡申請,將流程從三天減為幾分鐘,以及律師事務所用人工智慧來幫忙查詢檔案、會計師事務所用人工智慧協助形成財務報表、加快客戶查帳的時間、以及醫院用人工智慧協助判讀X光片和儀器掃瞄結果,這些都是現在進行式。名單往下列,還有幫忙開車的自動駕駛系統、不需要收銀員的無人超商、按設定自動選股下單買賣的智慧投顧。
近三年來,關於AI的報導和討論愈來愈熱。在剛結束的2017年,全球主要媒體幾乎全做過AI專題,密集到如在這個題目不發聲就不是主流媒體;甚至把AI兩個英文縮寫直接放上封面,或者口語表達時直接說,就像IC、PC和WWW這些常用縮寫,在世界多種語言裡都可直接使用而不用翻譯。AI也如前面三個縮寫所各自代表的積體電路(1950年代末萌芽)、個人電腦(1970年代中開始)和網際網路(1990年代中進入商業用途),在每20年一波的科技新浪朝中,被寄望為這一波的領頭者。
把當年〈活氧計畫〉的八大研究領域拆開來看,就是電腦視覺、機器翻譯、語音辨識、自然語言處理和機器學習等技術,和目前熱門的人工智慧(AI)概念如出一轍。活氧計畫就是1999年的人工智慧計畫,雖然對外說明時幾乎不用AI這個詞,或許和先前1960和1990年代的兩次AI產業泡沫有關,避免外界一聽到AI就覺得又是狼來了。
當時的活氧計畫副主持人舒維都是語音辨識專家,主持建立了一套對話系統,使用者可以打電話進來,用英語詢問天氣、交通路況和航班資料,電腦聽完後會到事先建置好的資料庫中尋找合適答案,再用英語回覆。
為了準確回答當天甚至特定時間的即時詢問,資料庫就必須和氣象局以及各大航空公司連線。要讓這套系統具有商業價值,還必須把其他語言如中文、日語、西班牙語和法語也放進來,而且回答範圍不能只限美國當地的天氣和航班,而是世界主要國家甚至每個國家,但在1999年這麼做成本非常高。
從專家系統到機器學習
AI從2014年捲土重來,到2017年累計三年多,全世界已投入400億美元在相關研究上,是活氧計畫的1千倍,而且還在加碼。
AI這頭狼真地來了,關鍵是大數據(Big data)和機器學習(Machine Learning)這兩項技術的大幅提升。在舒維都的對話系統中,最困難的有兩塊:首先是辨別使用者提出的問題(處理不同口音和模糊語意等等,即便口音和語意通過,如果問的是附近哪裡有星巴克,系統也要判別無法回答或轉給其他相關系統),再來是資料庫中的資料量要大、更新要快,才容易找到合適的答案回覆,這也是人工智慧其他領域的共同難題。
2007年由蘋果iPhone帶動的智慧手機上網、結合2010年應用市場吹起的行動網際網路(Mobile Internet)風潮,提供了大數據來源。
行動上網帶來大數據
智慧手機比起電腦更容易操作,促成更多初次用戶上網以及花更多時間在上頭使用多種功能,而每一項在App和網站上的操作,都會在後台留下紀錄,可再被整理分析,對個別使用者可歸納出使用偏好,而集合大量個別使用者的偏好,再進一步分析可得到對應某種使用行為的模式。
這些上千萬、甚至上億或數十億筆的海量數據,以前不容易產生及取得,現在由世界各地的手機上網者每時每刻都在產生,並主動提供給各種新聞、社交、搜尋引擎和電子商務網站,而他們也善加利用,以改善用戶體驗增加黏著度和再回頭的機率。
當這些經過分析而得到的使用偏好和行為模式,被導引到人工智慧相關研究中,不但充實他們的答案庫,也讓問題識別更容易。
假設詢問天氣的方法有100種,傳統研究方法是釐清這100種並將每一種都給予定義,當詢問產生時,電腦去判定屬於哪一種,並將設定好的相應答案找出。但如果是在這100種以外的詢問方法呢?或者是界於第52種和53種之間的呢?這就有賴大量相關數據的提供,將詢問方法擴大為1千種甚至1萬種,並且以機率統計取代事先設定,在某項詢問無法準確辦識的情況下,按機率判定最有可能是那一種。這牽涉龐大的計算量和新的演算法,在能處理更複雜問題以及提供更準確答案的同時,時間不但不能增加還要縮短。
從0到第100種方法,勉強可以靠專家去設定,當擴大到1千、1萬甚至10萬種方法時,就必須教會電腦自行去設定,從持續輸入的數據中,重複分析並和過往資料比對,自行歸納擴充新的方法,這是機器學習的基本概念,也協助AI從實驗室走進市場。
AI是現在進行式
機場的護照查驗,不再是對照片看人,而是以人臉辨識機器完成;到搜尋引擎上查資料,除了關鍵詞,還可輸入整個句子,結果會根據最貼近的答案依次排列;通訊社用自動寫稿系統來處理簡單或突發的新聞,銀行信用卡部門用人工智慧來審核發卡申請,將流程從三天減為幾分鐘,以及律師事務所用人工智慧來幫忙查詢檔案、會計師事務所用人工智慧協助形成財務報表、加快客戶查帳的時間、以及醫院用人工智慧協助判讀X光片和儀器掃瞄結果,這些都是現在進行式。名單往下列,還有幫忙開車的自動駕駛系統、不需要收銀員的無人超商、按設定自動選股下單買賣的智慧投顧。
近三年來,關於AI的報導和討論愈來愈熱。在剛結束的2017年,全球主要媒體幾乎全做過AI專題,密集到如在這個題目不發聲就不是主流媒體;甚至把AI兩個英文縮寫直接放上封面,或者口語表達時直接說,就像IC、PC和WWW這些常用縮寫,在世界多種語言裡都可直接使用而不用翻譯。AI也如前面三個縮寫所各自代表的積體電路(1950年代末萌芽)、個人電腦(1970年代中開始)和網際網路(1990年代中進入商業用途),在每20年一波的科技新浪朝中,被寄望為這一波的領頭者。