【2018關鍵趨勢3:GANs生成對抗網路】超夯深度學習的新焦點,資料不夠多的場景靠GANs有解!



生醫科技公司Insilico Medicine採用生成對抗網路構建藥物分子,用於研發新藥,有別於過去要靠不斷試驗,來找到新的分子化合物結構方法,GANs則是透過2個神經網路交互學習的機制,找出分子化合物結構的新方法,大幅地減少訓練過程所需的時間和耗材成本(圖片來源/Insilico Medicine)。

「對抗學習(Adversarial training)不單純只是一個技術,它開啟了另一扇新世界的大門!」說到深度學習領域可能的突破,深度學習三大巨頭之一、現任為臉書AI研究院院長的Yann LeCun,就曾於2016年,在美國知識問答網站Quora上的一篇貼文表示,「對抗學習是人類有史以來最酷的事,」他認為,對抗學習是過去10年來,機器學習領域中最有趣的想法。

談到AI,大家熟知機器學習、深度學習等名詞,但是對於Yann LeCun特別看重的「對抗學習」較為陌生,因其後來常用於是訓練電腦自動生成擬真的圖像,來創造圖片或是生成語音和文字,也因此對抗學習後來逐漸被稱為生成對抗網路(Generative Adversarial Networks,簡稱GANs)。

在GANs中進行對抗學習模型的訓練時,要建立生成器(Generator)和判別器(Discriminator)這2套不同用途的神經網路,這2個網路是相互競爭的關係,生成器隨機地從訓練集中挑選真實數據和雜訊(Random Noise),來產生新的訓練樣本,判別器再用與真實數據比對的方式,判斷出數據的真實性,如此一來,生成器與判別器可以交互學習,自動優化預測能力,創造最佳的預測模型,有機會在減少人類協助下,打造出學習更多知識的系統。

Yann LeCun解釋,GANs最有趣的是,生成器可以被視為對應真實數據參數化的複雜表面,給予神經網路一個向量,可以映像到數據流形(Data manifold)上的一個點,如此一來,人們可以用這個方法,實現一些很驚人的事,他舉例,在向量空間中運算臉部特徵,戴眼鏡的男人減去沒戴眼鏡的男人,再加上沒戴眼鏡的女人,可以得到戴眼鏡的女人。

GANs不再只是學術研究,開始走入企業

對抗訓練的概念自2014年被Ian Goodfellow等人提出後,在學術界開始陸續有不少成果和研究,像是臉書AI研究院訓練出會談判的AI,以及Google Brain訓練了自動加密AI等研究,不過2017年,GANs開始走向業界的應用中,GANs不再只是學術上的研究,打破以往深度學習需要大量資料和既定結果的局限,為未知的應用創造出無限可能性。

不管是在學界或是業界,使用真實資料來訓練模型成本都非常昂貴,需上經過人工標示和挑選,加上有些場景缺乏資料或是不容易取得,使得訓練模型的過程困難重重,生成對抗網路則巧妙地運用生成器與判別器互相學習的機制,解決了這項難題。

蘋果近日發布的第一篇AI論文即獻給了生成對抗網路,研究團隊在該論文中展示,透過改良過的生成對抗網路,在完全無人工對圖片標記的前提下,成功訓練出了一個網路,蘋果稱之為Refiner,讓電腦能夠生成出更接近真實的合成照片(Synthetic image),來降低標示訓練圖像識別樣本的成本,且訓練出來的成果,與用真實世界的圖片訓練相當。

Nvidia也透過生成對抗網路將白天的街景圖像,轉為夜晚的圖像,當作自駕車的訓練樣本,解決了夜晚街景圖像資料不足的問題。甚至,Nvidia旗下生醫策略合作夥伴生醫科技公司Insilico Medicine也採用生成對抗網路構建藥物分子,用於研發新藥。

Insilico Medicine的創辦人Alex Zhavoronkov日前也在臺一場公開演講表示,GANs不需要靠不斷試驗來找到新的分子結構方法,而是可以透過2個神經網路交互學習的機制,找出分子化合物結構的新方法,大幅地減少訓練過程所需的時間和耗材成本。

專注於GANs研究的臺大電機系助理教授李宏毅也曾在演講中表示,GANs是深度學習的下一個熱點,在機器學習領域中回歸 (Regression) 是要電腦輸出數值,分類(Classification)則是輸出類別,這兩項任務的解法,大家已經不陌生,但是有一類的問題,是要電腦輸出有結構的結果,像是一個序列(Sequence)、圖片、語句、矩陣、圖表或是樹狀結構等,要如何讓電腦更進一步創造出有結構的複雜物件,目前仍是一大挑戰。

《全文請見iThome(https://www.ithome.com.tw/news/120019)》