【2018關鍵趨勢3：GANs生成對抗網路】超夯深度學習的新焦點，資料不夠多的場景靠GANs有解！

生醫科技公司Insilico Medicine採用生成對抗網路構建藥物分子，用於研發新藥，有別於過去要靠不斷試驗，來找到新的分子化合物結構方法，GANs則是透過2個神經網路交互學習的機制，找出分子化合物結構的新方法，大幅地減少訓練過程所需的時間和耗材成本（圖片來源／Insilico Medicine）。

「對抗學習（Adversarial training）不單純只是一個技術，它開啟了另一扇新世界的大門！」說到深度學習領域可能的突破，深度學習三大巨頭之一、現任為臉書AI研究院院長的Yann LeCun，就曾於2016年，在美國知識問答網站Quora上的一篇貼文表示，「對抗學習是人類有史以來最酷的事，」他認為，對抗學習是過去10年來，機器學習領域中最有趣的想法。

談到AI，大家熟知機器學習、深度學習等名詞，但是對於Yann LeCun特別看重的「對抗學習」較為陌生，因其後來常用於是訓練電腦自動生成擬真的圖像，來創造圖片或是生成語音和文字，也因此對抗學習後來逐漸被稱為生成對抗網路（Generative Adversarial Networks，簡稱GANs）。

在GANs中進行對抗學習模型的訓練時，要建立生成器（Generator）和判別器（Discriminator）這2套不同用途的神經網路，這2個網路是相互競爭的關係，生成器隨機地從訓練集中挑選真實數據和雜訊（Random Noise），來產生新的訓練樣本，判別器再用與真實數據比對的方式，判斷出數據的真實性，如此一來，生成器與判別器可以交互學習，自動優化預測能力，創造最佳的預測模型，有機會在減少人類協助下，打造出學習更多知識的系統。

Yann LeCun解釋，GANs最有趣的是，生成器可以被視為對應真實數據參數化的複雜表面，給予神經網路一個向量，可以映像到數據流形（Data manifold）上的一個點，如此一來，人們可以用這個方法，實現一些很驚人的事，他舉例，在向量空間中運算臉部特徵，戴眼鏡的男人減去沒戴眼鏡的男人，再加上沒戴眼鏡的女人，可以得到戴眼鏡的女人。

GANs不再只是學術研究，開始走入企業

對抗訓練的概念自2014年被Ian Goodfellow等人提出後，在學術界開始陸續有不少成果和研究，像是臉書AI研究院訓練出會談判的AI，以及Google Brain訓練了自動加密AI等研究，不過2017年，GANs開始走向業界的應用中，GANs不再只是學術上的研究，打破以往深度學習需要大量資料和既定結果的局限，為未知的應用創造出無限可能性。

不管是在學界或是業界，使用真實資料來訓練模型成本都非常昂貴，需上經過人工標示和挑選，加上有些場景缺乏資料或是不容易取得，使得訓練模型的過程困難重重，生成對抗網路則巧妙地運用生成器與判別器互相學習的機制，解決了這項難題。

蘋果近日發布的第一篇AI論文即獻給了生成對抗網路，研究團隊在該論文中展示，透過改良過的生成對抗網路，在完全無人工對圖片標記的前提下，成功訓練出了一個網路，蘋果稱之為Refiner，讓電腦能夠生成出更接近真實的合成照片（Synthetic image），來降低標示訓練圖像識別樣本的成本，且訓練出來的成果，與用真實世界的圖片訓練相當。

Nvidia也透過生成對抗網路將白天的街景圖像，轉為夜晚的圖像，當作自駕車的訓練樣本，解決了夜晚街景圖像資料不足的問題。甚至，Nvidia旗下生醫策略合作夥伴生醫科技公司Insilico Medicine也採用生成對抗網路構建藥物分子，用於研發新藥。

Insilico Medicine的創辦人Alex Zhavoronkov日前也在臺一場公開演講表示，GANs不需要靠不斷試驗來找到新的分子結構方法，而是可以透過2個神經網路交互學習的機制，找出分子化合物結構的新方法，大幅地減少訓練過程所需的時間和耗材成本。

專注於GANs研究的臺大電機系助理教授李宏毅也曾在演講中表示，GANs是深度學習的下一個熱點，在機器學習領域中回歸 (Regression) 是要電腦輸出數值，分類（Classification）則是輸出類別，這兩項任務的解法，大家已經不陌生，但是有一類的問題，是要電腦輸出有結構的結果，像是一個序列（Sequence）、圖片、語句、矩陣、圖表或是樹狀結構等，要如何讓電腦更進一步創造出有結構的複雜物件，目前仍是一大挑戰。

GANs能夠讓電腦擁有人類常識

因此，GANs即是電腦領悟出結構學習的方法，李宏毅認為，GANs是個非常廣泛的技術，不只是用在生成資料，背後更大的意義是能夠讓電腦了解事物的分布，進而應用於機器翻譯、對話文字生成等較複雜的任務。

這也呼應了Yann LeCun於6月來臺演講中所提及的觀點，他認為目前AI最大的局限即是沒有人類的常識，而要讓電腦擁有人類的常識，就是要用非監督式學習，他特別提及在非監督式中的對抗訓練，是真正能夠讓AI擁有自我學習的能力的方法。

《全文請見iThome（https://www.ithome.com.tw/news/120019）》

更多雜誌 »

週三

週四

【2018關鍵趨勢3：GANs生成對抗網路】超夯深度學習的新焦點，資料不夠多的場景靠GANs有解！