深入淺出：GAN原理與應用入門介紹

知識 08-23

選自StatsBot

作者：Anton Karazeev

機器之心編譯

參與：乾樹、黃小天

生成對抗網路（GAN）是一類在無監督學習中使用的神經網路，其有助於解決按文本生成圖像、提高圖片解析度、藥物匹配、檢索特定模式的圖片等任務。Statsbot 小組邀請數據科學家 Anton Karazeev 通過日常生活實例深入淺出地介紹 GAN 原理及其應用。

生成對抗網路由 Ian Goodfellow 於 2014 年提出。GAN 不是神經網路應用在無監督學習中的唯一途徑，還有玻爾茲曼機（Geoffrey Hinton 和 Terry Sejnowski，1985）和自動解碼器（Dana H. Ballard，1987）。三者皆致力於通過學習恆等函數 f（x）= x 從數據中提取特徵，且都依賴馬爾可夫鏈來訓練或生成樣本。

GAN 設計之初衷就是避免使用馬爾可夫鏈，因為後者的計算成本很高。相對於玻爾茲曼機的另一個優點是 GAN 的限制要少得多（只有幾個概率分布適用於馬爾可夫鏈抽樣）。

在本文中，我們將講述 GAN 的基本原理及最流行的現實應用。

GAN 原理

讓我們用一個比喻解釋 GAN 的原理吧。

假設你想買塊好表。但是從未買過表的你很可能難辨真假；買表的經驗可以免被奸商欺騙。當你開始將大多數手錶標記為假表（當然是被騙之後），賣家將開始「生產」更逼真的山寨表。這個例子形象地解釋了 GAN 的基本原理：判別器網路（手錶買家）和生成器網路（生產假表的賣家）。

兩個網路相互博弈。GAN 允許生成逼真的物體（例如圖像）。生成器出於壓力被迫生成看似真實的樣本，判別器學習分辨生成樣本和真實樣本。

判別演算法和生成演算法有何不同？簡單地說：判別演算法學習類之間的邊界（如判別器做的那樣），而生成演算法學習類的分布（如生成器做的那樣）。

如果你準備深入了解 GAN

想要學習生成器的分布，應該定義數據 x 的參數 p_g，以及輸入雜訊變數 p_z（z）的分布。然後 G（z，θ_g）將 z 從潛在空間 Z 映射到數據空間，D（x，θ_d）輸出單個標量——一個 x 來自真實數據而不是 p_g 的概率。

訓練判別器以最大化正確標註實際數據和生成樣本的概率。訓練生成器用於最小化 log（1-D（G（z）））。換句話說，盡量減少判別器得出正確答案的概率。

可以將這樣的訓練任務看作具有值函數 V（G，D）的極大極小博弈：

換句話說，生成器努力生成判別器難以辨認的圖像，判別器也愈加聰明，以免被生成器欺騙。

「對抗訓練是繼切片麵包之後最酷的事情。」- Yann LeCun

當判別器不能區分 p_g 和 p_data，即 D（x，θ_d）= 1/2 時，訓練過程停止。達成生成器與判別器之間判定誤差的平衡。

歷史檔案圖像檢索

一個有趣的 GAN 應用實例是在「Prize Papers」中檢索相似標記，Prize Papers 是海洋史上最具價值的檔案之一。對抗網路使得處理這些具有歷史意義的文件更加容易，這些文件還包括海上扣留船隻是否合法的信息。

每個查詢到的記錄都包含商家標記的樣例——商家屬性的唯一標識，類似於象形文字的草圖樣符號。

我們應該獲得每個標記的特徵表示，但是應用常規機器學習和深度學習方法（包括卷積神經網路）存在一些問題：

它們需要大量標註圖像；

商標沒有標註；

標記無法從數據集分割出去。

這種新方法顯示了如何使用 GAN 從商標的圖像中提取和學習特徵。在學習每個標記的表徵之後，就可以在掃描文檔上按圖形搜索。

將文本翻譯成圖像

其他研究人員表明，使用自然語言的描述屬性生成相應的圖像是可行的。文本轉換成圖像的方法可以說明生成模型模擬真實數據樣本的性能。

圖片生成的主要問題在於圖像分布是多模態的。例如，有太多的例子完美契合文本描述的內容。GAN 有助於解決這一問題。

我們來考慮以下任務：將藍色輸入點映射到綠色輸出點（綠點可能是藍點的輸出）。這個紅色箭頭表示預測的誤差，也意味著經過一段時間後，藍點將被映射到綠點的平均值——這一精確映射將會模糊我們試圖預測的圖像。

GAN 不直接使用輸入和輸出對。相反，它們學習如何給輸入和輸出配對。

下面是從文本描述中生成圖像的示例：

用於訓練 GAN 的數據集：

Caltech-UCSD-200-2011 是一個具有 200 種鳥類照片、總數為 11,788 的圖像數據集。

Oxford-102 花數據集由 102 個花的類別組成，每個類別包含 40 到 258 張圖片不等。

藥物匹配

當其它研究員應用 GAN 處理圖片和視頻時，Insilico Medicine 的研究人員提出了一種運用 GAN 進行藥物匹配的方法。

我們的目標是訓練生成器，以儘可能精確地從一個藥物資料庫中對現有藥物進行按病取葯的操作。

經過訓練後，可以使用生成器獲得一種以前不可治癒的疾病的藥方，並使用判別器確定生成的藥方是否治癒了特定疾病。

腫瘤分子生物學的應用

Insilico Medicine 另一個研究表明，產生一組按參數定義的新抗癌分子的管道。其目的是預測具有抗癌作用的藥物反應和化合物。

研究人員提出了一個基於現有生化數據的用於識別和生成新化合物的對抗自編碼器（AAE）模型。

「據我們所知，這是 GAN 技術在挖掘癌症藥物領域的首個應用。」- 研究人員說。

資料庫中有許多可用的生物化學數據，如癌細胞系百科全書（CCLE）、腫瘤藥物敏感基因學（GDSC）和 NCI-60 癌細胞系。所有這些都包含針對癌症的不同藥物實驗的篩選數據。

對抗自編碼器以藥物濃度和指紋作為輸入並使用生長抑制率數據進行訓練（GI，顯示治療後癌細胞的數量減少情況）。

分子指紋在計算機中有一個固定的位數表示，每一位代表某些特徵的保留狀態。

隱藏層由 5 個神經元組成，其中一個負責 GI（癌細胞抑制率），另外 4 個由正態分布判別。因此，一個回歸項被添加到編碼器代價函數中。此外，編碼器只能將相同的指紋映射到相同的潛在向量，這一過程獨立於通過額外的流形代價集中輸入。

經過訓練，網路可以從期望的分布中生成分子，並使用 GI 神經元作為輸出化合物的微調器。

這項工作的成果如下：已訓練 AAE 模型預測得到的化合物已被證明是抗癌藥物，和需接受抗癌活性化合物實驗驗證的新藥物。

「我們的研究結果表明，本文提出的 AAE 模型使用深度生成模型顯著提高了特定抗癌能力和新分子的開發效率。」

結論

無監督學習是人工智慧的下一個藍海，我們正朝著這一方向邁進。

生成對抗網路可以應用於許多領域，從生成圖像到預測藥物，所以不要害怕失敗。我們相信 GAN 有助於建立一個更好的機器學習的未來。

點擊展開全文

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

※頂級孵化器 YC 夏季路演開場，人工智慧創業公司有這些亮點
※IJCAI 2017四大論文獎項揭曉：牛津大學獲最佳傑出論文
※從藥物的研發到商業化，這家創業公司想用AI提速醫學界效率
※DeeCamp一期結束後，專訪創新工場人工智慧工程院

TAG:機器之心 |

您可能感興趣

※從To C到To B，VR行業應用開始進入深水區
※?從To C到To B，VR行業應用開始進入深水區
※帶我們去探索宇宙 NASA推出VR太空應用
※SNDBOX：應用AI進行惡意軟體分析
※NVIDIA為AI應用推出HGX-2超算
※你的應用如何進入VR市場？
※入門｜從原理到應用：簡述Logistic回歸演算法
※智東西早報：谷歌AI語音客服投入應用 Facebook被曝將入華
※LG 利用 AI 減少 VR 畫面延遲問題；IBM 發布「AI＋區塊鏈」應用即將用於鑽石供應鏈
※SGX和MAS已成功測試區塊鏈技術在資產清算中的應用
※基於AI演算法 Adobe推出VR數據體驗應用
※5G將促進VR/AR技術在娛樂行業的應用
※MACOM和意法半導體將硅上氮化鎵推入主流射頻市場和應用
※高通擴展嵌入式計算產品組合將頂級處理器帶入先進IoT應用
※深度解讀物聯網NB-IoT與LoRa技術在門禁領域的應用
※小米MIUI開發版本周更新內容：應用管理增加了應用卸載入口
※人民網：VR技術及其新聞應用前景深入探討
※AMD推出首款7nm製程GPU，應用於AI、雲計算等領域
※微軟打算深耕ARM，推出針對ARM應用程序的64位SDK，開發者會來嗎？
※DHCP的原理與應用