CMU試圖統一深度生成模型：搭建GAN和VAE之間的橋樑

新聞 06-05

選自arXiv

機器之心編譯

參與：吳攀

不同的深度生成模型之間存在怎樣的共性？近日，來自 CMU 和 Petuum 的四位研究者 Zhiting Hu、Zichao Yang、Ruslan Salakhutdinov 和邢波在 arXiv 上發表了一篇論文介紹了他們的研究成果，即構建了 GAN 和 VAE 深度生成建模方法之間的形式聯繫。機器之心對該研究論文進行了摘要介紹，更多詳情請查閱原論文。

論文：關於統一深度生成模型（On Unifying Deep Generative Models）

論文地址：https://arxiv.org/abs/1706.00550

CMU試圖統一深度生成模型：搭建GAN和VAE之間的橋樑

摘要

深度生成模型（deep generative model）近來年已經取得了令人矚目的成功。其中，生成對抗網路（GAN）和變分自編碼器（VAE）這兩種強大的深度生成模型學習框架被普遍認為是兩種不同的範式，並且分別都得到了廣泛的獨立研究。本論文通過對 GAN 和 VAE 的一種新的形式化（formulation）而構建了深度生成建模方法之間的形式聯繫（formal connections）。我們表明，GAN 和 VAE 本質上是分別在相反的方向上使用相反的隱含/可見處理（reversed latent/visible treatments）來最小化 KL 距離，從而延展典型的 wake-sleep 演算法的兩個學習階段。這個統一的視角能提供一種強大的工具，可用於分析各種現有的模型變體，而且可以使得我們以一種基於原理的方式跨研究方向地交換思想。比如說，我們可以將 VAE 文獻中的重要性加權（importance weighting）方法遷移用於提升 GAN 學習，也可使用對抗機制來增強 VAE。定量實驗表明了這種導入的擴展（imported extensions）的通用性和有效性。

3 搭建不同方法之間的橋樑

在 GAN 中，生成模型的訓練方式是通過將生成的樣本傳遞到一個鑒別器，並最小化由該鑒別器所評估得到的誤差。直觀來看，學習上對於假樣本的依賴類似於 wake-sleep 演算法中的睡眠階段（sleep phase）。相反，VAE 通過重構被觀察的真實樣本來訓練其生成模型，這與清醒階段（wake phase）相似。這一節對這些聯繫進行了形式化的探索。

為了便於本論文的呈現和構建符號標記方法，我們首先使用我們提出的形式化對對抗域適應（ADA/Adversarial Domain Adaptation）進行了新的解釋。然後我們表明 GAN 是 ADA 的一種帶有退化的源域（degenerated source domain）的特例，我們還通過對目標（objective）的 KL 距離解釋而揭示了其與 VAE 和 wake-sleep 演算法的緊密關係。表 1 列出了這些方法中每個組件的對應關係。

CMU試圖統一深度生成模型：搭建GAN和VAE之間的橋樑

表 1：在我們提出的形式化方法中，不同方法之間的對應關係

3.1 對抗域適應（ADA）
3.2 生成對抗網路（GAN）
3.3 變分自編碼器（VAE）
3.4 Wake-Sleep 演算法（WS）

4 應用

我們通過我們提出的形式化而建立了 GAN 和 VAE 之間的緊密對應關係，這不僅能讓我們更加深入地理解現有的方法，而且還能讓我們從這兩大類演算法的交織中汲取靈感，從而開發出更強的變體。在這一節，我們通過直接從其它方法導入思想，給出了 GAN 和 VAE 各自的擴展示例。

4.1 重要性加權的生成對抗網路（IWGAN/Importance Weighted GANs）
4.2 對手激活的變分自編碼器（AAVAE/Adversary Activated VAEs）

5 實驗

CMU試圖統一深度生成模型：搭建GAN和VAE之間的橋樑

表 2：左：vanilla GAN 及其重要性加權的擴展的 Inception 分數。中：class-conditional GAN 及其 IW 擴展的生成的分類準確度。右：半監督 VAE 及其對手激活的變體在 MNIST 測試集上的分類準確度，使用了不同大小的真實標註的訓練樣本。

CMU試圖統一深度生成模型：搭建GAN和VAE之間的橋樑

圖 1：在 MNIST 測試集上的下限值。X 軸表示用於學習的訓練數據的比例（0.01、0.1 和 1）。Y 軸表示下限值。實線表示基礎模型；虛線表示對手激活的模型。左：VAE vs. AA-VAE；中：CVAE vs. AA-CVAE；右：SVAE vs. AA-SVAE，其中剩餘的訓練數據被用作無監督數據。

CMU試圖統一深度生成模型：搭建GAN和VAE之間的橋樑

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

※實驗研究工作流程詳解：如何把你的機器學習想法變成現實
※瀏覽器最快的DNN執行框架WebDNN：從基本特性到性能測評
※《人工智慧與遊戲》發行初版：從三個方面概述遊戲人工智慧
※ACL 2017 傑出論文公布，國內五篇論文入選（附解讀）

TAG:機器之心 |

您可能感興趣

※PHP 生成 CSV 文件
※「乾貨」IJCAI：深入淺出講解深度生成模型（115 PPT）
※黑白草圖就能生成2K視頻？NVIDIA超狂AI模型了解一下
※TreeGAN：為序列生成任務構建有句法意識的GAN
※超越BigGAN，DeepMind提出「史上最強非GAN生成器」VQ-VAE-2
※學界 | TreeGAN：為序列生成任務構建有句法意識的GAN
※LSGAN：最小二乘生成對抗網路
※「史上最強GAN圖像生成器」BigGAN的demo出了！
※在VR中模擬嗅覺？深度解析氣味生成裝置VAQSO VR
※結合通用和專用NMT的優勢，CMU為NMT引入「語境參數生成器」
※AI 造圖新境界！OpenAI 提出的可逆生成模型，比 GAN 更具潛力？
※下一個GAN？OpenAI提出可逆生成模型Glow
※Chatito-使用簡單的DSL為AI聊天機器人、NLP任務、命名實體識別或文本分類模型生成數據集
※谷歌NeurIPS 2018論文：GAN生成3D模型，圖像自帶逼真效果
※五五開穢土轉生成功？盧本偉成功報名CSGO的DH大師賽！
※CVPR 2019：微軟最新提出ObjGAN，輸入一句話秒生成圖片
※FOTS JAPAN《關於我轉生成為史萊姆的那件事》米莉姆
※超越GAN！OpenAI提出可逆生成模型，AI合成超逼真人像
※DeepMind把GAN玩出新花樣！基於BigGAN，生成高保真視頻
※前端利器！讓AI根據手繪原型生成HTML