當前位置:
首頁 > 新聞 > CMU試圖統一深度生成模型:搭建GAN和VAE之間的橋樑

CMU試圖統一深度生成模型:搭建GAN和VAE之間的橋樑

選自arXiv

機器之心編譯

參與:吳攀

不同的深度生成模型之間存在怎樣的共性?近日,來自 CMU 和 Petuum 的四位研究者 Zhiting Hu、Zichao Yang、Ruslan Salakhutdinov 和邢波在 arXiv 上發表了一篇論文介紹了他們的研究成果,即構建了 GAN 和 VAE 深度生成建模方法之間的形式聯繫。機器之心對該研究論文進行了摘要介紹,更多詳情請查閱原論文。

論文:關於統一深度生成模型(On Unifying Deep Generative Models)

論文地址:https://arxiv.org/abs/1706.00550

CMU試圖統一深度生成模型:搭建GAN和VAE之間的橋樑

摘要

深度生成模型(deep generative model)近來年已經取得了令人矚目的成功。其中,生成對抗網路(GAN)和變分自編碼器(VAE)這兩種強大的深度生成模型學習框架被普遍認為是兩種不同的範式,並且分別都得到了廣泛的獨立研究。本論文通過對 GAN 和 VAE 的一種新的形式化(formulation)而構建了深度生成建模方法之間的形式聯繫(formal connections)。我們表明,GAN 和 VAE 本質上是分別在相反的方向上使用相反的隱含/可見處理(reversed latent/visible treatments)來最小化 KL 距離,從而延展典型的 wake-sleep 演算法的兩個學習階段。這個統一的視角能提供一種強大的工具,可用於分析各種現有的模型變體,而且可以使得我們以一種基於原理的方式跨研究方向地交換思想。比如說,我們可以將 VAE 文獻中的重要性加權(importance weighting)方法遷移用於提升 GAN 學習,也可使用對抗機制來增強 VAE。定量實驗表明了這種導入的擴展(imported extensions)的通用性和有效性。

3 搭建不同方法之間的橋樑

在 GAN 中,生成模型的訓練方式是通過將生成的樣本傳遞到一個鑒別器,並最小化由該鑒別器所評估得到的誤差。直觀來看,學習上對於假樣本的依賴類似於 wake-sleep 演算法中的睡眠階段(sleep phase)。相反,VAE 通過重構被觀察的真實樣本來訓練其生成模型,這與清醒階段(wake phase)相似。這一節對這些聯繫進行了形式化的探索。

為了便於本論文的呈現和構建符號標記方法,我們首先使用我們提出的形式化對對抗域適應(ADA/Adversarial Domain Adaptation)進行了新的解釋。然後我們表明 GAN 是 ADA 的一種帶有退化的源域(degenerated source domain)的特例,我們還通過對目標(objective)的 KL 距離解釋而揭示了其與 VAE 和 wake-sleep 演算法的緊密關係。表 1 列出了這些方法中每個組件的對應關係。

CMU試圖統一深度生成模型:搭建GAN和VAE之間的橋樑

表 1:在我們提出的形式化方法中,不同方法之間的對應關係

  • 3.1 對抗域適應(ADA)

  • 3.2 生成對抗網路(GAN)

  • 3.3 變分自編碼器(VAE)

  • 3.4 Wake-Sleep 演算法(WS)

4 應用

我們通過我們提出的形式化而建立了 GAN 和 VAE 之間的緊密對應關係,這不僅能讓我們更加深入地理解現有的方法,而且還能讓我們從這兩大類演算法的交織中汲取靈感,從而開發出更強的變體。在這一節,我們通過直接從其它方法導入思想,給出了 GAN 和 VAE 各自的擴展示例。

  • 4.1 重要性加權的生成對抗網路(IWGAN/Importance Weighted GANs)

  • 4.2 對手激活的變分自編碼器(AAVAE/Adversary Activated VAEs)

5 實驗

CMU試圖統一深度生成模型:搭建GAN和VAE之間的橋樑

表 2:左:vanilla GAN 及其重要性加權的擴展的 Inception 分數。中:class-conditional GAN 及其 IW 擴展的生成的分類準確度。右:半監督 VAE 及其對手激活的變體在 MNIST 測試集上的分類準確度,使用了不同大小的真實標註的訓練樣本。

CMU試圖統一深度生成模型:搭建GAN和VAE之間的橋樑

圖 1:在 MNIST 測試集上的下限值。X 軸表示用於學習的訓練數據的比例(0.01、0.1 和 1)。Y 軸表示下限值。實線表示基礎模型;虛線表示對手激活的模型。左:VAE vs. AA-VAE;中:CVAE vs. AA-CVAE;右:SVAE vs. AA-SVAE,其中剩餘的訓練數據被用作無監督數據。

CMU試圖統一深度生成模型:搭建GAN和VAE之間的橋樑

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

實驗研究工作流程詳解:如何把你的機器學習想法變成現實
瀏覽器最快的DNN執行框架WebDNN:從基本特性到性能測評
《人工智慧與遊戲》發行初版:從三個方面概述遊戲人工智慧
ACL 2017 傑出論文公布,國內五篇論文入選(附解讀)

TAG:機器之心 |

您可能感興趣

PHP 生成 CSV 文件
「乾貨」IJCAI:深入淺出講解深度生成模型(115 PPT)
黑白草圖就能生成2K視頻?NVIDIA超狂AI模型了解一下
TreeGAN:為序列生成任務構建有句法意識的GAN
超越BigGAN,DeepMind提出「史上最強非GAN生成器」VQ-VAE-2
學界 | TreeGAN:為序列生成任務構建有句法意識的GAN
LSGAN:最小二乘生成對抗網路
「史上最強GAN圖像生成器」BigGAN的demo出了!
在VR中模擬嗅覺?深度解析氣味生成裝置VAQSO VR
結合通用和專用NMT的優勢,CMU為NMT引入「語境參數生成器」
AI 造圖新境界!OpenAI 提出的可逆生成模型,比 GAN 更具潛力?
下一個GAN?OpenAI提出可逆生成模型Glow
Chatito-使用簡單的DSL為AI聊天機器人、NLP任務、命名實體識別或文本分類模型生成數據集
谷歌NeurIPS 2018論文:GAN生成3D模型,圖像自帶逼真效果
五五開穢土轉生成功?盧本偉成功報名CSGO的DH大師賽!
CVPR 2019:微軟最新提出ObjGAN,輸入一句話秒生成圖片
FOTS JAPAN《關於我轉生成為史萊姆的那件事》米莉姆
超越GAN!OpenAI提出可逆生成模型,AI合成超逼真人像
DeepMind把GAN玩出新花樣!基於BigGAN,生成高保真視頻
前端利器!讓AI根據手繪原型生成HTML