只有條件GAN才能穩定訓練？對抗+自監督的無監督方法了解一下

新聞 01-02

針對 GAN 在線對抗訓練時出現的不穩定性問題，來自 UCLA 與谷歌大腦的研究者提出了對抗訓練+自監督訓練的新訓練方法。該方法是無監督的，不需要標記數據，但可以達到和條件 GAN 相當的訓練穩定性，同時 ImageNet 生成質量可以達到 FID33（這是在 ImageNet 上無條件訓練獲得的最佳結果。）。該研究入選了 NeurIPS 2018 Workshop。

生成對抗網路（GAN）是一類無監督的生成模型 [1]。GAN 涉及對抗地訓練生成器和鑒別器模型，使得生成器可以從期望的數據分布中生成樣本。訓練 GAN 具有挑戰性，因為它涉及在高維參數空間中搜索非凸博弈的納什均衡。在實踐中，GAN 通常使用交替的隨機梯度下降進行訓練，這通常是不穩定的並且缺乏理論保證 [2]。因此，訓練可能表現出不穩定性、發散、循環行為或模式崩潰 [3]。為此，人們提出了許多穩定 GAN 訓練的技術 [4,5,6,7,8,9,10]。導致訓練不穩定的主要原因是生成器和鑒別器在非靜態環境中學習。因為鑒別器是一種分類器，其中一類（假樣本）的分布隨著生成器在訓練期間改變而改變。

在非穩態在線環境中，神經網路忘記了以前的任務 [11,12,13]。如果鑒別器忘記了先前的分類邊界，則訓練可能變得不穩定或循環。這個問題通常通過重複使用舊樣本或應用連續學習技術來解決 [14,15,16,17,18,19]。在複雜數據集下，這些問題變得更加突出。其中的關鍵技術是條件化 [9,20,21,22]，由此生成器和鑒別器都可以訪問標記數據。可以說，用監督信息增強鑒別器可以鼓勵它學習更穩定的表徵，防止災難性的遺忘。此外，學習每個類的條件模型比學習聯合分布更容易。此設置的主要缺點是標記數據的必要性。即使標記數據可用，它通常也是稀疏的，僅涵蓋數量有限的高級抽象概念。

受上述挑戰的驅使，來自 UCLA 與谷歌大腦的研究者的目標是表明人們可以在不需要標記數據的情況下實現條件化的好處。為了確保鑒別器學習的表徵更穩定和有用，研究者為鑒別器添加輔助的自監督損失。這實現了更穩定的訓練，因為鑒別器表徵對生成器輸出質量的依賴性降低。研究者引入了一種新的模型：自監督的 GAN（self-supervised GAN，SS-GAN），其中生成器和鑒別器在表徵學習的任務上合作，並在生成任務上進行競爭。

本研究的貢獻：研究者提出了一種無監督的生成模型，它將對抗訓練與自監督學習相結合。該模型實現了條件 GAN 的優勢，但不需要標記數據。特別是，在相同的訓練條件下，自監督的 GAN 彌補了無條件和條件模型之間的自然圖像合成的差距。在此設置中，鑒別器表徵的質量大大提高，這在遷移學習中可能會有潛在的應用價值。該模型實現了大規模無條件 ImageNet 圖像生成。研究者認為，這項工作是朝著高質量、完全無監督、自然圖像合成方向邁出的重要一步。