DCGAN:深度卷積生成對抗網路的無監督學習,補全人臉合成圖像匹敵真實照片
新智元編譯
計算機視覺,尤其是人臉識別、生成這塊是最近的熱點。Github 用戶 saikatbsk 做了一個項目,使用深度卷積生成對抗網路進行圖像補完,取得了非常不錯的效果。
右上角是原始圖像,右下角是系統補完的結果
saikatbsk 使用的方法還是藉助了生成對抗網路 GAN 的力量。對抗訓練(Adversarial training)是 Ian Goodfellow 在 NIPS-2014 論文中首次提出的。對抗訓練可以同時訓練兩個神經網路。第一個是判別器,用 D(Y) 表示,判別器接收輸入(例如圖像),並輸出指示圖像 Y 是否「自然」的標量(scalar)。D(Y) 的輸出可以使用 softmax 函數轉換為概率。概率 1 即是假圖像,概率 0 表明判別器鑒定這張圖像是「真實的」。
第二個神經網路則是由 G(Z) 表示的生成器,其中 Z 通常是以簡單分布(例如高斯)隨機抽樣的向量。生成器的作用是產生假圖像,訓練判別器 D(Y) 輸出正確的概率。
在訓練過程中,D會接收一幅真實圖像,並調整參數從而輸出正確的概率。然後,D 會接收一張由生成器 G 生成的圖像。判別器 D 再次調整其參數,讓輸出 D(G(Z))大(遵循預先定義函數的梯度)。但是,G(Z)會不斷訓練自己生成更加自然、真實的圖像,以「騙過」判別器 D。方法是通過對每個生成樣本採用 D w.r.t Y 的梯度來實現。
作者 saikatbsk 使用包含印度演員圖像的數據集訓練網路。下圖展示了他的網路在高性能 GPU 上訓練100,000 步以後,由生成器生成的一些人臉,效果實在一般:
不過,他給出了最終訓練出的成果:
可以看出,結果還是相當不錯的。作者表示他會儘快將具體方法和代碼公布。
此外, 這位 saikatbsk 還嘗試了生成 Pokémon 圖像:
DCGAN:深度卷積生成對抗網路的無監督學習
從 saikatbsk 的介紹里可以看出,他使用的方法應該借鑒了 DCGAN。新智元此前也對 DCGAN 做過報道,下面我們再回顧一下這種強大的方法。
Alec Radford, Luke Metz, Soumith Chintala 在 Github 上詳細介紹了他們提出的 DCGAN,並展示了多幅效果圖。下圖顯示的是經過 5 個階段(epoch)訓練後,系統生成的卧室圖像。可以看出,通過在多個樣本中重複紋理導致了欠擬合(under-fitting)的跡象。
經過5個訓練階段後生成的卧室圖像
下圖展示的是經過一個階段的訓練生成的卧室圖像。據作者介紹,從理論上講,這個模型可以學會記住訓練樣本,但鑒於他們當時在訓練時使用了很小的學習率(learning rate)和小批量的隨機梯度下降(SGD),這實際上是不太可能的。
作者 Alec Radford, Luke Metz, Soumith Chintala 表示,據他們所知,當時還沒有任何事實證據表明在使用 SGD 和小的學習率的情況下,只通過一個階段的訓練模型就記住了樣本。
經過1個訓練階段後生成的卧室圖像
論文:深度卷積生成對抗網路的無監督表示學習
摘要
近年來,使用卷積神經網路(CNN)進行監督學習在計算機視覺領域得到了廣泛的應用。相比之下,使用 CNN 做無監督學習得到的關注較少。在這項工作中,我們希望能夠幫助彌補CNN 在監督學習和無監督學習成功之間的差距。我們提出了一類稱為深度卷積生成對抗網路(DCGAN)的 CNN,DCGAN 具有一定的架構限制,論文展示了 DCGAN 用於無監督學習的巨大潛力。通過在各種圖像數據集上進行訓練,我們在論文中給出了令人信服的證據,證明我們的深度卷積對抗網路在生成器和判別器中學會了從部分物體(object parts)到場景(scenes)的分層表徵。此外,我們將學到的特徵用於新的任務——展示了將其作為通用圖像表徵的適用性。
在人臉上的計算,下面的圖片全部是計算機生成的:
DCGAN 論文地址:https://arxiv.org/pdf/1511.06434.pdf
DCGAN Github 地址:https://github.com/Newmu/dcgan_code
圖像(人臉)補全項目 Github 地址:https://github.com/saikatbsk/ImageCompletion-DCGAN/blob/master/Readme.md
新智元招聘
職位:客戶總監
職位年薪:30 - 60萬(工資+獎金)
工作地點:北京-海淀區
所屬部門:客戶部
彙報對象:COO
下屬人數:8 人
工作年限:5 年
語 言:英語 + 普通話
學歷要求:全日制統招本科
職位描述:
熱愛人工智慧,在行業內有一定的人脈資源和影響力;
為客戶制定媒體關係策略和公關活動策劃,達成客戶的市場或傳播目標;
負責監督公關項目的計劃和實施,使項目能按期在預算內完成;
積極拓展客戶資源,開發公司業務,與既有客戶保持緊密的業務聯絡和溝通;
監督、管理及考核客戶服務團隊,全面提升公司客戶服務質量;
理工科背景優先,有知名企業或知名媒體機構工作經驗者優先。
應聘郵箱:jobs@aiera.com.cn
HR微信:13552313024
新智元歡迎有志之士前來面試,更多招聘崗位請點擊【新智元招聘】查看。


※龍芯發布國產 CPU,單核 SPEC 實測躋身性能最高之列
※ICLR 2017 特稿:谷歌和 Facebook 亮眼表現盤點
※深度揭秘谷歌訓練 AI 隱藏勞力,「機器教練」只不過是廉價臨時工
※MIT 新系統用機器學習實現機器學習,合成數據較好代替真實數據
※騰訊優圖連奪世界冠軍背後:百萬級人臉識別達83%,人眼只有23%|新智元專訪
TAG:新智元 |
※Petuum提出對偶運動生成對抗網路:可合成逼真的視頻未來幀和流
※使用 GAN 網路生成名人照片
※NVIDIA成功研發出可生成逼真肖像照片的AI
※斯坦福AI Lab:除了生成圖像,GAN還可以用來合成基因
※學界 | 三維對抗樣本的生成方法MeshAdv,成功欺騙真實場景中的分類器和目標檢測器
※超越GAN!OpenAI提出可逆生成模型,AI合成超逼真人像
※生成對抗網路GAN簡介
※一文讀懂生成對抗網路GANs
※AI 生成虛擬模特全身照,形象高度逼真
※史上最強圖像生成器BigGAN變身DeepGAN?四倍深度實現更強效果
※ACM MM最佳論文全文:通過多對抗訓練,從圖像生成詩歌
※三維對抗樣本的生成方法MeshAdv,成功欺騙真實場景中的分類器和目標檢測器
※圖像生成方法最新研究:斯坦福聯合谷歌使用圖卷積和GAN從場景圖中生成圖像
※特倫託大學、Inria合作研究:基於GAN生成人體的新姿勢圖像
※DeepMind提出圖形的深度生成式模型,可實現任意圖形的生成
※Nvidia研發出能生成腦癌合成掃描的AI系統
※LSGAN:最小二乘生成對抗網路
※GAN生成「照片級」 emoji!有人將扎克伯格做成了表情包
※學界 | 自動生成高效DNN,適用於邊緣設備的生成合成工具FermiNets
※阿里提出全新風格化自編碼GAN,圖像生成更逼真!