又是GAN！改個TAG，你就能對圖片為所欲為了 | 2分鐘論文

新聞 02-05

這裡是，雷鋒字幕組編譯的 Two Minute Papers專欄，每周帶大家用碎片時間閱覽前沿技術，了解AI領域的最新研究成果。

原標題 High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs

翻譯 | 劉寧校對 | 凡江整理 | 凡江

本期所介紹的內容是——從語義圖上獲得高解析度圖片。語義圖是一幅彩色圖片，圖上的不同色塊代表不同種類物體，如行人、汽車、交通標誌、建築物等。

只需要在輸入的語義圖上修改相應標籤，就能把混凝土路面變成土路，把樹替換成建築等等。

又是GAN！改個TAG，你就能對圖片為所欲為了 | 2分鐘論文

通常，我們採用光線模擬程序或光柵化來產生語義圖。但是AI研究者提出：為什麼我們要使用光柵，而不是編寫一個可以自己合成圖像的學習演算法？

下面的生成對抗網路將一張語義圖作為輸入，並由此生成了一張高解析度的逼真的圖像。之前的技術多數只能生成粗糙的低解析度的圖片，看起來也不真實。而這個研究卻生成了2k乘1k解析度的圖像，已經很接近全高清的照片。

又是GAN！改個TAG，你就能對圖片為所欲為了 | 2分鐘論文

當我們想手動編輯一張真實的照片里的內容時，傳統的方法需要具備Photoshop等專業工具的技能。即使是很簡單的編輯也要耗費大量精力，因為人眼是非常難以欺騙的。而語義圖方法的優點就是，不需要太多專業技能就可以很容易實現編輯。例如，我們可以通過將供選的物體填充到語義標註圖中來控制生成的圖片。

這項技術不僅僅適用於室外交通圖片，它還可以對人臉細節進行編輯。例如，可以用此方法簡單地添加鬍子。把這項技術和之前的pix2pix和CRN技術做了比較，我們可以看出新技術生成的圖片的質量，圖像在解析度上也有明顯提高。

又是GAN！改個TAG，你就能對圖片為所欲為了 | 2分鐘論文

巧妙的一點在於，語義圖不僅僅用於標識，它還生成了一幅邊界圖，使演算法輸出分割得更好的圖片。

生成的邊界圖像和語義標籤一樣非常有用。另一個技巧是創建多個鑒別器網路，並在不同精度的圖像上使用它們。

論文&代碼原址 https://tcwang0509.github.io/pix2pixHD/

更多文章，關注雷鋒網，添加雷鋒字幕組微信號（leiphonefansub）為好友

備註「我要加入」，To be a AI Volunteer ！雷鋒網雷鋒網

又是GAN！改個TAG，你就能對圖片為所欲為了 | 2分鐘論文

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章: