當前位置:
首頁 > 新聞 > 又是GAN!改個TAG,你就能對圖片為所欲為了 | 2分鐘論文

又是GAN!改個TAG,你就能對圖片為所欲為了 | 2分鐘論文

這裡是,雷鋒字幕組編譯的 Two Minute Papers專欄,每周帶大家用碎片時間閱覽前沿技術,了解AI領域的最新研究成果。

原標題 High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs

翻譯 | 劉寧 校對 | 凡江 整理 | 凡江

本期所介紹的內容是——從語義圖上獲得高解析度圖片。語義圖是一幅彩色圖片,圖上的不同色塊代表不同種類物體,如行人、汽車、交通標誌、建築物等。

只需要在輸入的語義圖上修改相應標籤,就能把混凝土路面變成土路,把樹替換成建築等等。

又是GAN!改個TAG,你就能對圖片為所欲為了 | 2分鐘論文

通常,我們採用光線模擬程序或光柵化來產生語義圖。但是AI研究者提出:為什麼我們要使用光柵,而不是編寫一個可以自己合成圖像的學習演算法?

下面的生成對抗網路將一張語義圖作為輸入,並由此生成了一張高解析度的逼真的圖像。之前的技術多數只能生成粗糙的低解析度的圖片,看起來也不真實。而這個研究卻生成了2k乘1k解析度的圖像,已經很接近全高清的照片。

又是GAN!改個TAG,你就能對圖片為所欲為了 | 2分鐘論文

當我們想手動編輯一張真實的照片里的內容時,傳統的方法需要具備Photoshop等專業工具的技能。即使是很簡單的編輯也要耗費大量精力,因為人眼是非常難以欺騙的。而語義圖方法的優點就是,不需要太多專業技能就可以很容易實現編輯。例如,我們可以通過將供選的物體填充到語義標註圖中來控制生成的圖片。

這項技術不僅僅適用於室外交通圖片,它還可以對人臉細節進行編輯。例如,可以用此方法簡單地添加鬍子。把這項技術和之前的pix2pix和CRN技術做了比較,我們可以看出新技術生成的圖片的質量,圖像在解析度上也有明顯提高。

又是GAN!改個TAG,你就能對圖片為所欲為了 | 2分鐘論文

巧妙的一點在於,語義圖不僅僅用於標識,它還生成了一幅邊界圖,使演算法輸出分割得更好的圖片。

生成的邊界圖像和語義標籤一樣非常有用。另一個技巧是創建多個鑒別器網路,並在不同精度的圖像上使用它們。

論文&代碼 原址 https://tcwang0509.github.io/pix2pixHD/

更多文章,關注雷鋒網,添加雷鋒字幕組微信號(leiphonefansub)為好友

備註「我要加入」,To be a AI Volunteer !雷鋒網雷鋒網

又是GAN!改個TAG,你就能對圖片為所欲為了 | 2分鐘論文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

我們梳理了40+行業峰會,發現了6個你需要了解的信號
崛起於 2017 年的首汽約車,為網約車品質服務打造了更高的門檻

TAG:雷鋒網 |