只會造假怎麼行？藝術家聯手Facebook，給GAN加點創意

最新 06-30

王小新編譯自 Hackernoon

量子位出品 | 公眾號 QbitAI

目前，生成對抗網路(GAN)作為一種處理圖像生成問題的優秀方法，在超解析度重建、風格遷移等領域已經做出了很多有意思的成就。

(比如量子位昨天推薦的去馬賽克大法)

不過，GAN只會模仿怎麼行？最近一項新研究改進了GAN，教機器去創造。

上面這些廣受好評的畫，出自美國羅格斯大學的計算機科學實驗室、Facebook的人工智慧研究部和查爾斯頓學院的藝術史系聯合發表的新論文：CAN: Creative Adversarial Networks Generating 「Art」 by Learning About Styles and Deviating from Style Norms。

這篇論文，提出了創造性對抗網路（Creative Adversarial Networks），探究了利用機器生成來產生創意內容的可能性。

Hackernoon發文介紹了這篇論文的主要內容，量子位翻譯如下：

在閱讀本文前，希望你已經了解神經網路的概念及一些基本概念，如損失函數和卷積操作等。

GAN網路和CAN網路的一些生成圖像

回顧GAN網路

GAN網路是由兩個相互鬥爭的神經網路組成，分別稱為生成器和鑒別器。

與字面含義相似，生成器的作用是根據輸入來生成數據，該輸入可以是雜訊甚至是其他類型的數據。鑒別器的作用是分析數據並區分該數據是屬於原始輸入數據，還是由生成器產生的生成數據。

通常來說，GAN網路可以看作是一種由生成器和鑒別器完成的對抗遊戲：

方程1.0

簡單版解釋

如果你覺得上述方程太複雜，別擔心，接下來會分步介紹這個方程，詳細解釋下每部分的含義。

方程1.1

上面是極大極小方程的符號，字母G和D分別代表了生成器Generator和鑒別器Discriminator。生成器的任務為最小化方程1.0的值，與此同時，鑒別器的任務為最大化方程1.0的值。這兩者會無休止地相互競爭，直到程序作出停止的命令。

方程1.2

當給定輸入x為來自原始數據集的數據時，鑒別器的輸出會表明這是真實的數據。

方程1.3

方程1.3計算了鑒別器對生成器輸入的輸出值。D(G(z))表示鑒別器判斷輸入數據為真實數據的概率，則1- D(G(z))表示鑒別器判斷輸入數據為生成數據的概率。G(z)表示由生成器產生的數據。

將上述方程統一起來，得到鑒別器的任務為最大化以下方程：

方程1.4

而生成器的任務為最小化方程1.4的值，也就是最大化方程1.5的值。

方程1.5

關於GAN網路更詳細的解釋可以參考英屬哥倫比亞大學的在線課程。

在線課程地址：http://wiki.ubc.ca/Course:CPSC522/Generative_Adversarial_Networks

從模仿到創造

生成器通過不斷調整自身，使鑒別器將生成圖像標記為真實圖像，而鑒別器也在不斷調整自身來指出生成圖像和原始圖像間的差異。

這不是簡單的模仿嗎？

在一定程度上，是這樣的。生成器的目標是愚弄鑒別器，使其認為生成數據與真實數據儘可能地相似。那麼是怎麼實現呢？通過使相應輸出與真實數據極其相似。

要讓網路更具有創意性，該如何改進呢？

創造性對抗網路來了！

論文作者提出了改進後的GAN網路：CAN，來產生創意性的內容。該網路通過向生成器發送一個附加信號，以防止其產生與原始數據過於相似的內容，這該如何實現？作者在方程1.4中修改了最初的GAN網路損失函數。

CAN簡單解釋

在原始的GAN中，鑒別器通過判斷輸入數據與真實數據的相似程度得到一個輸出值，生成器就是根據這個輸出值來修改其權重。CAN網路可以通過以下兩種方式來擴展此過程：

1.鑒別器不僅會判斷數據是真是假，而且還可以確定該藝術圖像的所屬年代；

2.生成器將會接收鑒別器中附加的年代信息，並使用該指標與鑒別器的（可真可假）輸入進行聯合訓練。

改進目的

原始GAN網路的存在問題是不會探索新的內容，訓練的唯一目標只是使生成數據與真實數據集儘可能相似。

通過對輸入數據所屬年代進行分類的附加度量，可能會帶有置信度列表，生成器可以獲得其生成數據與某個年代相似程度的反饋信息。

現在，生成器不僅要使生成數據與真實數據集相似，而且還要確保其與某個類別不過於相似。這條規則將限制生成器產生帶有具體特徵的藝術圖像。

新的損失函數定義如下：

方程2.0

真的很簡單！

第一行與原始方程完全相同。但是要注意，下標r代表鑒別器的輸出是真或是假，下標c為鑒別器分類的輸出值。

第二行為提高創造性的改進點，接下來詳細解釋。

方程2.1

上述公式使得鑒別器能正確獲取輸入圖像的類別。鑒別器將會努力最大化該概率值，來正確得到輸入圖像的年代類別。

方程2.2

這個方程可能看起來很複雜，但這只是定義了多標籤交叉熵損失（Multi Label Cross Entropy Loss），這裡的K表示圖像類別的數目。在分類器中，也使用了該損失函數。生成器在訓練過程中通過最小化該值來最大化方程2.0的值。

方程2.2的直觀解釋

方程2.2的作用是，如果某個類的得分值接近1或0，則整個方程的值接近於無窮大。

方程2.2可以取到最大值時，此時意味著鑒別器完全不確定輸入圖像屬於哪一類，即上述方程中的計算和都相同，這也是生成器想完成的結果。

這是有一定依據的，因為如果鑒別器不可能將輸入圖像正確地分類到現有的某一類中，則意味著該數據與原始數據相同。

結論

本文討論了一種能根據已有數據推進GAN網路探索新內容的損失函數，通過改進原有的損失函數來進行探索，期待更有趣的研究。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 量子位 的精彩文章:

※刷劇不忘學CNN：TF＋Keras識別辛普森一家人物
※幻想AI自己打開黑箱？谷歌工程總監說：所謂解釋，全是編的
※第八冠！清華的三大超算競賽總冠軍獎盃又多了一個
※深度神經網路是否模擬了人類大腦皮層結構？
※一文看懂各種神經網路優化演算法：從梯度下降到Adam方法

TAG:量子位 |

您可能感興趣

※Nike 聯手芝加哥藝術家 Ju 打造「Game Worn」特別企劃
※Rimowa 聯手藝術家 Alex Israel 打造全新企劃
※Ikonospace讓藝術家自己創建個人VR展館，還可銷售作品
※Adobe通過藝術家入駐計劃Residence完善AR創作工具Project Aero
※Converse攜手Chinatown Market及藝術家打造聯名鞋款
※拆解改造 Tom Sachs x Nike「Mars Yard Overshoe」，並深度解構這位紐約裝置藝術家
※撞色設計＋DIY 元素！Converse 攜手Chinatown Market 及藝術家 Joshua Vides 打造聯名鞋款
※聽說Prada榮宅crossover中國藝術家，不背著新手袋打卡怎麼行？
※比起跟 Louis Vuitton 聯名，我更想把它們的手袋拆掉 | 專訪塗鴉藝術家 OG Slick
※加拿大CG藝術家 Ben Nicholas
※荷蘭藝術家 Piet Parra 聯手 Nike 再推新配色 Air M
※比起跟 Louis Vuitton 聯名，我更想把它們的手袋拆掉｜專訪塗鴉藝術家 OG Slick
※Daniel Gebhart de Koekkoek-攝影藝術家
※Nike 攜手藝術家 Gangster Doodles 為 NBA 球星打造專屬限定 T-Shirt
※來一雙「抹茶味」的AJ1！藝術家Michael攜手Chase Shiel共同打造！
※攜手藝術家 Gangster Doodles ，Nike 推出 NBA 球星專屬限定 T-Shirt
※把iPhone X變成動捕設備？看CG藝術家如何玩轉Animoji
※YT先鋒丨Tania Bruguera: 不想做古巴總統的行為作品不是好藝術家
※來自藝術家 Katy Lipscomb的手筆
※隨筆速寫作者：藝術家 Neva Hosking