10年前一篇博客，讓Ian Goodfellow的GAN之父身份再遭質疑

新聞 05-13

【新智元導讀】一般認為GAN是2014年由Ian Goodfellow等人提出的，但有人發現同樣的想法早在2010年，就被一位芬蘭的電氣工程師提出了，引發關於「怎樣才算是第一個發明者」的討論。

Ian Goodfellow於2014年提出的GAN，至今已經是計算機視覺領域最重要、使用最廣泛的概念之一。

10年前一篇博客，讓Ian Goodfellow的GAN之父身份再遭質疑

學術界流傳的一則GAN誕生的傳說。據說是因為一天晚上Ian Goodfellow在酒吧在喝高的狀態下與同事討論學術問題，突然靈光一閃，提出了GAN初步的想法，當時並沒有得到同事的認可。

後來從酒吧回去發現女朋友已經睡了，於是熬夜寫了代碼，發現還真有效果。經過一番研究後，GAN就誕生了。

GAN的主要靈感來源於博弈論中零和博弈的思想，由一個生成網路與一個判別網路組成，二者不斷博弈：生成網路從潛在空間（latent space）中隨機採樣作為輸入，其輸出結果需要盡量模仿訓練集中的真實樣本。判別網路的輸入則為真實樣本或生成網路的輸出，其目的是將生成網路的輸出從真實樣本中儘可能分辨出來。而生成網路則要儘可能地欺騙判別網路。兩個網路相互對抗、不斷調整參數，最終目的是使判別網路無法判斷生成網路的輸出結果是否真實。

有人比Ian Goodfellow早4年就提出了GAN？

正當大家都已經認為GAN等於Ian Goodfellow的時候，Reddit上有人挖墳，稱其實早在Ian提出GAN這一概念的4年前，就已經有人提出了非常類似的概念。

10年前一篇博客，讓Ian Goodfellow的GAN之父身份再遭質疑

Reddit討論地址：https://www.reddit.com/r/MachineLearning/comments/bnqm0p/d_gans_were_invented_in_2010/

這位叫做Olli Niemitalo的芬蘭電氣工程師，會在自己的博客上記錄他時不時冒出的一些想法。2010年2月24日，他記錄了一種訓練人工神經網路以在可變上下文內、生成缺失數據的方法。

博客鏈接：http://yehar.com/blog/?p=167#2010-02-24

在博客中他寫到：圖像可能丟失像素，那麼如何通過周圍已知的像素，去恢復丟失的像素呢？

他提出的方法是一種叫做「生成器」的神經網路，在給定周圍像素作為輸入的情況下，生成缺失像素。（看，在2010年，Olli就已經提到了generator這個概念！）

那麼接下來的問題就是，該如何訓練這樣的網路呢？

比如一個草原的照片上有一塊污漬，我們知道被蓋住的部分（缺失的數據）也是草，那麼我們就可以訓練神經網路用草去修復，並可以根據生成的草，與原始數據之間的均方根差（RMSD），對神經網路的成果進行評分。

但如果生成器遇到不屬於訓練集的圖像，那麼神經網路就不可能將所有葉子（尤其是缺失部分的中心位置的數據）放在恰當的位置。如果生成器的結果看起來不理想，就會遭受懲罰。

看，生成/對抗，都有了！接下來，他還畫了一個流程圖：

10年前一篇博客，讓Ian Goodfellow的GAN之父身份再遭質疑

解釋一下上圖。給定一個分類器網路，使之同時和生成器進行訓練。分類器網路以隨機、或交替順序給出生成的原始數據。

接著，分類器需要猜測在周圍圖像上下文的上下文中，輸入是原始數據or生成數據，並給猜測結果打分。原始數據給1分，生成數據給0分。

生成器網路的目的就是獲得儘可能高的分數。隨著生成器網路不斷學會獲得高分，最終能夠生成逼真的、人眼區分不出真假的圖像。

看到這裡，很多Reddit網友不淡定了，紛紛感慨「這個人是誰？」「可惜他不出名，要不然blahblah」：

MasterSama：Olli是數百萬領先他們時代卻籍籍無名的例子之一。但我仍然認為雖然Ian可能不是第一個提出GAN的人，卻是第一個讓GAN火起來的。

whymauri：同意MasterSama。我上課的時候聽過一個說法，沒有任何一個科學發明是以最早發現它的那個科學家命名的。

alexmlamb：先入為主的感情來說，我並不想承認兩者是相同的。但我可能不得不承認兩者的相似度高的讓人不可思議。

GAN之父的頭銜從來不缺質疑，其中就包括LSTM之父

中國古話說，文無第一武無第二。在學術領域，永遠不缺乏爭論。

比如今年圖靈獎的歸屬，包括南京大學人工智慧學院院長周志華教授在內的許多學界人士，均發出質疑為什麼圖靈獎得主不是LSTM之父Jürgen Schmidhuber？他也是深度學習領域的大家啊。

10年前一篇博客，讓Ian Goodfellow的GAN之父身份再遭質疑

LSTM之父Jürgen Schmidhuber聲稱，他在92年提出了一種PM（Predictability Minimization）模型，其與GAN有一些相似之處，所以稱Ian Goodfellow的「GAN之父」的說法是站不住腳的。

10年前一篇博客，讓Ian Goodfellow的GAN之父身份再遭質疑

最後，無奈之下的Goodfellow只好在論文的最終版本里加入了GAN和PM不同之處的比較，這才有了第一篇GAN論文的誕生。

10年前一篇博客，讓Ian Goodfellow的GAN之父身份再遭質疑

為此，Schmidhuber和Ian不僅在郵件中展開了激烈的爭論，甚至在2016 NIPS大會上，趁Ian正在做GAN的tutorial的時候，Schmidhuber站起來打斷演講。首先介紹了一下自己92年提出的PM模型，介紹了PM模型的原理和實現過程等等，然後反問Ian如何看待GAN和PM的相似點。

10年前一篇博客，讓Ian Goodfellow的GAN之父身份再遭質疑