Andrew Ng對 Geoffrey Hinton 的採訪：致敬老爺子的一路堅持！

最新 03-09

這裡是北京大學深度學習實驗室

歡迎大家關注我們獲取更多資訊

為了學習一下 Ng 講課的好風格，前段時間專門抽出時間去看了下他最近推出的 deep learning mooc 課程，希望自己下次再給學生講深度學習的時候能夠講得更好一些。

意想不到的是課程里竟然專門有個大插曲是採訪 Hinton 的，鏈接如下：

https://www.coursera.org/learn/neural-networks-deep-learning/lecture/dcm5r/geoffrey-hinton-interview

採訪時間40分鐘，第一次聽老爺子這麼長的 interview。他大體講述了自己在神經網路和 AI 方面四十多年的努力，一路聽來欽佩至極。之前對這位老爺子的了解就是： Godfather of Deep Learning, 大名鼎鼎的 Bool 的外孫，以及他發明的影響至今的各種 deep learning 的Landmarks：Backprop、RBM (及其學習演算法constrastive divergence) 、ReLU network、AlexNet、RMSProp、Dropout...等等。自己有幸和老爺子是愛大校友

但通過這次 interview 之後，對老爺子在神經網路和 AI 方面的一路堅持欽佩至極，70歲的人了思維依然敏捷，依然活躍在 AI 的一線科研當中。我大體總結一下他提到的一些關鍵的技術或者想法，以及背後的故事和啟發。

關於科研： "Develop your intuition, trust it and go for it. Don"t be too worried even if everybody else says it"s nonsense." 這是老爺子給研究人員在深度學習和 AI 方面的建議。現在對於 AI 和深度學習，由於缺少深刻的理解，更多的是靠直覺產生新的想法，接著去發展、去嘗試，誰也不敢下定論你的嘗試一定不 work。老爺子接著強調"if you think it is really a good idea, and other people tell you it is completely nonsense, and then you know you are on to something." 老爺子用自己在神經網路方面40多年的經歷告訴我們這一點，但也必須說一下有時候沒有太大成果的時候要 face reality，這是每個做科研的都要面臨的問題，畢竟還有一些現實的壓力。

這倒是讓我想到當前 DL /RL的研究現狀，大多數最前沿方向的思路都是被大公司或者大規模的研究組統治的，因為現在太多的想法需要投入很多人力物力和計算資源才能實現，大組織就很佔優勢。所以大家盡量不要完全 follow 他們的工作，盡量和他們做的不是太一樣，這樣也許會有好的結果，不然就會出現一步趕不上不不趕不上的尷尬局面。僅僅是個人觀點。

老爺子的 backprop 不是全新的想法，但他使得這個演算法得到了大規模推廣，得益於他大力的遊說 reviewer 讓他的文章發表在了 nature 上。

其實老爺子的很多發明都是經過漫長的嘗試摸索最終使其 work 的，relu,dropout,wake-sleep,distillation這些都是。

老爺子有些可惜自己關於 identity initialization 的想法沒能最終正式的 formulate 讓它 work 起來，不然就沒有ResNet 什麼事了。

最後談一下capsule 的想法，其實這個想法 hinton 很早就有了（和他的學生 Tijmen http://www.cs.toronto.edu/~tijmen/tijmen_thesis.pdf， chap 2.3），我第一次聽到這個想法的討論還是2014年在我博士期間，我們幾個同事在一起討論 capsule是不是 hinton 在深度學習的下一個突破。最近hinton 在 MIT 的一個 talk 也有講。（鏈接在下面）

capsule 的簡單想法就是將每層的神經元進行重新有結構化的組織形成一個 capsule，這個 capsule 里包含物體識別的全部信息，比如view point, color 等等，然後將所有的 capsule 的輸出進行投票作為最終輸出，其實這一點是product of experts的想法

關於 capsule 我覺得目前還沒有找到一個好的定義內部結構的方式，使得他能夠在更有挑戰的任務上工作起來。還是一個很值得努力的方向。

老爺子還在 talk 里用拼四面體的遊戲開了 MIT 教授的玩笑， What"s wrong with convolutional nets?

就寫到這裡，附一張老爺子小時候的照片，膽子大得很！看來多少年來一直沒變，一直敢在自己堅信的領域堅持這麼多年！

作

者

簡

介

朱占星，北京大學數據科學研究中心研究員，北京大數據研究院研究員。2016年在英國愛丁堡大學獲得機器學習方向博士學位。主要研究領域為人工智慧，機器學習，深度學習的優化方法，深度學習機制理論，大規模貝葉斯計算與優化理論，機器學習在交通大數據應用及計算機圖形學中的應用等，在機器學習領域頂級期刊及會議有多篇文章發表，包括NIPS, ICML, ACL, AAAI及 ECML 等。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 PKUDL 的精彩文章:

TAG:PKUDL |