「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

新聞 07-12

1 新智元報道

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

2015 年 10 月，谷歌大腦宣布推出「谷歌大腦實習計劃」（Google Brain Residency Program），為期一年，為關注機器學習和深度學習的人開始職業生涯做準備。實習生能夠利用谷歌得天獨厚的基礎設施，與領域裡最頂尖的研究人員一起工作。

2016 年 6 月，第一屆谷歌大腦實習計劃正式開始。從計算機科學到物理、數學、生物和神經科學，成員背景不一。有的人博士剛畢業，也有人已經有多年的工作經驗。他們研究的課題也從自然語言理解，機器人，到神經科學再到遺傳學，覆蓋廣泛。

據悉，迄今為止，第一批谷歌大腦實習生已在 ICLR（15），ICML（11），CVPR（3），EMNLP（2），RSS，GECCO，ISMIR，ISMB 和 Cosyne 等領先的機器學習會議及刊物發表了 30 多篇論文（括弧里的數字表明在相關會議發表的論文數量）。另外，還有 18 篇論文在 NIPS，ICCV，BMVC 和《自然-方法》審核中。

谷歌大腦實習計劃一周年成果摘選

那麼，下面我們就來看看這些成果（排名不分先後）。

先來看兩篇發表在「互動式期刊」 Distill的工作：

1. 「看見」神經網路如何生成手寫字元

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

用互動式的方法探索了神經網路如何生成手寫字元。相關論文：《用神經網路生成手寫字元的 4 個實驗》（Four Experiments in Handwriting with a Neural Network）。作者：Carter, et al., "Experiments in Handwriting with a Neural Network", Distill, 2016. http://doi.org/10.23915/distill.000

2. 探索機器人如何從觀察中學習模仿人類運動的系統

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

論文《時間對比網路：多觀察觀察中的自監督學習》（Time-Contrastive Networks: Self-Supervised Learning from Multi-View Observation）。作者：Pierre Sermanet, Corey Lynch, Jasmine Hsu, Sergey Levine，CVPR Workshop (2017)

3. 用強化學習訓練大規模分布式深度學習系統

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

通過優化計算到硬體設備分配，這個模型能夠使用強化學習對大規模分布式深度學習網路進行訓練。論文：《通過強化學習進行設備布局優化》（Device Placement Optimization with Reinforcement Learning）。作者：Azalia Mirhoseini, Hieu Pham, Quoc Le, Mohammad Norouzi, Samy Bengio, Benoit Steiner, Yuefeng Zhou, Naveen Kumar, Rasmus Larsen, Jeff Dean，ICML (2017)

4. 自動發現優化方法

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

提出了一種將方法優化方法自動化的方法，尤其是自動優化深度學習框架。論文：《用強化學習搜索神經網路優化器》（Neural Optimizer Search with Reinforcement Learning）。作者：Irwan Bello, Barret Zoph, Vijay Vasudevan, Quoc Le，ICML (2017)

5. 使用神經網路生成全新 RNN 架構，在許多任務上超越 LSTM 架構

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

設計神經網路十分繁瑣困難。利用這種新技術，能夠自動生成性能卓越的 RNN 架構。上圖左邊是一個 LSTM 架構，右邊是使用神經網路生成的新型 RNN 架構。後者在各種不同任務上優於廣泛使用的 LSTM。論文：《用強化學習搜索神經網路架構》（Neural Architecture Search with Reinforcement Learning）。作者：Barret Zoph, Quoc V. Le，ICLR (2017)

6. 理論計算能否取代大規模的超參數搜索？

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

顏色表示了神經網路的訓練準確性，從黑（隨機）到紅（高精度）以此升高。白色虛線表示可訓練和不可訓練網路之間的理論邊界。在上面的 4 幅圖中，（a）表示沒有 dropout 的網路，餘下 3 個依次表示 dropout 率為 0.01, 0.02, 0.06 的網路。論文：《深度信息傳播》（Deep Information Propagation）。作者：Samuel S. Schoenholz, Justin Gilmer, Surya Ganguli, Jascha Sohl-Dickstein，ICLR (2017)

7. 提升 GAN 合成圖像的訓練效果

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

上圖展示了作者提出的 AC-GAN 與其他幾種常用 GAN 的對比，從左到右依次是條件 GAN、半監督 GAN、InfoGAN。論文：《用帶有輔助分類器的 GAN 做條件圖像合成》（Conditional Image Synthesis With Auxiliary Classifier GANs）。作者：Augustus Odena, Christopher Olah & Jonathon Shlens，ICML(2017)

8. 使用神經網路為其他網路生成超參數

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

HyperNetwork 是生成另一個網路權重的網路。作者使用 HyperNetwork 生成 RNN 的權重，發現能為 LSTM 生成非共享權重，並在字元級語言建模、手寫字元生成和神經機器翻譯等序列建模任務上實現最先進的結果。上圖顯示了 HyperLSTM 模型生成的文本。四色方塊是每個生成字元下方的變化範圍，代表主 RNN 的 4 個權重矩陣（分別用紅、綠、藍、黃表示）。密度越高，代表主 RNN 權重變化越大。論文：《超網路》（HyperNetworks）。作者：David Ha, Andrew Dai, Quoc V. Le，ICLR (2017)

9. 用神經網路生成不同樂器的聲音

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

提出了一種類似 WaveNet 的自編碼器模型，讓這個模型學習了一系列嵌入，通過插入元素，讓生成在聲音聽上去像是由不同的樂器發出的。上圖展示了這種模型的結構，能從原始音頻波形中學習時間碼，對自回歸解碼器進行調節。作者還介紹了一個高質量的大規模音符數據集 NSynth。論文：《WaveNet 自編碼器合成音樂》（Neural Audio Synthesis of Musical Notes with WaveNet Autoencoders）。作者：Jesse Engel, Cinjon Resnick, Adam Roberts, Sander Dieleman, Douglas Eck, Karen Simonyan, Mohammad Norouzi，ICML (2017)

10. 有效利用噪音標籤，提升分類精度

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

研究提出了一項利用噪音標籤的方法。噪音標籤就是那些有很多專家對一幅圖像給出了不同標記的標籤。作者使用一個神經網路對每個專家的標籤都給出一組輸出，然後學習平均權重來組合其預測。通過這種方法，知道哪位專家說了什麼，對數據有了更好的標記，從而提高分類精度。上圖是實驗中對糖尿病視網膜病變嚴重程度的標記。論文：《誰說了什麼：為單個標記者建模提升分類質量》（Who Said What: Modeling Individual Labelers Improves Classification）。作者：Melody Y. Guan, Varun Gulshan, Andrew M. Dai, Geoffrey Hinton，CVPR Workshop (2017)

谷歌大腦實習計劃：畢業生去向及新一屆招生

據悉，本屆谷歌大腦實習計劃的畢業生，有很多都留在谷歌大腦全職工作。其他人則進入斯坦福、伯克利、康奈爾、多倫多和 CMU 等頂級機器學習博士項目深造。

現在，第二屆實習計劃即將開始。同時，第三屆招生計劃 9 月開放。了解更多可以訪問：g.co/brainresidency

了解其他研究工作，可以訪問：https://research.google.com/pubs/BrainResidency.html

點擊閱讀原文查看新智元招聘信息

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※「10億+數據集，ImageNet千倍」深度學習未來，谷歌認數據為王
※谷歌重磅發2017學術影響因子：AI、視覺、機器人TOP20
※首發：商湯科技B輪融資4.1億美元創AI行業融資紀錄
※商湯科技B輪融資4.1億美元創AI行業融資紀錄

TAG:新智元 |

您可能感興趣

※計算機視覺五大技術
※計算機視覺＋自然語言處理＝強AI？
※一文帶你讀懂計算機視覺
※計算機視覺論文速遞
※【綜述】計算機視覺簡介：歷史、現狀和發展趨勢【可下載】
※為什麼深度學習不能取代傳統的計算機視覺技術？
※為什麼深度學習仍未取代傳統的計算機視覺技術？
※機器學習開發者應該收藏的 DIY 計算機視覺和深度學習項目
※遷移學習：如何在自然語言處理和計算機視覺中應用？
※計算機視覺前沿與實踐
※改變你對世界看法的五大計算機視覺技術！
※計算機視覺開創性論文必讀精選
※針對 3D 計算機視覺的簡介
※視頻廣告段落檢測——從一個偏門說計算機視覺的發展歷史
※這5種計算機視覺技術，刷新你的世界觀
※下載 | 866頁《計算機視覺：原理，演算法，應用，學習》第五版
※極市X機器之心 2018計算機視覺最具潛力開發者榜單
※極市X機器之心 2018計算機視覺最具潛力開發者榜單
※OpenAI背後的領袖：計算機視覺、機器翻譯、遊戲和機器人的變革者
※擴展 | 3D 計算機視覺簡介