當前位置:
首頁 > 新聞 > 「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

1 新智元報道

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

2015 年 10 月,谷歌大腦宣布推出「谷歌大腦實習計劃」(Google Brain Residency Program),為期一年,為關注機器學習和深度學習的人開始職業生涯做準備。實習生能夠利用谷歌得天獨厚的基礎設施,與領域裡最頂尖的研究人員一起工作。

2016 年 6 月,第一屆谷歌大腦實習計劃正式開始。從計算機科學到物理、數學、生物和神經科學,成員背景不一。有的人博士剛畢業,也有人已經有多年的工作經驗。他們研究的課題也從自然語言理解,機器人,到神經科學再到遺傳學,覆蓋廣泛。

據悉,迄今為止,第一批谷歌大腦實習生已在 ICLR(15),ICML(11),CVPR(3),EMNLP(2),RSS,GECCO,ISMIR,ISMB 和 Cosyne 等領先的機器學習會議及刊物發表了 30 多篇論文(括弧里的數字表明在相關會議發表的論文數量)。另外,還有 18 篇論文在 NIPS,ICCV,BMVC 和《自然-方法》審核中。

谷歌大腦實習計劃一周年成果摘選

那麼,下面我們就來看看這些成果(排名不分先後)。

先來看兩篇發表在「互動式期刊」 Distill的工作:

1. 「看見」神經網路如何生成手寫字元

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

用互動式的方法探索了神經網路如何生成手寫字元。相關論文:《用神經網路生成手寫字元的 4 個實驗》(Four Experiments in Handwriting with a Neural Network)。作者:Carter, et al., "Experiments in Handwriting with a Neural Network", Distill, 2016. http://doi.org/10.23915/distill.000

2. 探索機器人如何從觀察中學習模仿人類運動的系統

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

論文《時間對比網路:多觀察觀察中的自監督學習》(Time-Contrastive Networks: Self-Supervised Learning from Multi-View Observation)。作者:Pierre Sermanet, Corey Lynch, Jasmine Hsu, Sergey Levine,CVPR Workshop (2017)

3. 用強化學習訓練大規模分布式深度學習系統

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

通過優化計算到硬體設備分配,這個模型能夠使用強化學習對大規模分布式深度學習網路進行訓練。論文:《通過強化學習進行設備布局優化》(Device Placement Optimization with Reinforcement Learning)。作者:Azalia Mirhoseini, Hieu Pham, Quoc Le, Mohammad Norouzi, Samy Bengio, Benoit Steiner, Yuefeng Zhou, Naveen Kumar, Rasmus Larsen, Jeff Dean,ICML (2017)

4. 自動發現優化方法

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

提出了一種將方法優化方法自動化的方法,尤其是自動優化深度學習框架。論文:《用強化學習搜索神經網路優化器》(Neural Optimizer Search with Reinforcement Learning)。作者:Irwan Bello, Barret Zoph, Vijay Vasudevan, Quoc Le,ICML (2017)

5. 使用神經網路生成全新 RNN 架構,在許多任務上超越 LSTM 架構

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

設計神經網路十分繁瑣困難。利用這種新技術,能夠自動生成性能卓越的 RNN 架構。上圖左邊是一個 LSTM 架構,右邊是使用神經網路生成的新型 RNN 架構。後者在各種不同任務上優於廣泛使用的 LSTM。論文:《用強化學習搜索神經網路架構》(Neural Architecture Search with Reinforcement Learning)。作者:Barret Zoph, Quoc V. Le,ICLR (2017)

6. 理論計算能否取代大規模的超參數搜索?

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

顏色表示了神經網路的訓練準確性,從黑(隨機)到紅(高精度)以此升高。白色虛線表示可訓練和不可訓練網路之間的理論邊界。在上面的 4 幅圖中,(a)表示沒有 dropout 的網路,餘下 3 個依次表示 dropout 率為 0.01, 0.02, 0.06 的網路。論文:《深度信息傳播》(Deep Information Propagation)。作者:Samuel S. Schoenholz, Justin Gilmer, Surya Ganguli, Jascha Sohl-Dickstein,ICLR (2017)

7. 提升 GAN 合成圖像的訓練效果

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

上圖展示了作者提出的 AC-GAN 與其他幾種常用 GAN 的對比,從左到右依次是條件 GAN、半監督 GAN、InfoGAN。論文:《用帶有輔助分類器的 GAN 做條件圖像合成》(Conditional Image Synthesis With Auxiliary Classifier GANs)。作者:Augustus Odena, Christopher Olah & Jonathon Shlens,ICML(2017)

8. 使用神經網路為其他網路生成超參數

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

HyperNetwork 是生成另一個網路權重的網路。作者使用 HyperNetwork 生成 RNN 的權重,發現能為 LSTM 生成非共享權重,並在字元級語言建模、手寫字元生成和神經機器翻譯等序列建模任務上實現最先進的結果。上圖顯示了 HyperLSTM 模型生成的文本。四色方塊是每個生成字元下方的變化範圍,代表主 RNN 的 4 個權重矩陣(分別用紅、綠、藍、黃表示)。密度越高,代表主 RNN 權重變化越大。論文:《超網路》(HyperNetworks)。作者:David Ha, Andrew Dai, Quoc V. Le,ICLR (2017)

9. 用神經網路生成不同樂器的聲音

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

提出了一種類似 WaveNet 的自編碼器模型,讓這個模型學習了一系列嵌入,通過插入元素,讓生成在聲音聽上去像是由不同的樂器發出的。上圖展示了這種模型的結構,能從原始音頻波形中學習時間碼,對自回歸解碼器進行調節。作者還介紹了一個高質量的大規模音符數據集 NSynth。論文:《WaveNet 自編碼器合成音樂》(Neural Audio Synthesis of Musical Notes with WaveNet Autoencoders)。作者:Jesse Engel, Cinjon Resnick, Adam Roberts, Sander Dieleman, Douglas Eck, Karen Simonyan, Mohammad Norouzi,ICML (2017)

10. 有效利用噪音標籤,提升分類精度

「谷歌大腦實習一周年」50 篇論文看機器學習、計算機視覺和自然語言趨勢

研究提出了一項利用噪音標籤的方法。噪音標籤就是那些有很多專家對一幅圖像給出了不同標記的標籤。作者使用一個神經網路對每個專家的標籤都給出一組輸出,然後學習平均權重來組合其預測。通過這種方法,知道哪位專家說了什麼,對數據有了更好的標記,從而提高分類精度。上圖是實驗中對糖尿病視網膜病變嚴重程度的標記。論文:《誰說了什麼:為單個標記者建模提升分類質量》(Who Said What: Modeling Individual Labelers Improves Classification)。作者:Melody Y. Guan, Varun Gulshan, Andrew M. Dai, Geoffrey Hinton,CVPR Workshop (2017)

谷歌大腦實習計劃:畢業生去向及新一屆招生

據悉,本屆谷歌大腦實習計劃的畢業生,有很多都留在谷歌大腦全職工作。其他人則進入斯坦福、伯克利、康奈爾、多倫多和 CMU 等頂級機器學習博士項目深造。

現在,第二屆實習計劃即將開始。同時,第三屆招生計劃 9 月開放。了解更多可以訪問:g.co/brainresidency

了解其他研究工作,可以訪問:https://research.google.com/pubs/BrainResidency.html

點擊閱讀原文查看新智元招聘信息

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

「10億+數據集,ImageNet千倍」深度學習未來,谷歌認數據為王
谷歌重磅發2017學術影響因子:AI、視覺、機器人TOP20
首發:商湯科技B輪融資4.1億美元 創AI行業融資紀錄
商湯科技B輪融資4.1億美元 創AI行業融資紀錄

TAG:新智元 |

您可能感興趣

計算機視覺五大技術
計算機視覺+自然語言處理=強AI?
一文帶你讀懂計算機視覺
計算機視覺論文速遞
【綜述】計算機視覺簡介:歷史、現狀和發展趨勢【可下載】
為什麼深度學習不能取代傳統的計算機視覺技術?
為什麼深度學習仍未取代傳統的計算機視覺技術?
機器學習開發者應該收藏的 DIY 計算機視覺和深度學習項目
遷移學習:如何在自然語言處理和計算機視覺中應用?
計算機視覺前沿與實踐
改變你對世界看法的五大計算機視覺技術!
計算機視覺開創性論文必讀精選
針對 3D 計算機視覺的簡介
視頻廣告段落檢測——從一個偏門說計算機視覺的發展歷史
這5種計算機視覺技術,刷新你的世界觀
下載 | 866頁《計算機視覺:原理,演算法,應用,學習》第五版
極市X機器之心 2018計算機視覺最具潛力開發者榜單
極市X機器之心 2018計算機視覺最具潛力開發者榜單
OpenAI背後的領袖:計算機視覺、機器翻譯、遊戲和機器人的變革者
擴展 | 3D 計算機視覺簡介