當前位置:
首頁 > 最新 > 論文:谷歌大腦顛覆深度學習混亂現狀

論文:谷歌大腦顛覆深度學習混亂現狀

本篇論文是谷歌大腦(Google Brain)與多倫多大學合作的最新論文。谷歌大腦團隊曾經負責研發了AlphaGo與TensorFlow框架等產品,其實力自然不消多說。而這一次谷歌大腦團隊更是向當前深度學習架構繁多、應用領域不一等混亂現狀發出挑戰,霸氣提出了通過單一模型聯合學習多項任務。那麼該模型是否真的如此神奇呢?趕緊隨雷鋒網AI科技評論來看看吧。

論文摘要

深度學習(Deep learning)演算法在語音識別(Speeh recognition)、圖像分類(Image classification)和翻譯(Translation)等諸多領域都已經取得了非常好的結果。但是目前的缺陷是,針對這些不同領域的不同問題,要想深度學習模型能夠取得較好的效果,研究員就需要針對當前具體問題去研究具體的深度模型架構,然後再花費大量的時間對模型的參數進行微調優化。

圖一展示單個多模型(MultiModel)的解碼示例,該模型在8個任務中進行了聯合訓練。其中紅色的矩形框描繪了一種語言模式,而藍色的矩形框描繪了分類模式。

本論文的研究員提出了一種單一模型,該模型能夠在多個領域的不同問題中都取得較好的結果。另外值得一提的是,該單一模型可以在ImageNet、多項翻譯任務、圖像標註(Image captioning,採用COCO數據集)、語音識別數據集和英語解析任務中同時進行訓練。據悉,該單一模型架構借鑒了來自多個領域的深度學習模型架構所使用的構建塊(Building blocks),該模型具有卷積層(Convolutional layers)、注意力機制(Attention mechanism)和稀疏門控層(Sparsely-gated layers)。並且模型中的每一個計算塊(Computational blocks)對於訓練任務中的某一子部分都至關重要。

圖二展示了一個多模型,該多模型具有模式網路(Modality-nets)、編碼器(Encoder)和自回歸解碼器(Autoregressive decoder)。

在實驗的過程中,研究員們還發現了一個非常有趣的現象,即使模型架構中的某一個計算塊對於當前任務而言並不重要,但是實驗結果表明添加該計算塊到模型架構中並不會影響到最終效果,並且在大多數情況下,這種做法還能提高模型在所有任務上的表現效果。

圖三展示了多模型的架構,如果想獲得關於該模型的具體信息,請閱讀論文。

另外,在本論文中研究員們通過實驗還表明具有較少數據量的任務,能夠從將多個任務聯合起來進行訓練的方式中獲得巨大的收益,而對於擁有大量數據的任務而言,這種訓練方式將導致最終效果的略微下降。

附英文版論文全版:

來自:雷鋒網編譯

199IT熱門報告重點推薦,可直接點擊查閱:

獲取PDF版加入我們小密圈,感謝您的支持!

目前有860+資深用戶和1700+最新TMT行業文檔。

| NOTICE |

微信公眾平台目前已經推出訂閱號置頂功能

點擊我們的主頁

及時捕獲精彩內容


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 199IT數據中心 的精彩文章:

YouGov:66%的LGBT認為廣告對他們的生活方式展示不足
2017年值得關注的10大營銷趨勢
Nielsen:調查顯示VR對美國遊戲玩家非常有吸引力
香港生活成本有多高

TAG:199IT數據中心 |

您可能感興趣

圓錐角膜國際研究現狀綜述
植物中文名稱的混亂現狀
印度新劇《神秘巨星》,阿米爾汗主演,講述印度的真實的社會現狀
陳天奇:深度學習編譯技術的現狀和未來
論格律詩詞教學怪現狀
寒武紀創始人陳雲霽:深度學習處理器發展現狀及趨勢
人工智慧與深度學習的現狀
賴清德再拋挑釁性「台獨」言論,打破「現狀」欲挑戰蔡英文?
「音頻」陳洪武——「現狀與理想·烏海論壇」學術發言(上)
獨家深度解析韓流粉絲文化的成熟現狀
「中共制度史研究的現狀與未來」學術座談會綜述
朱亞文吐槽行業現狀,曝演員拍戲空口吃面,大誇湯唯俞灝明演技好
單片異質集成技術研究現狀與進展
當前文言文教學研究現狀剖析
中國人文學傳統的再發現——基於當代史學現狀的思考
淺談木質文玩,小葉紫檀手串亂象現狀
淺談華池縣窯洞窗格子文化傳承發展現狀
紫砂壺現狀:低價格、低質量造成惡性循環,藝術在哭泣
交叉科學的魅力-自然科學中的基礎理論發展現狀
激光清洗技術概論及應用現狀