當前位置:
首頁 > 新聞 > 機器之心「GMIS 2017」嘉賓:LSTM之父Jürgen

機器之心「GMIS 2017」嘉賓:LSTM之父Jürgen

機器之心「GMIS 2017」嘉賓:LSTM之父Jürgen


2017 全球機器智能峰會(GMIS 2017),讓我們近距離接觸「LSTM 之父」Jürgen Schmidhuber。


官網地址:http://gmis.jiqizhixin.com/


2017 全球機器智能峰會(GMIS 2017)是由機器之心主辦的全球人工智慧盛會,將於 5 月 27 日至 28 日在北京 898 創新空間舉行。本次大會將邀請海內外眾多嘉賓及機構,權威、系統地介紹機器智能相關技術的前沿研究,探討如何將技術轉化成產品和應用等問題。

接下來,我們將逐一揭曉多位重磅嘉賓,今天帶來的是被譽為 LSTM 之父的 Jürgen Schmidhuber。

機器之心「GMIS 2017」嘉賓:LSTM之父Jürgen

LSTM 的研究意義有多大?我們從語音識別近年來的發展中可看出來。2015 年時,谷歌的研究人員使用 LSTM 減少了 49% 的語音識別錯誤,這是一個飛躍性進步。而後,眾多語音識別方面的研究都會藉助 LSTM 的概念,語音識別技術也成為人工智慧領域商業化最快的技術之一。除了語音之外,LSTM 對最近視覺領域的快速進展也起到了關鍵作用。

作為 RNN 的一種變體,LSTM 的優勢何在?之前 DeepLearning4j 授權機器之心發布的一篇有過詳細的講解,接下來我們從技術角度了解一下 LSTM。



LSTM 的優勢

LSTM 是 Sepp Hochreiter 和 Jürgen Schmidhuber 在上世紀九十年代中期提出的,它可以解決梯度消失的問題,這一問題是影響 RNN 表現的重大障礙。

LSTM 還可保留誤差,用於沿時間和層進行反向傳遞。LSTM 將誤差保持在更為恆定的水平,讓 RNN 能夠進行許多個時間步的學習(超過 1000 個時間步),從而打開了建立遠距離因果聯繫的通道。

LSTM 將信息存放在遞歸網路正常信息流之外的門控單元中。這些單元可以存儲、寫入或讀取信息,就像計算機內存中的數據一樣。單元通過門的開關判定存儲哪些信息,以及何時允許讀取、寫入或清除信息。但與計算機中的數字式存儲器不同的是,這些門是模擬的,包含輸出範圍全部在 0~1之間的 sigmoid 函數的逐元素相乘操作。相比數字式存儲,模擬值的優點是可微分,因此適合反向傳播。

這些門依據接收到的信號而開關,而且與神經網路的節點類似,它們會用自有的權重集對信息進行篩選,根據其強度和導入內容決定是否允許信息通過。這些權重就像調製輸入和隱藏狀態的權重一樣,會通過遞歸網路的學習過程進行調整。也就是說,記憶單元會通過猜測、誤差反向傳播、用梯度下降調整權重的迭代過程學習何時允許數據進入、離開或被刪除。

下圖顯示了數據在記憶單元中如何流動,以及單元中的門如何控制數據流動。

機器之心「GMIS 2017」嘉賓:LSTM之父Jürgen

首先,最底部的三個箭頭表示信息從多個點流入記憶單元。當前輸入與過去的單元狀態不只被送入記憶單元本身,同時也進入單元的三個門,而這些門將決定如何處理輸入。

圖中的黑點即是門,分別決定何時允許新輸入進入,何時清除當前的單元狀態,以及/或何時讓單元狀態對當前時間步的網路輸出產生影響。S_c 是記憶單元的當前狀態,而 g_y_in 是當前的輸入。記住,每個門都可開可關,而且門在每個時間步都會重新組合開關狀態。記憶單元在每個時間步都可以決定是否遺忘其狀態,是否允許寫入,是否允許讀取,相應的信息流如圖所示。

圖中較大的黑體字母即是每項操作的結果。

下面是另一張圖,將簡單 RNN(左)與 LSTM 單元(右)進行對比。藍線可忽略;圖例有助理解。

機器之心「GMIS 2017」嘉賓:LSTM之父Jürgen

應當注意的是,LSTM 的記憶單元在輸入轉換中給予加法和乘法不同的角色。兩張圖中央的加號其實就是 LSTM 的秘密。雖然看起來異常簡單,這一基本的改變能幫助 LSTM 在必須進行深度反向傳播時維持恆定的誤差。LSTM 確定後續單元狀態的方式並非將當前狀態與新輸入相乘,而是將兩者相加,這正是 LSTM 的特別之處。(當然,遺忘門依舊使用乘法。)

不同的權重集對輸入信息進行篩選,決定是否輸入、輸出或遺忘。遺忘門的形式是一個線性恆等函數,因為如果門打開,則記憶單元的當前狀態就只會與 1 相乘,正向傳播一個時間步。

此外,講到簡單的竅門,將每個 LSTM 單元遺忘門的偏差設定為 1,經證明可以提升網路表現。

LSTM 有多火?我們可用以下圖表展示。據 Semantic Scholar 的數據顯示,在過去的兩年里《Long Short-Term Memory》一文的引用量激增。

機器之心「GMIS 2017」嘉賓:LSTM之父Jürgen



LSTM 之父Jürgen Schmidhuber

我們都知道,無論在哪個領域,開創新技術的人會成為明星。比如,Geoffrey Hinton 因為在深度學習的開創性研究加入谷歌;Sebastian Thrun 是谷歌自動駕駛汽車的奠基人;Yann LeCun,因為對卷積神經網路的推動而被請到了到 Facebook,成為這家科技巨頭的研究領軍人物。作為 LSTM 的開創者之一,Jürgen Schmidhuber 為何名聲不顯呢?

在之前約翰·馬爾科夫採訪 Jürgen Schmidhuber 的文章中,他把這歸因於 Schmidhuber 的不幸——他的時代太早了,在計算機硬體性能足夠處理這些演算法之前。也是在近年來,LSTM 才開始流行起來。

現年 54 歲的 Jürgen Schmidhuber 是瑞士人工智慧實驗室 IDSIA 的科學事務主管。

在採訪中,Jürgen Schmidhuber 曾表示他自 1987 年以來一直引領著自我改進式(self-improving)通用問題求解程序(problem-solver)的研究。從 1991 年開始,他成為深度學習神經網路領域的開拓者,6 年後他和另一作者提出 LSTM。

為何說 Jürgen Schmidhuber 是一位重量級人工智慧研究者?我們接下來從學術影響力以及帶領的研究團隊對其進行介紹。

我們使用 Semantic Scholar 生成了 Jürgen Schmidhuber 的學術影響力圖,他與 Geoffrey Hinton、Yann LeCun、Yoshua Bengio 等人工智慧領域內的頂級學者都有著極大的影響力關聯。

機器之心「GMIS 2017」嘉賓:LSTM之父Jürgen

過去三年,Jürgen Schmidhuber 論文年均被引用數量為 4133 次。

機器之心「GMIS 2017」嘉賓:LSTM之父Jürgen

在國際性比賽上,Jürgen Schmidhuber 帶領下的團隊也有著驚人的成績,在多個領域創造了第一。比如其「Deep Learners」是第一個贏得物體識別和圖像分割競賽的冠軍,也創造了世界首個超常視覺分類成績,在 9 項國際性的機器學習和模式識別領域獲得冠軍。

值得一提得是 DeepMind 與 IDSIA 實驗室的淵源。在 DeepMind 最早的四個成員中有兩個是從 IDSIA 獲得的博士學位,其中一個是聯合創始人,另一個是公司的第一名員工。之後,Jürgen Schmidhuber 也有其他的博士學生稍後加入了 DeepMind。

有趣的一點是 Jürgen Schmidhuber 和 DeepMind 創始人 Demis Hassabis 有共同的人工智慧願景——通用人工智慧。去年年初《衛報》對 Demis Hassabis 深度專訪中,他提到自己將和 DeepMind 繼續朝著「創造解決世界上一切問題的通用人工智慧」的目標前進。

而在 2014 年,Jürgen Schmidhuber 也聯合創建了 NNAISENSE,公司的目標是構建實用化的通用人工智慧系統。今年 1 月份,NNAISENSE 成功獲得了 A 輪融資。



參考文獻:

重磅 | 專訪深度學習元老Jürgen Schmidhuber:這個實驗室如何孕育DeepMind

深度 | LSTM之父Jürgen Schmidhuber為何名聲不顯?

訪談 | Jürgen Schmidhuber:人工智慧在1991年就已經獲得了「意識」

深度 | LSTM 和遞歸網路基礎教程

想了解 Jürgen Schmidhuber 的更多精彩分享?他將在 GIMS 2017 現場等你!

機器之心「GMIS 2017」嘉賓:LSTM之父Jürgen

「2017 全球機器智能峰會(GMIS 2017)是由機器之心主辦的關注全球人工智慧及相關領域的行業盛會,將於 5 月 27 日至 28 日在北京 898 創新空間舉行。在此次大會上 Jürgen Schmidhuber 將會為大家分享更多有關技術、研究等方面的精彩內容。

有關 GMIS 2017 大會的更多亮點,我們接下來將持續為大家展現。在機器智能時代,機器之心誠邀人工智慧從業者及愛好者參會。獲取大會詳情及購票信息,請點擊「閱讀原文」查看大會官網。」

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

綜述|一文幫你發現各種出色的GAN變體
業界|自動駕駛事故頻發:Uber步特斯拉、谷歌之後塵
OpenAI詳解進化策略方法:可替代強化學習
全面解讀深度強化學習:從基礎概念到AlphaGo
2017電聖人機大戰:騰訊「絕藝」再添勝利獎盃

TAG:機器之心 |

您可能感興趣

感測器升級+支持APP:Panasonic 松下 推出 新款 RULO 掃地機器人 MC-RS800
機器之心 GMIS 2017
對話Yoav Shoham:機器是無法取代人類的 | GMIC 2017
蘇黎世聯邦理工學院教授Brad Nelson:微型機器人不是夢 | CCF-GAIR 2017
文本直送科技新聞:GTC 2017:利用兩台 Theta 與 Jetson TK2 打造機器人店員
IFA2017|3D掃描+4重清潔系統 德國Miele派出Scout RX2掃地機器人坐鎮主場
斯坦福大學教授 Oussama Khatib:打造潛水機器人 Ocean One 總共分幾步?| CCF-GAIR 2017
BBC紀錄片:The Time Machine-《時間機器》
AAAI主席Subbarao:機器的學習過程與人類不一樣 | CCF - GAIR2017
WRC2017:俄羅斯機器人協會主席Vitaly Nedelskiy
時刻陪伴你 Alpha 1Pro機器人登陸WRC2017
亞馬遜、DHL搶著用的倉庫機器人:Locus Robotics「LogTV 60s 第11期」
對話機器學習教父Tom Mitchell:人工智慧不會出現第三次衰退了 | GMIC 2017
瓦力活了!SIG 2017上NVIDIA的Isaac機器人
Crabster CR200:海下作業的螃蟹機器人
機器之心GMIS 2017尋找VIP——四大專家簽名贈書
小i機器人開放中文深度語義平台,並發布Machine Mind OS|數博會2017
【CES Asia 2017】PowerRay 小海鰩水下機器人,以第一視角感受海底世界
機器人領域開拓者:斯坦福大學機器人實驗室Oussama Khatib教授 | GAIR 2017