《深度學習與機器人學》大牛Pieter Abbeel 105頁PPT下載
【新智元導讀】2019年開啟之際,美國加州大學伯克利分校教授、機器人與強化學習領域專家 Pieter Abbeel 發布了一份資源大禮:《深度學習與機器人學》105頁PPT。這份PPT整理自Abbeel教授2018年受邀參加的69個演講,內容涵蓋監督學習、強化學習和無監督學習的重要進展,以及深度學習的主要應用等方面,有助於讀者對深度學習和機器人學有一個宏觀的理解。
Pieter Abbeel教授從AI近年的一些「熱論」講起,從馬斯克認為AI是人類文明面臨的最大威脅、普京說「誰能成為 AI 領域的領袖,誰就將成為世界的主宰者」,概述了近年來AI的熱潮:NIPS等頂會的參會人數達到史上最高、arxiv上AI領域的論文翻倍增長。
報告的主體部分是「深度學習成功」,詳細介紹了監督學習、強化學習和無監督學習的重要進展。Pieter Abbeel教授對這三個概念的解釋如下:
監督學習
:模式識別,如果有足夠多的數據(input -> output pairs),那麼神經網路就能夠學習模式;
強化學習:
通過試錯的過程,學習目標導向的行為無監督學習:
沒有明確的監督的條件下,學習世界的結構
最後,報告展示了深度學習的一系列應用。
PPT下載地址:
https://www.dropbox.com/s/dw4kmxkrv3orujd/2018_12_xx_Abbeel--AI.pdf?dl=0
Pieter Abbeel教授簡介
Pieter Abbeel,加州大學伯克利分校教授、機器人學習實驗室主任,伯克利人工智慧研究(BAIR)實驗室聯合主任。
Pieter Abbeel是機器人和強化學習領域的大牛。Pieter Abbeel 2008年從斯坦福大學獲得博士學位,師從百度前首席科學家 Andrew Ng(吳恩達),畢業後在UC Berkeley任教。
2016~2017年,Pieter Abbeel加入Open AI,任研究科學家。現在則是Open AI顧問。
Pieter Abbeel還是兩家AI公司的創始人,Gradescope和covariant.ai。Gradescope開發為家庭作業、課題研究、試卷等打分的AI系統;covariant.ai開發機器人自動化的AI系統,在製造/倉儲/電子商務/物流等領域應用。
Pieter Abbeel 的研究重點特別集中於如何讓機器人向人類學習(學徒學習),如何讓機器人通過自己的試錯過程學習(強化學習),以及如何通過從learning-to-learn(元學習)過程中加快技能獲取。他開發的機器人已經學會了先進的直升機特技飛行、打結、基本裝配、疊衣服、移動、以及基於視覺的機器人操作。
機器人疊毛巾
機器人疊毛巾
Pieter Abbeel目前的主要研究方向:機器人和機器學習,特別關注深度強化學習、深度模仿學習、深度無監督學習、元學習、learning-to-learn、以及AI安全。
PPT全文
PPT下載地址:
https://www.dropbox.com/s/dw4kmxkrv3orujd/2018_12_xx_Abbeel--AI.pdf?dl=0


TAG:新智元 |