「Bengio領銜」巴黎高工數據科學暑期學校課程要點合集

新聞 09-07

1新智元編譯

詳細課程計劃和PPT、網站鏈接等可以在這裡找到：http://www.ds3-datascience-polytechnique.fr/program/

「Bengio領銜」巴黎高工數據科學暑期學校課程要點合集

這是巴黎綜合理工學院（Ecole Polytechnique）數據科學暑期學校（8月28日~9月1日）的現場記錄。

講者包括：

Yoshua Bengio - 蒙特利爾大學教授（深度學習）
Csaba Szepesvari - 阿爾伯塔大學（Bandits）
Pradeep Ravikumar - CMU助理教授（圖模型）
Peter RichtarikI - 愛丁堡大學副教授（隨機優化方法）
Cédric Archambeau - Amazon 首席應用科學家
Olivier Bousquet - 谷歌技術總監
Damien Eenst - 烈日大學（Université de Liège）教授
Laura Grigori - INRIA研究總監
Sean Meyn - 佛羅里達大學教授
Sebastian Nowozin - 微軟劍橋研究院研究員
Stuart Russell - UC伯克利大學教授

Yoshua Bengio：深度學習

「Bengio領銜」巴黎高工數據科學暑期學校課程要點合集

在 Ecole Polytechnique 校長 Jacques Biot 以及暑期學校主要組織者的介紹講話後，Yoshu Bengio 首先以「深度學習AI」為題演講，涉及反向傳播、深度前饋神經網路、技巧、RNN和NLP等。他的講話非常general，講了一些好的工作中的state-of-the-art的方法，當前深度神經網路可以做什麼，研究熱點以及下一個前沿。

Yoshua Bengio 演講的要點：

組合性（compositionality）的想法

1. 分散式表示/嵌入

2. 特徵層次結構

視覺和語音識別的人類水平能力
NLP正在進步，但仍有很多工作要做
ML的五個組成部分

1. 大量數據

2. 非常靈活的模型

3. 足夠的計算能力

4. 計算上高效的推理

5. 能夠打敗維度災難（curse of dimensionality）的強大prior

深度學習的新東西

1. 無監督生成神經網路，例如GAN

2. 使用gating單元的注意力機制，例如，神經機器翻譯

3. 記憶增強神經網路（memory-augmented network）

4. 課程學習（curriculum learning）

5. 0-shot 學習

6. 使用不同的modality（圖像、文本、聲音）

7. 多任務學習（分類、回歸、圖像到文本、圖像到聲音）

對於序列數據，要處理與RNN的長期依賴關係，使用多個時間尺度
解開representation的潛在因素，深度學習會產生原始數據的線性化動檢，以便對圖像、辭彙等做線性代數
對於「需要多少數據」這種很重要但很難回答的問題，Yoshua提出了一個相當簡單但有些令人失望的答案：繪製「準確度 vs 樣本量」的經驗曲線，只要能繼續提高準確度，就繼續收集數據。

Sean Meyn：強化學習

「Bengio領銜」巴黎高工數據科學暑期學校課程要點合集

接著，Sean Meyn針對強化學習做了題為「隱藏理論和新的超快演算法」的講課，非常技術，作者表示不太理解。

Sean Meyn講課的要點：

對於強化學習，學習隨機逼近而不是重新發現特定case

Pradeep Ravikumar：概率圖模型

「Bengio領銜」巴黎高工數據科學暑期學校課程要點合集

Pradeep Ravikumar 的講課介紹了概率圖模型（表示、推理、學習）。

Pradeep Ravikumar 講課的要點：

PGM是存儲分布和執行推理的一種便捷方式
用於概率圖模型（Probabilistic Graphical Model）的 Python 庫
概率圖模型（PGM）和pgmpy的簡明教程

Peter Richtarik：隨機優化方法

「Bengio領銜」巴黎高工數據科學暑期學校課程要點合集

Peter Richtarik 的課有關隨機優化方法。

Peter Richtarik 課的要點：

優化（optimization）標準演算法工具箱的8個工具

1. 梯度下降

2. 加速

3. proximal 技巧

4. 隨機分解（隨機梯度下降（SGD）/隨機坐標下降（RCD））

5. minibatching

6. 方差縮減

7. 重要採樣

8. duality

Stuart Russell：BLOG模型

「Bengio領銜」巴黎高工數據科學暑期學校課程要點合集

Stuart Russell 的課介紹了他的 BLOG 模型。他注意到，統計學長期以來忽略了語法（syntax），而syntax 在理論計算機科學和邏輯學中出現很多，後兩個領域（CS，邏輯學）長期以來是AI的主要方法。他的想法是將統計學和邏輯學結合起來。具體來說，是在類似prolog的語言中引入數據，或在類似PGM的語言中引入一階邏輯語法。

Stuart Russell 課的要點：