當前位置：

首頁 > 新聞 > 何愷明ECCV 2018教程：深度學習就是表示學習

何愷明ECCV 2018教程：深度學習就是表示學習

新聞 09-16

新智元AI WORLD 2018世界人工智慧峰會

倒計時4天

新智元將於9月20日在北京國家會議中心舉辦AI WORLD 2018世界人工智慧峰會，計算機視覺領域先驅、約翰霍普金斯大學認知與計算機科學系教授Alan Yullie將親臨會場，發表主題演講《深度網路及更多：大數據不是萬能的》。隨著計算機視覺技術的發展，如何利用小數據乃至無數據解決特定應用場景問題，將是最新的一個關鍵點，歡迎到現場交流！

活動行購票二維碼：

新智元推薦

來源：kaiminghe.com

作者：何愷明

【新智元導讀】在今年ECCV 2018上，Facebook的何愷明做了一個題為「Learning Deep Representations for Visual Recognition」的講座。內容重點涵蓋ResNet/ResNeXt的細節結構以及一系列重要模型的回顧。何愷明與吳育昕合作的論文Group Normalization獲得今年ECCV最佳論文提名獎，在這個講座中也有提及。

深度學習即表示學習

機器學習任務的表示（原始）數據：

視覺：像素，......

語言：字母，......

語音：聲波，......

遊戲：狀態，......

表示學習：AlphaGo

Bad representations 模型（神經網路） good representations

神經網路的進化

學習表示：通過反向傳播，端到端地學習

LeNet

卷積

局部連接

空間上權重共享（權重分配是DL的關鍵，例如，RNN在時間上共享權重）

子採樣

完全連接的輸出

通過反向傳播訓練

AlexNet

AlexNet 保留LeNet風格的骨架，再加上：

ReLU

「RevoLUtion of deep learning」

訓練加速; 更好的grad prop（與tanh相比）

Dropout

網內集成

減少過度擬合

數據增強

保留標籤的轉換

減少過度擬合

VGG-16/19

「非常深的網路！」

初始化方法

歸一化前向/後向信號的分析公式

基於強假設（如高斯分布）

GoogLeNet / Inception

GoogLeNet有很多版本，但有3個主要屬性是不變的：

多個分支

短路連接（shortcut）

Bottleneck

批量歸一化（BN）

Xavier / MSRA init不能直接應用於多分支網路

優化多分支卷積網路（包括所有Inceptions和ResNets）主要受益於BN

批量歸一化（BN）

Recap：標準化圖像輸入（LeCun等人1998提出的「Efficient Backprop」）

BN：data-driven的標準化，對每一層、每個mini-batch都是如此

大大加速訓練

對初始化不敏感

改進正則化

ResNets

只是簡單地堆疊層嗎？

簡單地堆疊層的網路（Plain nets）堆疊3x3的卷積層，堆到56層的時候比20層的時候訓練誤差和測試誤差都更高。

「過於深」的plain nets具有較高的訓練誤差

這是在許多數據集都觀察到的一般現象

更深的模型不應該訓練誤差反而更高

通過改善結構的解決方案：

原始層：從已學習的淺層模型複製

額外層：設置為identity

至少保持訓練誤差相同

深度殘差學習

對於Plain net：

H(x) 是任何想要的映射，希望subnet符合H(x)

對於Residual net：

同樣，H(x) 是任何想要的映射，但我們希望subnet符合F(x)，即

H(x) = F(x) + x

在這裡，F(x)是一個殘差映射，與它相關的是identity

如果identity是最優的，則容易將權重設置為0

如果最佳映射接近identity，則更容易發現小的波動

在CIFAR-10數據集上的實驗

深層的 ResNets可以毫無困難地進行訓練

更深的ResNets具有更低的訓練誤差，並且還可以降低測試誤差

在ImageNet數據集上的實驗

更深的ResNets具有更低的誤差

計算機視覺任務之外，residual connections用於神經機器翻譯（NMT）

residual connections 用於語音合成（WaveNet）

AlphaGo Zero：使用了40個 Residual Blocks

ResNeXt：準確率更高，在各類競賽屢獲冠軍

更多架構：

Inception-ResNet [Szegedy et al 2017]

DenseNet [Huang et al CVPR 2017]

Xception [Chollet CVPR 2017]

MobileNets[Howard et al 2017]

ShuffleNet [Zhang et al 2017]

組規範化（GN）

與batch size無關

對小批量有魯棒性

總結

深度學習是表示學習

PPT下載地址：

http://kaiminghe.com/eccv18tutorial/eccv2018_tutorial_kaiminghe.pdf

新智元AI WORLD 2018世界人工智慧峰會

倒計時4天

門票已開售！

新智元將於9月20日在北京國家會議中心舉辦AI WORLD 2018世界人工智慧峰會，邀請機器學習教父、CMU教授 Tom Mitchell，邁克思·泰格馬克，周志華，陶大程，陳怡然等AI領袖一起關注機器智能與人類命運。

大會官網：

http://www.aiworld2018.com/

活動行購票鏈接：

http://www.huodongxing.com/event/6449053775000

活動行購票二維碼：

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※英特爾繼續「買買買」！收購NetSpeed，發力晶元設計自動化
※世界首款AI魔鏡：一照識別你性格

TAG:新智元 |