AI領域必看的45篇論文

最新 08-02

前言

隨著科技的進步，AI領域的發展可謂是無可限量。我們所看到的那些黑科技，其後無不囊括了大量最新、最前沿的論文。

今天小編就給大家介紹45篇讓你跟上AI時代的論文。

一、神經網路基礎部分

No1 wide_deep模型論文：

關於神經元、全連接網路之類的基礎結構，想必每個AI學者都有了解。那麼你是否真的了解全連接網路中深層與淺層的關係呢？來看看wide_deep模型吧。這篇論文會使你對全連接有個更深刻的理解。

關於該模型的更多介紹可以參考論文：

https://arxiv.org/pdf/1606.07792.pdf

在wide_deep模型中，wide模型和deep模型具有各自不同的分工。

—wide模型：一種淺層模型。它通過大量的單層網路節點，實現對訓練樣本的高度擬合性。它的缺點是泛化能力很差。

—deep模型：一種深層模型。它通過多層的非線性變化，使模型具有很好的泛化性。它的缺點是擬合度欠缺。

將二者結合起來——用聯合訓練方法共享反向傳播的損失值來進行訓練—可以使兩個模型綜合優點，得到最好的結果。

No2 wide_deep模型論文：

為什麼Adam被廣泛使用？光會用可不行，還得把原理看懂。

Adam的細節請參閱論文《Adam: A Method for Stochastic Optimization》，該論文的鏈接網址是：

https://arxiv.org/pdf/1412.6980v8.pdf

No3 Targeted Dropout模型論文：

你還在用普通的Dropout嗎？Targeted Dropout比它又快又好，趕緊學習一下。

Targeted Dropout不再像原有的Dropout那樣按照設定的比例隨機丟棄部分節點，而是對現有的神經元進行排序，按照神經元的權重重要性來丟棄節點。這種方式比隨機丟棄的方式更智能，效果更好。更多理論見以下論文：

https://openreview.net/pdf?id=HkghWScuoQ

二、圖像分類部分

No4 Xception模型論文：

在那個圖像分類的時代，谷歌的Xception系列，像x戰警一樣，一個一個的打破記錄。其中的技術也逐漸成為AI發展的知識體系。了解以下，或許會對自己的工作有所啟發。

詳細情況請查看原論文《Xception: Deep Learning with Depthwise Separable Convolutions》，該論文網址是：

https://arxiv.org/abs/1610.02357

No5 殘差結構論文：

利用殘差結構，可以使得網路達到上百層的深度，快來學學吧！詳情請參閱原始論文《Deep ResidualLearning for Image Recognition》，該論文網址是：

https://arxiv.org/abs/1512.03385

No6 空洞卷積論文：

NasNet的招牌動作，雖然不是出於NASNet，但是卻被人家用得如火純青。想知道空洞卷積的感受野為什麼與層數呈指數級關係嗎？

細節請查看原論文《Multi-scale context aggregation by dilated convolutions》，該論文網址是：

https://arxiv.org/abs/1511.07122v3

No7 DenseNet論文：

另類的模型，神奇的效果，快來體驗一下吧。這可是比華佗還牛的神醫哦！

有關DenseNet模型的細節，請參考原始論文《Densely Connected Convolutional Networks》，該論文的連接是：

https://arxiv.org/abs/1608.06993

No8 EfficientNet模型論文：

知道目前位置圖像分類界誰是老大嗎？來，看看這個！

EfficientNet模型的論文地址如下：

https://arxiv.org/pdf/1905.11946.pdf

No9 Grad-CAM模型論文：

如果你能把神經元搞得透徹，你也會想到這個點子。不想聊太多！一個字「絕」！

詳細情況請參閱論文《Grad-CAM:Visual Explanations from Deep Networks via Gradient-based Localization》，該論文的鏈接網址是：

https://arxiv.org/pdf/1610.02391.pdf

No10 分類模型泛化能力論文：

知道為啥都喜歡使用ResNet模型當先鋒嗎？看看這篇論文的實驗結果吧。

論文中，在選取模型的建議中，多次提到了ResNet模型。原因是，ResNet模型在Imgnet數據集上輸出的特徵向量所表現的泛化能力是最強的。具體可以參考以下論文：

https://arxiv.org/pdf/1805.08974.pdf

三、批量正則化部分

No11 批量正則化論文：

這個沒的說，必修課！

論文《Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shift》，該論文網址是：

https://arxiv.org/abs/1502.03167

No12 實例歸一化論文：

時代不同了，批量歸一化也升級了，趕緊學學新的歸一化吧。

在對抗神經網路模型、風格轉換這類生成式任務中，常用實例歸一化取代批量歸一化。

因為，生成式任務的本質是——將生成樣本的特徵分布與目標樣本的特徵分布進行匹配。生成式任務中的每個樣本都有獨立的風格，不應該與批次中其他的樣本產生太多聯繫。所以，實例歸一化適用於解決這種基於個體的樣本分布問題。詳細說明見以下鏈接：

https://arxiv.org/abs/1607.08022

No13 ReNorm演算法論文：

ReNorm演算法與BatchNorm演算法一樣，注重對全局數據的歸一化，即對輸入數據的形狀中的N維度、H維度、W維度做歸一化處理。不同的是，ReNorm演算法在BatchNorm演算法上做了一些改進，使得模型在小批次場景中也有良好的效果。具體論文見以下鏈接：

https://arxiv.org/pdf/1702.03275.pdf

No14 GroupNorm演算法論文：

GroupNorm演算法是介於LayerNorm演算法和InstanceNorm演算法之間的演算法。它首先將通道分為許多組（group），再對每一組做歸一化處理。

GroupNorm演算法與ReNorm演算法的作用類似，都是為了解決BatchNorm演算法對批次大小的依賴。具體論文見下方鏈接：

https://arxiv.org/abs/1803.08494

No15 SwitchableNorm演算法論文：

SwitchableNorm演算法是將BN演算法、LN演算法、IN演算法結合起來使用，並為每個演算法都賦予權重，讓網路自己去學習歸一化層應該使用什麼方法。具體論文見下方鏈接：

https://arxiv.org/abs/1806.1077

四、注意力部分

No16 大道至簡的注意力論文：

大名鼎鼎的Attention is All You Need 注意力機制論文，注意力機制因2017年谷歌的一篇論文Attention is All You Need而名聲大噪。下面就來介紹該技術的具體內容。如果想了解更多，還可以參考原論文，具體地址如下：

https://arxiv.org/abs/1706.03762

No17-18 孿生注意力論文：

好比LSTM與GRU一樣，注意力他們家也出了一對雙胞胎，長得略微有點不同，但是功能一樣。

—BahdanauAttention：https://arxiv.org/abs/1409.0473。

—LuongAttention：https://arxiv.org/abs/1508.04025。

No19 各自升級的孿生注意力論文：

話說這對雙胞胎，出生後就分開了。各自學的不同的語言，一個學習漢語，一個學習中文。若干年後見面，發現二者的能力還是一樣！

BahdanauAttention注意力升級成了normed_BahdanauAttention，而LuongAttention注意力升級成了scaled_LuongAttention。都一樣的效果，你愛用哪個用哪個吧！

例如：

在BahdanauAttention類中有一個權重歸一化的版本（normed_BahdanauAttention），它可以加快隨機梯度下降的收斂速度。在使用時，將初始化函數中的參數normalize設為True即可。

具體可以參考以下論文：

https://arxiv.org/pdf/1602.07868.pdf

No20 單調注意力機制論文：

單調注意力機制（monotonic attention），是在原有注意力機制上添加了一個單調約束。該單調約束的內容為：

假設在生成輸出序列過程中，模型是以從左到右的方式處理輸入序列的。

當某個輸入序列所對應的輸出受到關注時，在該輸入序列之前出現的其他輸入將不能在後面的輸出中被關注。

即已經被關注過的輸入序列，其前面的序列中不再被關注。

更多描述可以參考以下論文：

https://arxiv.org/pdf/1704.00784.pdf

No21 混合注意力機制論文：

因為混合注意力中含有位置信息，所以它可以在輸入序列中選擇下一個編碼的位置。這樣的機制更適用於輸出序列大於輸入序列的Seq2Seq任務，例如語音合成任務。

具體可以參考以下論文：

https://arxiv.org/pdf/1506.07503.pdf

五、高級的卷積網路知識

No22 膠囊網路與動態路由的論文：

這是一股為圖像分類降溫的寒風，深刻而又尖銳的點出了卷積網路的硬傷！從此最大池化再無翻身之日。

雖然膠囊網路在實際應用中，不像它的理論那麼牛，但是對AI的幫助，卷積的理解是革命性的，非常值得一讀。另外，這也是一篇絕對讓你對數學徹底絕望的論文。花幾根白頭髮把裡面的演算法啃下來吧，這樣你與大神就能更近一步。

膠囊網路分為主膠囊與數字膠囊，主膠囊與數字膠囊之間的耦合係數是通過訓練得來的。在訓練過程中，耦合係數的更新不是通過反向梯度傳播實現的，而是採用動態路由選擇演算法完成的。該演算法來自以下論文鏈接：

https://arxiv.org/pdf/1710.09829.pdf

目前膠囊網路的研究還處於初級階段，隨著人們研究的深入，相信這些問題會得到解決。

No23 矩陣膠囊網路與EM路由演算法：

如果覺得不過癮，那麼還可以再看一篇。繼續自虐一下。

帶有EM（期望最大化）路由的矩陣膠囊網路是動態路由膠囊網路的一個改進版本。論文鏈接如下：

https://openreview.net/pdf?id=HJWLfGWRb

No24 膠囊網路的其它用處：

膠囊網路渾身是寶，但就是自己不爭氣，這也說明還有上升的空間。就拿其中一個動態路由演算法來講，居然比普通的注意力還好。

該論文的實踐也證明，與原有的注意力機制相比，動態路由演算法確實在精度上有所提升。具體介紹可見以下論文：

https://arxiv.org/pdf/1806.01501.pdf

No25 卷積網路新玩法TextCNN模型：

TextCNN模型是利用卷積神經網路對文本進行分類的演算法，由 Yoon Kim 在 Convolutional Neural Networks for Sentence Classification 一文中提出。論文地址：

https://arxiv.org/pdf/1408.5882.pdf

六、圖像內容處理部分

No26 FPN模型論文（包含了ROIAlign的匹配演算法）：

FPN的原理是：將骨幹網路最終特徵層和中間特徵層的多個尺度的特徵以類似金字塔的形式融合在一起。最終的特徵可以兼顧兩個特點——指向收斂目標的特徵準確、特徵語義信息豐富。更多信息可以參考論文：

ROIAlign層中的匹配演算法也來自於這篇FPN論文，鏈接如下：

https://arxiv.org/abs/1612.03144

No27 Mask R-CNN模型論文：

效果好，代碼多！硬貨！來啃吧！

Mask R-CNN模型是一個簡單、靈活、通用的對象實例分割框架。它能夠有效地檢測圖像中的對象，並為每個實例生成高質量的分割掩碼，還可以通過增加不同的分支完成不同的任務。它可以完成目標分類、目標檢測、語義分割、實例分割、人體姿勢識別等多種任務。具體細節可以參考以下論文：

https://arxiv.org/abs/1703.06870

No28 YOLO V3模型論文：

這個模型的特點就是快！

目標識彆強烈推薦，YOLO V3模型的更多信息可以參考以下鏈接中的論文：

https://pjreddie.com/media/files/papers/YOLOv3.pdf

No29 Anchor-Fress模型--FCOS模型論文：

與YOLO V1相比， FCOS模型的思想與YOLO V1模型非常相似，唯一不同的是FCOS模型沒有像YOLOv1那樣只考慮中心附近的點，而是利用了ground truth邊框中所有的點來進行預測邊框。並且通過 center-ness 分支來抑制那些效果不行的檢測邊框。這樣FCOS 就可以改善YOLO V1模型總會漏掉部分檢測邊框的缺點。

相關論文地址：

https://arxiv.org/abs/1904.01355

No30 Anchor-Fress模型--CornerNet-Lite模型論文：

一樣也是Anchor-Fress模型，與FCOS效果差不多少。具體看一下論文吧CornerNet-Lite模型。相關論文地址：

https://arxiv.org/pdf/1904.08900.pdf

No31 棧式沙漏網路模型--Hourglass論文：

論文地址：https://arxiv.org/abs/1603.06937

No32 OCR必修課——STN模型論文：

可以讓模型自動仿射變化，你說厲不厲害！要學OCR，就得從這個開始。

有關STN模型的論文鏈接如下：

https://arxiv.org/abs/1506.02025

七、循環神經網路部分

No33 QRNN模型論文：

想更多了解QRNN，可以參考以下論文：https://arxiv.org/abs/1611.01576

No34 SRU模型論文：

SRU單元在本質上與QRNN單元很像。從網路構建上看，SRU單元有點像QRNN單元中的一個特例，但是又比QRNN單元多了一個直連的設計。

若需要研究SRU單元更深層面的理論，可以參考如下論文：

https://arxiv.org/abs/1709.02755

No35 IndRNN模型論文：

將IndRNN單元配合ReLu等非飽和激活函數一起使用，會使模型表現出更好的魯棒性。

有關IndRNN單元的更多理論，可以參考論文：

https://arxiv.org/abs/1803.04831

No36 IndRNN模型論文：

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 美亞柏科 的精彩文章:

※2019中國電子數據取證峰會精華整理，不容錯過！
※不忘初心，牢記使命！

TAG:美亞柏科 |