ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現｜ICLR 2017

新聞 04-24

雷鋒網AI科技評論按：ICLR 2017 將於4月24-26日在法國土倫舉行，屆時雷鋒網AI科技評論的編輯們也將前往法國帶來一線報道。在這個深度學習會議舉辦之前，雷鋒網也將圍繞會議議程及論文介紹展開一系列的覆蓋和專題報道，敬請期待。

Andrej Karpathy認為，把每篇論文在 ICLR 2017 （International Conference on Learning Representations，一個廣受歡迎的深度學習會議）的入選情況（分為4種：口頭報告 (oral) ，海報展示 (poster) ，進一步研討 (workshop) ，被拒 (reject) ），和該論文被添加到arxiv-sanity網站的 library 的次數進行交叉比較，是一件很有趣的事情。某篇論文是否能入選 ICLR 2017 ，是由幾個相應領域的領頭人和審稿人，經過幾個月時間的審閱後才能決定的。而在 arxiv-sanity 上參與決定的人，只有每月為此投入總共2個小時的原作者，當然還有應對投稿洪流的若干網站工作人員。現在讓我們來看看這場自上而下、自下而上的戰役會發生什麼。

投稿論文在 ICLR 2017的入選情況可以參看OpenReview.net的情況，投稿論文共計491篇，其中15篇（3％）論文將在會上做口頭報告，183篇（37.3％）論文將被製成海報在會上展覽，48篇（9.8％）論文被建議進一步研討，245篇（49.9％）論文被拒絕。 ICLR 2017將於4月24日至27日在土倫舉辦，屆時入選的論文將在會議上進行展示。期待一睹土倫這個美麗的城市：

ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現｜ICLR 2017

法國土倫

扯遠了，讓我們言歸正傳回到文章主題上。

另一方面，作者一方的 arxiv-sanity 網站具有library功能。換言之，任何註冊用戶都可以在該網站上他們的 library 里添加論文，然後基於所有收藏論文全文的二元 tf-idf 特徵， arxiv-sanity 將為每位用戶訓練出個性化的支持向量機 (Support Vector Machine) ，提供基於內容的論文推薦。例如在網站里的 library 收藏一些關於加強學習 (Reinforcement Learning) 、生成模型 (Gnerative Models) 、計算機視覺 (Computer Vision) 的論文，無論網站何時出現關於這些主題的新論文，它們都將出現在「推薦」標籤中的最上方。現在 arxiv-sanity 網站上的審查池 (review pool) 總共有3195個用戶——他們是 library 里收藏至少一篇論文的用戶，這些用戶迄今共收錄了55671篇論文，平均每人17.4篇。

arxiv-sanity 網站一個很重要的特徵是，用戶贊同 (upvote) 一篇論文後，會產生相應的影響。因為用戶收錄論文的動機暗示著此論文對用戶來說非常重要，所以當用戶收錄一篇論文時，該論文會增加該文章方向上的推薦權衡，進而影響推薦給用戶的論文。

實驗

長話短說， Andrej 對 ICLR 中的所有論文進行了循環，然後在 arxiv-sanity 網站上，通過嘗試對收錄的論文的標題進行全字元匹配，把相同的論文找出來。論文沒法匹配的原因可能是，有些 ICLR 論文沒有被網站收錄，有些論文因為作者重命名後與原題目不匹配，或者因為題目中包含不能匹配的奇特字元等。

例如，對 ICLR 2017進行口頭報告的論文進行匹配，作者得到的結果是：

15篇進行口頭報告的論文，在 arxiv-sanity 網站上找到了以下10篇，附帶網站里的 library 收藏數：

ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現｜ICLR 2017

這裡看到，在 ICLR 做口頭報告的15篇論文， arxiv-sanity 收錄了10篇，題目左邊的數字是網站里將這篇論文添加到 library 的用戶數，例如， "Reinforcement Learning with Unsupervised Auxiliary Tasks" 被64個 arxiv-sanity 用戶添加到了 library 。

183篇製成海報展覽的論文，在 arxiv-sanity 網站上找到了以下113篇，附帶網站里的 library 收藏數：

ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現｜ICLR 2017

某些論文得到了很多人的青睞，最多達到149人！然而收藏某些論文的人一個也沒有。

建議進一步研討的論文，結果如下：

48篇建議進一步研討的論文，在 arxiv-sanity 網站上找到了以下23篇，附帶網站里的 library 收藏數：

ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現｜ICLR 2017

作者不打算列出總計200篇被拒絕的論文， Arxiv-sanity 用戶真的非常喜歡其中一些論文，但是 ICLR 會議涉及領域的領頭人和審稿人一點也不喜歡：

245篇被拒絕的論文，在 arxiv-sanity 網站上找到了以下58篇，附帶網站里的 library 收藏數：

ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現｜ICLR 2017

以上所列論文的前幾篇，投稿遭到拒絕這一結局對它們來說可能不太公平。

現在另一個問題是—— ICLR 2017的投稿論文如果只由 arxiv-sanity 用戶投票評選（可以在 arxiv 上找到的論文），結果會是怎麼樣子的呢？這是投票結果的一個摘錄：

做頭口報告的論文：

ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現｜ICLR 2017

製成海報展覽的論文：

ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現｜ICLR 2017

由 arxiv-sanity 用戶投票評選的完整列表可以看這裡。請注意，基於 arxiv-sanity 用戶的投票評選結果，一些被拒絕的 ICLR 2017投稿論文，幾乎優秀到可以進行口頭報告，特別是以下這幾篇：

"The Predictron: End-To-End Learning and Planning"

"RL^2: Fast Reinforcement Learning via Slow Reinforcement Learning"

"Understanding intermediate layers using linear classifier probes"

"Hierarchical Memory Networks"

相反地， arxiv-sanity 用戶對一些入選的論文並不太喜歡，以下是完整的混亂矩陣：

ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現｜ICLR 2017

這是文本形式的混亂矩陣，每一欄還附帶了論文的標題。這矩陣看起來不太糟糕，只是雙方在評選進行口頭報告的論文上面分歧很大；同意製成海報展覽的論文，雙方分歧相對少很多；最重要的是，進行口頭報告與被拒絕的論文之間的分歧非常小，同時製成海報展覽的論文與被拒絕的論文之間的分歧也非常少。此外，祝賀 Max 等，因為 "Reinforcement Learning with Unsupervised Auxiliary Tasks" 是唯一一篇雙方都同意應該進行口頭報告的優秀論文:)

最後，幾天前作者在媒體上看到以下這篇由卡洛斯·佩雷斯 (Carlos E. Perez）撰寫的文章："Ten Deserving Deep Learning Papers that were Rejected at ICLR 2017"，似乎 arxiv-sanity 用戶的看法與這篇文章的意見不謀而合。包括 LipNet ，在這篇文章里列出的所有論文（同樣可以在 arxiv-sanity 上找到）應該成為入選論文，和 arxiv-sanity 用戶的看法出奇一致。

討論

注意：這裡存在幾個使結果有所偏斜的因素。例如， arxiv-sanity 用戶群的大小隨著時間的推移而增大，所以這些結果可能稍微偏向於後期收錄在 arxiv-sanity 的論文，因為越往後收錄進網站的新論文越容易引起更多用戶的關注。除此之外，論文被看到的頻率並不相同。例如，如果論文被有名人士轉發，看到論文的人會更多，將論文添加到他們 library 的人也會更多。最後，另一個更好地說明傾斜存在的理由是，在 arxiv-sanity ，好論文的曝光率會更多，因為收錄在 arxiv-sanity 的論文不是匿名的，好論文當然會得到更多的關注，在 ICLR 同樣存在這種特殊情況，所以在這一點上雙方沒有區別。

終上所述， Andrej Karpathy從這個實驗得出的結論是：哪些投稿論文可以入選 ICLR 的徵兆很多。而且結果是從互聯網這個自下而上的評選過程中「免費」獲得的，而不用幾百人用幾個月時間才能得出結果。作者想對被拖延幾個星期或者幾個月，長時間處於巨大壓力下，忍受來回辯駁痛苦的提交方或者審查方說：也許你們不需要這麼痛苦。或者至少，改進的空間很大。

更多資訊請關注雷鋒網。

via medium, 雷鋒網編譯，頭圖viaJulia Manzerova@flickr

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章:

※John McAfee 觀點：人工智慧是否會毀滅人類？
※谷歌TPU項目核心成員離職了，他們想建「下一代AI晶元」
※關於發布會上未提及的ES8的細節，聽聽蔚來汽車副總裁朱江是怎麼說的 | 上海車展 2017
※愛冒險的Uber，也曾和蘋果玩過「貓鼠遊戲」
※谷歌Play一安卓「系統升級」暗藏「間諜」，數百萬人已中招

TAG:雷鋒網 |

您可能感興趣

※Nintendo Life評選Switch上30大RPG
※Sankaku Complex評選醉酒動漫角色TOP10
※潮流 | ?Collider評選出Netflix 2018影集Top 10，你看了哪幾部？
※YouTube評選年度最高人氣KPOP MV！Blackpink獲一位
※「數毛組織」Digital Foundry評選2018年畫面最好的遊戲
※Honey s Anime評選虛無主義動漫人物TOP10
※Get it beauty從100張面膜中評選了TOP5，我竟然都沒用過
※權威雜誌《Sound&Vision》發布2018上半年「最佳音箱」評選結果
※揭秘2018圖靈獎評選：Jeff Dean李開復和Lecun寫信推薦Hinton
※Fashion Revolution 評選全球供應鏈「最透明」品牌，Adidas和Reebok 位居榜首
※美人計 | Get it beauty從100張面膜中評選了TOP5，我竟然都沒用過
※Jujotech在行業雜誌CIO Review雜誌評選中名列前茅
※DotC United Group旗下廣告公司成功入圍Google全球優秀合作夥伴大獎評選活動
※外媒評選手機最美後攝：iPhone 11/Pixel 4墊底
※《Sound + Image》年度評選（一）
※The Verge評選中國智能手機前8名，vivo NEX S居榜首
※《Sound + Image》年度評選終篇
※Physics World 評選出2018年度十大科學突破
※憑藉出眾的顯示屏，iPad Pro、iPhone X獲SID評選的兩個年度大獎
※《Fast Company》評選：21世紀最糟糕的20部手機

ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現 ｜ICLR 2017

ICLR 論文評選吃力不討好？ arxiv-sanity上有新發現｜ICLR 2017