當前位置:
首頁 > 科技 > 美國「統治」ICML 2020!中國大陸入選論文數僅為美國1/6,原因竟與春節有關

美國「統治」ICML 2020!中國大陸入選論文數僅為美國1/6,原因竟與春節有關

新智元報道

來源:medium

編輯:薯條、白峰

【新智元導讀】第三十七屆ICML將於2020年7月13日至18日舉行。近日,有關論文錄取的數據放出,引發廣泛討論。美國企業和學者在此屆ICML表現驚人,美國「出品」的論文竟然佔了將近3/4,英國和中國分列第二第三,但數據和美國相差甚大。

距離第三十七屆ICML還有不到一個月的時間。

本屆ICML將在2020年7月13日至18日,採用虛擬會議的形式舉行。從6月3日放出的論文接收結果來看,ICML 2020共提交了4990篇論文,接受了1088篇論文,接受率僅為21.8%,較前幾年來講都有下降。

作為機器學習的頂會,ICML 2020的錄取論文備受關注。一位叫Sergei Ivanov的博主在Medium詳細的整理了ICML 2020的論文接受情況,並就作者、機構、國家等問題做出了分析。

日本學者高產11篇,Google領銜各機構組織

下圖展示了在發表論文數目上靠前的作者。

? ?

?

可以看到Masashi Sugiyama以11篇論文在論文數目方面位居榜首。他是一位日本的學者,現在在日本理化學研究所(RIKEN)和東京大學工作,主要的研究方向為機器學習和統計數據分析的理論和應用。

並列第二名分別是來自DeepMind的Michal Valko,來自UC Berkeley的Michael Jordan和來自Google / U. of Alberta的Dale Schuurmans,他們都取得了8篇的好成績。

談到作者,不得不再比較一下機構組織的數據。下圖展示了前30機構組織的入選論文數目的數據。

? ?

?

Google在機構組織論文數上大有「碾壓」的趨勢,114篇這個數字甚至大約佔了ICML發表論文的1/10,並且遠超於第二名。而在近幾日舉辦的CVPR 2020中,Google同樣也表現出色,可見Google在人工智慧,機器學習領域成果斐然。

第2至4名由三個學校獲得:MIT,Stanford和Berkeley。同屬Alphabet的Deepmind獲得了第5名,前五名的組織機構均超過了50篇。

需要注意的是,由於部分論文是合作完成的,因此Google的114篇和Deepmind的51篇中有部分重合。

美國「出品」論文約佔3/4!中國大陸和英國論文總數分庭抗禮

這一部分數據依據論文作者來統計了各國家地區發表論文的數量。但是,作為免責聲明,作者提到了,這種關聯數據之間可能存在偏差,並不完全準確。

? ?

?

按照作者所在國家來看,美國以728篇穩居榜首,大約是接收論文總數的3/4!

儘管英國和中國大陸以123篇和122篇位居第二和第三,但是這個數字大約只是美國的1/6,至少在ICML 2020方面,美國的優勢巨大。

美國佔比如此之大也不是不無道理。一方面,美國在人工智慧、機器學習領域的技術位居前沿,這是無可厚非的事情。另一方面,按照論文作者統計國家的時候更多的是基於作者所處的機構組織的國家,因此統計並不準確。例如一位論文作者在Google蘇黎世工作,發表了論文,那麼該論文依舊是算在美國總數中的,因為Google屬於美國企業。

當然,知乎上也有網友提出,ICML 2020的提交時間恰巧與中國春節「撞車」,許多中國實驗室都在休假之中,因此即便有相關論文,可能也會留給NeurIPS而不是選擇參加ICML。

? ?

? ?

為了得到更準確的數據,Sergei Ivanov還採用了作者所屬大學來分類,最後得到了類似的結果。這個數據不考慮企業機構,只考慮科研機構,但美國研究者仍然佔一半以上。因此,如果加入工業界的研究者的數目,可能依舊會得到之前基於作者國家的那張圖。

接下來我們分析一下主要國家的具體數據。

? ?

美國工業和學術領域都貢獻了許多論文,企業和學校機構平分秋色。

? ?

?

而英國則是DeepMind一枝獨秀,其餘大多是知名院校。DeepMind發表的文章大約佔英國文章總數的40%。

? ?

?

從論文接受數量來看,清華、北大領銜國內高校。但是像華為、百度和阿里巴巴這樣的科技公司也在連年進步。

? ?

?

加拿大的ICML論文則是被高校「統治」,並沒有看到企業的身影。

? ?

?

比較企業組織和學校組織的論文錄取情況,除了美國,學校機構還是佔據大比例。全球來看,大學發表論文數量是企業的3倍。

各組織機構「協作」論文,互利共贏

最後我們來分析一下論文的協作情況。

? ?

?

可見,大多數論文都是由3-4個作者協作完成的。也有例外情況:有兩篇文章是由15位作者協作完成的

? ?

?

而大多數論文有1或2個組織,也有7個組織參與的論文。

Sergei Ivanov還構建了一張表現不同組織協作方式的圖,圖中包含426個節點和1206條邊,繪製這張圖可以得到一堆由邊連接的點。

? ?

每個點的意義是組織結構,連接的意義則是協作。不同的大小和顏色標誌了每個節點的論文數量的不同,邊的寬度由協作的數量決定。

這邊以一個有至少30個協作節點的子圖為例。

? ?

?

這樣就很直觀的展示了機構和學校協作的關係。

本文比較全面的分析了ICML 2020論文投稿的數據,從作者,國家,機構各個方面,真實的反饋了機器學習的現狀。有助於機器學習領域的科研者很好的了解行業的變化趨勢。

參考鏈接:https://medium.com/criteo-labs/icml-2020-comprehensive-analysis-of-authors-organizations-and-countries-c4d1bb847fde

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

全球規模最大場景最豐富自動駕駛演算法挑戰賽,中國AI晶元公司霸榜4項第一
Github高贊的YOLOv5引發爭議?Roboflow和開發者這樣說