當前位置:
首頁 > 新聞 > 最後一屆ImageNet榜單出爐:顏水成等中國團隊奪多項冠軍

最後一屆ImageNet榜單出爐:顏水成等中國團隊奪多項冠軍

計算機視覺的未來的重點將是什麼,ImageNet 競賽之後,又會出現什麼呢?

新智元報道

報道:張易 胡祥傑 文強

【新智元導讀】2017年ImageNet (ILSVRC2017)的比賽結果新鮮出爐:在物體檢測(識別)、物體定位、視頻物體檢測三個大類中,南京信息工程大學和帝國理工學院組成的 BDAT 團隊、新加坡國立大學與奇虎360合作團隊、倫敦帝國理工學院和悉尼大學合作的團隊分別拿下冠軍。根據此前的消息,本屆大規模視覺識別挑戰賽(ILSVRC)將是最後一屆比賽。

GIF/38K

來自ImageNet官方網站的最新消息,2017年ImageNet Large Scale Visual Recognition Challenge 2017 (ILSVRC2017)的比賽結果新鮮出爐:在物體檢測(識別)、物體定位、視頻物體檢測三個大類的競賽中,南京信息工程大學和帝國理工學院組成的 BDAT 團隊、加坡國立大學與奇虎360合作團隊、倫敦帝國理工學院和悉尼大學合作的團隊分別拿下冠軍。

根據此前的消息,本屆大規模視覺識別挑戰賽(ILSVRC)將是最後一屆,以後的比賽將會超越「識別」,往「理解」上發展。

比賽結果

1、物體檢測(object detection)

下圖,任務1a,用提供的訓練數據進行物體檢測,前三名都被由南京信息工程大學和帝國理工學院組成的 BDAT 團隊包攬,其中 submission4 排在第一,探測物體勝出種類數量 85,平均 AP 0.731392。

BDAT 代表隊的人員組成如下:

來自南京信息工程大學:Hui Shuai、Zhenbo Yu、Qingshan Liu、Xiaotong 、Kaihua Zhang、Yisheng Zhu、Guangcan Liu、Jing Yang來自帝國理工學院:Yuxiang Zhou、Jiankang Deng

下圖,任務1b,使用額外訓練數據進行物體探測。前兩名由南京信息工程大學和帝國理工學院組成的 BDAT 代表隊包攬,使用處理過的標籤數據(refine part of training data annotation)。其中 submission5 排在第一,識別物體勝出種類數量 128 個,平均 AP 0.731613。排在第三位的是由新加坡國立大學和奇虎 360 組成的 NUS-Qihoo_DPNs (DET),識別物體勝出種類數量 14 個,平均精度 0.657609.

2.物體定位

下圖,任務2a:使用訓練數據進行分類+定位

根據定位錯誤率排列,第一名「NUS-Qihoo_DPNs (CLS-LOC)」是新加坡國立大學與奇虎360 合作提出的 DPN 雙通道網路 + 基本聚合,定位錯誤率為 0.062263。第二名、第三名都來自 Trimps-Soushen(公安部三所)

其中,新加坡國立大學與奇虎 AI 研究院合作,指出 ResNet 是 DenseNet 的一種特例,深入探討了各自優缺點並提出了一類新的網路拓補結構,也就是雙通道網路(Dual Path Network,DPN)。在 ImageNet-1k 分類任務中:該網路不僅提高了準確率,還將200 層 ResNet 的計算量降低了 57%,將最好的 ResNeXt (64x4d) 的計算量降低了25%;131 層的 DPN 成為新的最佳單模型,並在實測中提速約 300%

按照分類錯誤(從少到多),第一名是 WMW,這是 Momenta 與牛津大學合作提出的架構。據介紹,作者設計了一個名為「擠壓激勵(Squeeze-and-Excitation,SE)」的架構。每個模塊通過「擠壓」操作嵌入來自全局感受野的信息,並且通過「激勵」操作選擇性地誘導響應增強。作者在 SE 模塊的基礎上,開發了多個版本的 SENet,比如 SE-ResNet,SE-ResNeXt 和 SE-Inception-ResNet,在驗證集上實現了前 5 個錯誤率 2.3%。

下圖,任務 2b:使用額外訓練數據進行分類 + 定位

按照定位錯誤率排列,第一名仍然是新加坡國立大學與奇虎 AI 研究院的 DPN。第二名是南京信息工程大學與倫敦帝國理工大學合作的 BDAT。

按照分類錯誤率排列,結果也類似。第一名是 DPN,第二、第三名是 BDAT。

3.視頻中的物體識別

下圖,任務3a:給定訓練數據條件下的視頻物體識別

排名(按照識別出的物體種類)

第一名、第二名和第三名:IC&USYD(倫敦帝國理工學院和悉尼大學合作)

第一名成績是15個,第二名是6個,第三名是4個

按照平均準確率排名,前三名也是倫敦帝國理工學院和悉尼大學合作的團隊IC&USYD。

IC&USYD團隊成員:

Jiankang Deng, Yuxiang Zhou, Baosheng Yu, Zhe Chen, Stefanos Zafeiriou, Dacheng Tao

下圖,任務3b:額外訓練數據條件下的視頻物體識別

第一名:IC&USYD ;識別物體數量:24

第二名:NUS-Qihoo-UIUC_DPNs (VID)(新加坡國立大學、奇虎360、美國伊利諾伊大學香檳分校合作團隊);識別物體數量:3

第三名:GeorVision(歌爾聲學、南洋理工大學、清華大學、加利福尼亞大學(伯克利)、北航大學、密西根大學(安阿伯市)合作);識別物體數量:2

GeorVision團隊成員:Yejin Chen, Chunshan Bai, Zhuo Chen, Le Ge, Chengwei Li, Shuo Xu, Yuxuan Bao, Lu Bai, Xinyi Sun, Shun Yuan, Xiangdong Zhang

按照平均準確率排名:

第一名和第二名都是IC&USYD;第三名NUS-Qihoo-UIUC_DPNs (VID)

下圖,任務3c:給定訓練數據條件下的視頻物體識別/追蹤

第一名:IC&USYD ;平均準確率:0.641474

第二名:IC&USYD;平均準確率:0.544835

第三名:NUS-Qihoo-UIUC_DPNs ,平均準確率:0.544536

下圖,任務3d:額外訓練數據條件下的視頻物體識別/追蹤

第一名:IC&USYD ;平均準確率:0.642935

第二名:IC&USYD;平均準確率:0.57749

第三名:NUS-Qihoo-UIUC_DPNs(VID)0.550078

ImageNet 競賽 2017 是最後一屆,WebVision 競賽或接棒

根據ImageNet官方網站的消息:

2017 年 7 月 26 日,計算機視覺頂會 CVPR 2017 同期舉行的 Workshop——「超越 ILSVRC」(Beyond ImageNet Large Scale Visual Recogition Challenge),將宣布計算機視覺乃至整個人工智慧發展史上的里程碑——ImageNet 大規模視覺識別挑戰賽將於 2017 年正式結束,此後將專註於目前尚未解決的問題及以後發展方向。

根據「超越 ILSVRC」 Workshop 官網介紹,這堂研討會的內容主要包括以下 4 點:

發表 2017 年 ILSVRC 的結果

評估 ILSVRC 2017 圖像、視頻物體識別、分類的當前最佳結果

探討這與當前在計算機視覺產業中應用的最優技術的關係

受邀講者(目前確定的有加州大學伯克利分校的 Jitendra Malik,以及斯坦福大學教授、目前谷歌雲首席科學家李飛飛)發表講話,論述在他們看來從認知視覺到機器人視覺等領域存在的挑戰

從下圖中可見,無論的圖像分類、物體檢測、物體識別,計算機的正確率都已經遠遠超越人類。可以說,計算機視覺在感知方面的問題已經得到了很好的解決。

那麼,計算機視覺的未來的重點將是什麼,ImageNet 競賽之後,又會出現什麼呢?

WebVision 競賽

WebVision 數據集是通過蘇黎世科技大學計算機視覺實驗室的網路數據團隊收集的。這一數據集的開發得到了谷歌研究院蘇黎世分部的支持。

WebVision 數據集使用與 2012 年 ImageNet 競賽相同的 1000 個類別,涵蓋了直接從網路收集到的 240 萬張現代圖像(包括谷歌圖像搜索中獲得的 100 萬張,以及來自 Flickr 的 140 萬張圖像)和元數據。

在 CVPR 2017 上,也會舉辦 WebVision Challenge,這一比賽更加註重對圖像和視頻數據的學習和理解,它有可能會成為未來的 ImageNet 競賽嗎?

摘要

我們提出 2017 年 WebVision 競賽,這是一項公開的圖像識別挑戰賽,旨在基於網頁圖像進行深度學習,而無需人手工對實例進行標註。此前的計算機視覺挑戰賽,如 ILSVRC、Places2 和 PASCAL VOC,通過提供大量的注釋數據,用於模型設計和標準化的基準測試,為計算機視覺的發展發揮了關鍵作用。為了延續它們的精神,我們在本屆 CVPR 2017 舉辦研討會,進行一項基於大規模網路圖像數據集的公開競賽。WebVision 數據集包含從互聯網上用爬蟲收集的 240 多萬的網路圖像,方法是使用從 ILSVRC 2012 基準中的 1000 個語義概念生成的查詢(query)。元信息(Meta information)也包含在內。

此外,WebVision 數據集也提供檢驗數據集和測試數據集,這些數據集中的數據都帶有人手工標註的標籤,從而便於演算法的開發。2017 年 WebVision 挑戰賽分為兩類,一是在 WebVision 測試數據集上進行圖像分類,以及在 PASCAL VOC 2012 數據集上進行遷移學習。在本文中,我們描述了數據收集和注釋的細節,突出了 WebVision 數據集的特點,並介紹了相關評估指標。

ImageNet:深度學習熱潮的關鍵推動者之一

ImageNet 可以說是計算機視覺研究人員進行大規模物體識別和檢測時,最先想到的視覺大數據來源。ImageNet 數據集最初由斯坦福大學李飛飛等人在 CVPR 2009 的一篇論文中推出,並被用於替代 PASCAL 數據集(後者在數據規模和多樣性上都不如 ImageNet)和 LabelMe 數據集(在標準化上不如 ImageNet)。

ImageNet 從 Caltech101(2004 年一個專註於圖像分類的數據集,也是李飛飛開創的)。ImageNet 不但是計算機視覺發展的重要推動者,也是這一波深度學習熱潮的關鍵驅動力之一。

截至 2016 年,ImageNet 中含有超過 1500 萬由人手工注釋的圖片網址,也就是帶標籤的圖片,標籤說明了圖片中的內容,超過 2.2 萬個類別。其中,至少有 100 萬張裡面提供了邊框(bounding box)。

ImageNet 數據集中「獵狐犬」的部分示例

從 2010 年以來,ImageNet 每年都會舉辦一次軟體競賽,也即 ImageNet 大規模視覺識別挑戰賽(ILSVRC),參賽程序會相互比試,看誰能以最高的正確率對物體和場景進行分類和檢測,不僅牽動著產學研三界的心,也是各團隊、巨頭展示實力的競技場。

從 2010 年以來,每年的 ILSVRC 都主要包括以下 3 項,後來逐漸增多:

圖像分類:演算法產生圖像中存在的對象類別列表

單物體定位:演算法生成一個圖像中含有的物體類別的列表,以及軸對齊的邊框,邊框指示每個物體類別的每個實例的位置和比例

物體檢測:演算法生成圖像中含有的物體類別的列表,以及每個物體類別中每個實例的邊框,邊框表示這些實例的位置和比例。

2012 年,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 創造了一個「大型的深度卷積神經網路」,也即現在眾所周知的 AlexNet,贏得了當年的 ILSVRC。這是史上第一次有模型在 ImageNet 數據集表現如此出色。論文中提出的方法,比如數據增強和 dropout,直到現在也在使用,那篇論文「ImageNet Classification with Deep Convolutional Networks」,迄今被引用約 7000 次,被業內普遍視為行業最重要的論文之一,真正展示了 CNN 的優點,並且以破紀錄的比賽成績實打實地做支撐。

2012 年是 CNN 首次實現 Top 5 誤差率 15.4% 的一年,當時的次優項誤差率為 26.2%。這個表現震驚了整個計算機視覺界。可以說,是自那時起,CNN 才成了家喻戶曉的名字。

ImageNet 歷屆冠軍及技術回顧:


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

「實戰」利用卷積自編碼器實現圖片降噪(代碼開源)
「Ian Goodfellow 五問」GAN、深度學習,如何與谷歌競爭
增強版ResNet,NTIRE2017超解析度挑戰賽冠軍方案
楊靜:人工智慧鴻溝或將割裂世界

TAG:新智元 |

您可能感興趣

iPhone X 單季銷量出爐,中國佔四分之一
雪山再現!中國三方團隊聯手打造 Supreme x TNF x Air Foamposite One !
杜德偉獲Billboard RadioIcon Awards成為首位獲獎中國歌手
「天津噴」 不再孤單!今年的 NIKE Air Foamposite One中國特別款 「要上天」 !
「天津噴」 不再孤單!今年的 NIKE Air Foamposite One中國特別款 「要上天」!
Elsevier發布2017中國高被引學者榜單,中科院入選人數第一
Ingenico ePayments:中國商戶「出海」的新機會
Ke-Da Wang 中國水彩畫家
熱巢聯合創始人Fabian von Heimburg出席DLD創新大會,分享中國數字營銷的「模式、平台與受眾」洞見
A BATHING APE x Dr.Martens聯乘系列登陸中國內地
Balenciaga 官方證實目前 Triple S 系列鞋款為「中國製造」
堪比「天津噴」!NIKE Air Foamposite One 「中國煙花噴」完整高清大圖一覽!
Convertlab入選首份中國營銷技術圖譜
Maison&Objet 2018 中國設計中心首次亮相巴黎
LG Hausys連續5年入選中國綠色建材十大首選
中國定製版iPhone X!大屏版iPhone X支持雙卡雙待!
紹興之旅——發現中國的Natural Wine
Burberry第三季度銷售額下降、優衣庫進軍瑞典市場、紐約時裝周設立「中國日」、LV男裝創意總監Kim Jones將離職等
2017年中國手機銷量成績出爐,oppo和vivo銷量佔優,華為第一
2017年VRPinea廠商年終回訪報告(一):Epic Games中國