當前位置:
首頁 > 新聞 > 谷歌發布 Open Images V4數據集,190萬張圖片開啟公開圖像挑戰賽

谷歌發布 Open Images V4數據集,190萬張圖片開啟公開圖像挑戰賽

雷鋒網 AI 科技評論消息:4 月 30 日,谷歌在其官方博客上發文稱將開放 Images V4 資料庫,並同時開啟 ECCV 2018 公開圖像挑戰賽。雷鋒網編譯全文如下:

2016 年,我們發布了一個包含大約 900 萬張圖片、標註了數千個對象類別標籤的數據集 Open Images。發布之後,我們一直在努力更新和改進數據集,以便為計算機視覺社區提供有用的資源來開發新模型。

今天,我們很高興地宣布開放 Open Images V4,它包含在 190 萬張圖片上針對 600 個類別的 1540 萬個邊框盒,這也是現有最大的具有對象位置注釋的數據集。這些邊框盒大部分都是由專業注釋人員手動繪製的,確保了它們的準確性和一致性。另外,這些圖像是非常多樣化的,並且通常包含有多個對象的複雜場景(平均每個圖像 8 個)。

谷歌發布 Open Images V4數據集,190萬張圖片開啟公開圖像挑戰賽

與此同時,我們還將宣布啟動 Open Images 挑戰賽,這將是在 2018 計算機視覺歐洲會議(ECCV 2018)上舉辦的一場新的對象檢測挑戰賽。Open Images 挑戰賽將遵循PASCAL VOC、ImageNet和 COCO 等賽事的傳統,但是其規模將是空前的。

Open Images 挑戰賽在一下這幾個方面將是獨一無二的:

  • 有 170 萬張訓練圖片,其中有 500 個類別和 1220 萬個邊框注釋;

  • 與以前的檢測挑戰相比,將有更廣泛的類別,包括諸如「fedora」、「snowman」等這樣的新對象;

  • 除了主流的物體檢測外,本次挑戰賽中在檢測物體對時還將包括視覺關係檢測,例如「woman playing guitar」。

訓練數據集現在已經可以使用;一個包含有 10 萬張圖片的測試集將於 2018 年 7 月 1 日發布在 Kaggle 上。挑戰賽提交結果的截止日期為 2018 年 9 月 1 日。

我們希望更大的訓練集能夠刺激對更複雜檢測模型的研究,這些模型將超過當前 state-of-the-art 的性能;而從另一方面,我們希望 500 個類別能夠更精確地評估不同探測器在哪些方面表現的更好。此外,擁有大量帶有多個對象標註的圖像,可以幫組你探索視覺關係檢測,這還是一個熱門的新興話題,而且具有越來越多的子社區。

除了上述內容外,Open Images V4 還包含了 3010 萬張經過人工驗證的針對 19794 個類別圖像級標籤的圖片。當然這些標籤不屬於挑戰賽的一部分,其中的 550 萬張圖像級標籤是由來自世界各地成千上萬名用戶通過 crowdsource.google.com生成的。

via Google Blog,雷鋒網 AI 科技評論編譯

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

阿里宣布自研AI晶元,稱性價比超傳統CPU、GPU 四十倍
今日頭條,網易新聞等 4 款新聞資訊App遭下架,恢復時間不一

TAG:雷鋒網 |