谷歌發布 Open Images V4數據集，190萬張圖片開啟公開圖像挑戰賽

新聞 05-01

雷鋒網 AI 科技評論消息：4 月 30 日，谷歌在其官方博客上發文稱將開放 Images V4 資料庫，並同時開啟 ECCV 2018 公開圖像挑戰賽。雷鋒網編譯全文如下：

2016 年，我們發布了一個包含大約 900 萬張圖片、標註了數千個對象類別標籤的數據集 Open Images。發布之後，我們一直在努力更新和改進數據集，以便為計算機視覺社區提供有用的資源來開發新模型。

今天，我們很高興地宣布開放 Open Images V4，它包含在 190 萬張圖片上針對 600 個類別的 1540 萬個邊框盒，這也是現有最大的具有對象位置注釋的數據集。這些邊框盒大部分都是由專業注釋人員手動繪製的，確保了它們的準確性和一致性。另外，這些圖像是非常多樣化的，並且通常包含有多個對象的複雜場景（平均每個圖像 8 個）。

谷歌發布 Open Images V4數據集，190萬張圖片開啟公開圖像挑戰賽

與此同時，我們還將宣布啟動 Open Images 挑戰賽，這將是在 2018 計算機視覺歐洲會議（ECCV 2018）上舉辦的一場新的對象檢測挑戰賽。Open Images 挑戰賽將遵循PASCAL VOC、ImageNet和 COCO 等賽事的傳統，但是其規模將是空前的。

Open Images 挑戰賽在一下這幾個方面將是獨一無二的：

有 170 萬張訓練圖片，其中有 500 個類別和 1220 萬個邊框注釋；
與以前的檢測挑戰相比，將有更廣泛的類別，包括諸如「fedora」、「snowman」等這樣的新對象；
除了主流的物體檢測外，本次挑戰賽中在檢測物體對時還將包括視覺關係檢測，例如「woman playing guitar」。

訓練數據集現在已經可以使用；一個包含有 10 萬張圖片的測試集將於 2018 年 7 月 1 日發布在 Kaggle 上。挑戰賽提交結果的截止日期為 2018 年 9 月 1 日。

我們希望更大的訓練集能夠刺激對更複雜檢測模型的研究，這些模型將超過當前 state-of-the-art 的性能；而從另一方面，我們希望 500 個類別能夠更精確地評估不同探測器在哪些方面表現的更好。此外，擁有大量帶有多個對象標註的圖像，可以幫組你探索視覺關係檢測，這還是一個熱門的新興話題，而且具有越來越多的子社區。

除了上述內容外，Open Images V4 還包含了 3010 萬張經過人工驗證的針對 19794 個類別圖像級標籤的圖片。當然這些標籤不屬於挑戰賽的一部分，其中的 550 萬張圖像級標籤是由來自世界各地成千上萬名用戶通過 crowdsource.google.com生成的。

via Google Blog，雷鋒網 AI 科技評論編譯

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章:

※阿里宣布自研AI晶元，稱性價比超傳統CPU、GPU 四十倍
※今日頭條，網易新聞等 4 款新聞資訊App遭下架，恢復時間不一

TAG:雷鋒網 |