當前位置:
首頁 > 科技 > 中科院發布了目標追蹤數據集,1萬多條視頻,150萬個邊界框

中科院發布了目標追蹤數據集,1萬多條視頻,150萬個邊界框

動栗 發自 凹非寺

量子位 出品 | 公眾號 QbitAI

中科院發布了一個目標追蹤數據集,叫做Got-10k。很大,很精緻。

它包含了超過10,000條視頻,主角都是在現實世界裡移動的物體,分成560多個類別

物體的邊界框全部是手動標記,總計超過150萬個

除此之外,數據集還是個Benchmark,可以用來衡量模型的性能,也已經有排行榜了。

官方還提供Python工具包,以便小夥伴們用這個Benchmark來測試自己的AI。

那麼,來仔細觀察一下數據集,吧。

事無巨細

除了規模大,Got-10k還有許多重要的特質。


通用類別 (Generic Classes)

數據集是以WordNet英文辭彙資料庫作為骨架,搭建起來的。分成5個大類:

動物(Animal) 、人造物體(Artifact) 、人物(Person) 、然物體(Natural Object) ,以及Part

大類之下再細分,一共563個類別

上面講的是目標類別,只是數據的其中一個標籤。

另一個標籤是動作類別,一共分為87種。一部分按照WordNet來劃分,還有一部分是數據收集者定義的。


單樣本學習 (One-Shot Learning)

為了訓練出的模型能有更強的泛化能力,訓練集和測試集之間不存在交集。

模型可以用少量的數據去學習分類,這樣也能避免測試結果偏向AI熟悉的那些樣本類別。


統一訓練數據 (Unified Training Data)

所有方法都用相同的訓練數據。依靠這樣的協議,來保障所有追蹤器之間的公平對比。


額外標記 (Extra Labeling)

除了目標類別、動作類別和標記框之外,還有其他標籤。

比如,目標可見比 (針對遮擋或者出畫的情況) ,負責監督那些難度比較大的任務。


有效評估 (Efficient Evaluation)

測試集包含180段視頻,分屬於84個目標類別,32個動作類別,用來衡量模型的追蹤能力。

萬事俱備,只差你了

現在,完整的GOT-10k數據集已經可以下載了。

並且,評估伺服器 (Evaluation Server) 準備好為各路模型打分了,排行榜也會實時更新。

溫暖的官方為小夥伴們提供了Python工具包,用來運行實驗,方便在Benchmark上評估性能。

另外,除了Python工具包,還有MABLAB工具包

你還不來么?

這樣好像可以玩一天

數據集傳送門:

http://got-10k.aitestunion.com/downloads

Python工具包:

https://github.com/got-10k/toolkit

MATLAB工具包:

https://github.com/got-10k/toolkit-matlab

數據集論文:

https://arxiv.org/abs/1810.11981

年度評選報名

加入社群

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

喜歡就點「好看」吧 !


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

16篇論文、70多頁PPT幫你優化深度學習模型,免費下載
從贏智力問答到助智能醫生:IBM Watson現在在中國怎麼樣了?

TAG:量子位 |