中科院發布了目標追蹤數據集,1萬多條視頻,150萬個邊界框
動栗 發自 凹非寺
量子位 出品 | 公眾號 QbitAI
中科院發布了一個目標追蹤數據集,叫做Got-10k。很大,很精緻。
它包含了超過10,000條視頻,主角都是在現實世界裡移動的物體,分成560多個類別。
物體的邊界框全部是手動標記,總計超過150萬個。
除此之外,數據集還是個Benchmark,可以用來衡量模型的性能,也已經有排行榜了。
官方還提供Python工具包,以便小夥伴們用這個Benchmark來測試自己的AI。
那麼,來仔細觀察一下數據集,吧。
事無巨細
除了規模大,Got-10k還有許多重要的特質。
通用類別 (Generic Classes)
數據集是以WordNet英文辭彙資料庫作為骨架,搭建起來的。分成5個大類:
動物(Animal) 、人造物體(Artifact) 、人物(Person) 、自然物體(Natural Object) ,以及Part。
大類之下再細分,一共563個類別。
上面講的是目標類別,只是數據的其中一個標籤。
另一個標籤是動作類別,一共分為87種。一部分按照WordNet來劃分,還有一部分是數據收集者定義的。
單樣本學習 (One-Shot Learning)
為了訓練出的模型能有更強的泛化能力,訓練集和測試集之間不存在交集。
模型可以用少量的數據去學習分類,這樣也能避免測試結果偏向AI熟悉的那些樣本類別。
統一訓練數據 (Unified Training Data)
所有方法都用相同的訓練數據。依靠這樣的協議,來保障所有追蹤器之間的公平對比。
額外標記 (Extra Labeling)
除了目標類別、動作類別和標記框之外,還有其他標籤。
比如,目標可見比 (針對遮擋或者出畫的情況) ,負責監督那些難度比較大的任務。
有效評估 (Efficient Evaluation)
測試集包含180段視頻,分屬於84個目標類別,32個動作類別,用來衡量模型的追蹤能力。
萬事俱備,只差你了
現在,完整的GOT-10k數據集已經可以下載了。
並且,評估伺服器 (Evaluation Server) 準備好為各路模型打分了,排行榜也會實時更新。
溫暖的官方為小夥伴們提供了Python工具包,用來運行實驗,方便在Benchmark上評估性能。
另外,除了Python工具包,還有MABLAB工具包。
你還不來么?
這樣好像可以玩一天
數據集傳送門:
http://got-10k.aitestunion.com/downloads
Python工具包:
https://github.com/got-10k/toolkit
MATLAB工具包:
https://github.com/got-10k/toolkit-matlab
數據集論文:
https://arxiv.org/abs/1810.11981
—完—
年度評選報名
加入社群
量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
喜歡就點「好看」吧 !


※16篇論文、70多頁PPT幫你優化深度學習模型,免費下載
※從贏智力問答到助智能醫生:IBM Watson現在在中國怎麼樣了?
TAG:量子位 |