當前位置:
首頁 > 科技 > Google發布超過500萬張圖片的地標識別新數據集

Google發布超過500萬張圖片的地標識別新數據集

Google最近發布了用於訓練地標識別模型的新版數據集Landmarks-v2,比之前第一版的數據集更大,含有超過20萬個不同地標,500萬張以上的圖像,數據量是第一版的2倍,除此之外,Google還宣布兩項新的Kaggle挑戰,分別是Landmark Recognition 2019和Landmark Retrieval 2019,為了加速物體識別的研究,還將物體識別技術Detect-to-Retrieve開源發布。

Google Landmarks是全世界最大的地標識別數據集。在創建Landmarks-v2數據集的過程中,其中一項挑戰就是要為地標生成標籤,由於標記者不可能為數百萬張地標圖片標記,Google通過全世界各地的攝影師一同努力,來解決這項問題,每個攝影師都熟悉他們所在地的地標,讓這些攝影師為圖片標記標籤。

而Google新宣布的兩項Kaggle挑戰,要邀請機器學習的愛好者和研究員參與,Landmark Recognition 2019的目標是要識別出輸入圖片的地標,Landmark Retrieval 2019挑戰則是要找出所有包含該地標的圖片,這兩項挑戰總共祭出5萬美元的獎金,獲勝的隊伍將會受邀至CVPR 2019研討會發布使用方法。

此外,Google也開源發布物體識別的新技術Detect-to-Retrieve,Google利用物體偵測模型的邊界框(bounding boxes),給給含有目標類別物體的圖片區域額外的權重,該方法大幅地提升了模型的準確率,Google發布的模型是通過原本的Google-Landmarks數據集中,含有86,000張圖片的子數據集來訓練。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 十輪網科技 的精彩文章:

TAG:十輪網科技 |