Google發布超過500萬張圖片的地標識別新數據集

科技 05-07

Google最近發布了用於訓練地標識別模型的新版數據集Landmarks-v2，比之前第一版的數據集更大，含有超過20萬個不同地標，500萬張以上的圖像，數據量是第一版的2倍，除此之外，Google還宣布兩項新的Kaggle挑戰，分別是Landmark Recognition 2019和Landmark Retrieval 2019，為了加速物體識別的研究，還將物體識別技術Detect-to-Retrieve開源發布。

Google Landmarks是全世界最大的地標識別數據集。在創建Landmarks-v2數據集的過程中，其中一項挑戰就是要為地標生成標籤，由於標記者不可能為數百萬張地標圖片標記，Google通過全世界各地的攝影師一同努力，來解決這項問題，每個攝影師都熟悉他們所在地的地標，讓這些攝影師為圖片標記標籤。

而Google新宣布的兩項Kaggle挑戰，要邀請機器學習的愛好者和研究員參與，Landmark Recognition 2019的目標是要識別出輸入圖片的地標，Landmark Retrieval 2019挑戰則是要找出所有包含該地標的圖片，這兩項挑戰總共祭出5萬美元的獎金，獲勝的隊伍將會受邀至CVPR 2019研討會發布使用方法。

此外，Google也開源發布物體識別的新技術Detect-to-Retrieve，Google利用物體偵測模型的邊界框（bounding boxes），給給含有目標類別物體的圖片區域額外的權重，該方法大幅地提升了模型的準確率，Google發布的模型是通過原本的Google-Landmarks數據集中，含有86,000張圖片的子數據集來訓練。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 十輪網科技 的精彩文章:

TAG:十輪網科技 |