當前位置:
首頁 > 新聞 > 谷歌開源物體檢測系統 API (附代碼下載地址)

谷歌開源物體檢測系統 API (附代碼下載地址)

雷鋒網AI科技評論按:6.15號,谷歌在其「谷歌開源」博客(Google Open Source )中發表一篇名為《Supercharge your Computer Vision models with the TensorFlow Object Detection API》的文章,文中指出雖然谷歌的物體檢測,圖像識別機器學習系統很先進,但仍面臨著很多挑戰,比如如何提高識別精度。為此,谷歌將其物體檢測系統代碼開源,希望更多愛好者參與進來,共同推動研究領域的發展。雷鋒網編輯對原文做了不改動願意的整理編譯:

在谷歌,有為計算機視覺開發的最靈活,最先進的機器學習(ML)系統,不僅可以用來改進產品和服務,還可以促進研究領域的進步。不過,在單個圖像中創建精確的ML模型使其能夠定位和識別多個對象仍然是該領域的一個核心挑戰,谷歌投入了大量的時間訓練和試驗這些系統。

谷歌開源物體檢測系統 API (附代碼下載地址)

圖中為其中的一個模型對圖片中對象的識別檢測效果

去年十月,谷歌內部的物體檢測系統已達到了最先進水平,並在COCO檢測挑戰賽中排名第一。此後,該系統為大量研究期刊提供了結果。在一些谷歌產品中也已投入使用,如NestCam。在Street View中,街道名稱,門牌號的檢測,和在Image Search中都運用了相似的理念思想。

今天很高興可以通過TensorFlow Object Detection API將代碼開源給更大的研究社區。這個代碼庫是建立在TensorFlow上端的開源框架,使其構建,訓練,展開物體檢測模型變得容易。設計這一系統目的是為支持當前最佳的模型,同時允許快速探索和研究。第一個版本包含:

一個可訓練的檢測模型的集合,包括:

  • 帶有MobileNets的SSD(Single Shot Multibox Detector)

  • 帶有Inception V2的SSD

  • 帶有Resnet 101的R-FCN(Region-based Fully Convolutional Networks)

  • 帶有Resnet 101的 Faster RCNN

  • 帶有Inception Resnet v2的Faster RCNN

上述每一個模型的凍結權重(在COCO的數據集上訓練)可被運用進行推理。

一個Jupyter notebook 可通過我們的模型之一進行開箱推理

藉助谷歌雲實現便捷的本地訓練腳本以及分布式訓練和評估管道

SSD模型使用了輕量化的MobileNet,因此它可以輕而易舉地實時在移動設備運行。在贏得COCO挑戰賽中,谷歌使用了Fast RCNN模型,它需要更多的計算資源,同時結果也更為準確。

更多細節,請參看谷歌發表在CVPR 2017(https://arxiv.org/abs/1611.10012)的論文。

準備好開始了嗎?

這些代碼在計算機視覺應用中非常有用。谷歌希望這次開源能滿足一部分人所需。也同時也歡迎更多能為代碼庫做貢獻的人參與進來。現在,就可以下載代碼,使用Jupyter notebook對圖片中的物體進行識別。也可以使用Cloud ML訓練自己的識別器了。

代碼下載地址:https://github.com/tensorflow/models/tree/master/object_detection

Jupyter notebook:https://github.com/tensorflow/models/blob/master/object_detection/object_detection_tutorial.ipynb

Cloud ML:https://cloud.google.com/blog/big-data/2017/06/training-an-object-detector-using-cloud-machine-learning-engine

via Google; 雷鋒網整理編譯

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

Xbox負責人解釋為什麼新主機沒有支持VR,還說過度關注VR很危險
地圖、車聯網、自動駕駛之後,四維圖新成為一家「位置大數據」開源公司
盧森堡大學教授:如何實現沒有第三方的公平交換?
你的手機全網通了嗎?多模物聯網已經來了

TAG:雷鋒網 |

您可能感興趣

IBM宣布正式開源POWER處理器ISA
封鎖8年:NVIDIA PhysX物理引擎全部開源
NVIDIA推出RAPIDS開源GPU加速平台,瞄準數據分析和機器學習市場
IETF推出用來取代IMAP的現代開源電子郵件協議JMAP
開源RISC-V架構正在改變IoT處理器的遊戲規則
網傳B站代源碼泄露 開源平台Github出現B站後台「源碼「
C+環境下調用銳視開源測控軟體
著名硬體黑客黃欣國建議 Intel 開源 CPU 漏洞代碼
Rokid發布AI操作系統YodaOS 宣布代碼開源
Rokid 發布 AI 操作系統 YodaOS 宣布代碼開源
PHP7 JIT 相關開源項目
NSA 官方開源反彙編工具 GHIDRA
NVIDIA發布PhysX SDK 4.0下載,物理加速引擎正式開源
微軟開源之路:近鄰搜索演算法SPTAG開源啦
NVIDIA PhysX物理技術封閉8年 如今終於開源了
AT&T、Verizon等發布「開源5G虛擬無線網」技術規範
Rokid 發布AI操作系統YodaOS,代碼開源
Rokid發布AI操作系統YodaOS,代碼開源
開源項目精選:下一代文本編輯器 Xray
IBM與NVIDIA攜手為數據科學家拓展開源機器學習工具