當前位置:
首頁 > 最新 > TensorFlow 物體檢測API全面升級,快來解鎖新姿勢

TensorFlow 物體檢測API全面升級,快來解鎖新姿勢

「將門×行業龍頭企業創新行」

將門作為一家以技術創新為切入口的早期創新發掘機構,重磅啟動「將門×行業龍頭企業創新行」計劃,邀請各地技術小夥伴們一同走入來自零售、交通、醫療、金融、地產等行業龍頭企業,深入理解AI落地場景,發掘更多AI價值的應用空間。

7月20日(周五)的首站,我「門」將來到全球醫療健康領域的領導者—飛利浦。我們也很榮幸邀請到飛利浦人工智慧實驗室總監周子捷博士,屆時他將到場和大家分享「飛利浦人工智慧驅動的醫療解決方案」,介紹飛利浦在「人工智慧應用於醫療健康」領域的研究方向和創新成果。戳我來報名

來源:Google AI blog 編譯:T.R

自從去年TensorFlow Object Detection API發布以來,谷歌團隊不斷擴充其性能,除了通過神經架構搜索和實例分割來提高模型的學習能力,還用如Open Images 等不斷出現的新數據集來訓練模型。它在世界範圍內被用於各種各樣的任務中,從城市街頭中的異常行為檢測,到茂密叢林里的植物識別都有著它的身影。

GIF

近日,為了不斷擴充和壯大這一API的能力,谷歌又為目標檢測API進行了升級,最新的能力包括以下幾個方面:

支持通過谷歌雲TPUs來對模型訓練進行加速;

通過加速推理和基於TF-Lite格式的模型導出來提升移動端的部署能力;

加入了很多新的架構,包括:

RetinaNet;

MobileNet版本的RetinaNet;

新型的SSD架構PoolingPyramidNetwork,縮小了三倍的大小。

同時還給出了每一個模型在coco數據集上的預訓練權重供用戶使用。

通過雲TPUs加速訓練

用戶常常需要在大量的時間去調節一個模型的超參數,如果可以大幅節省訓練時間將十分有意義。所以這次推出的基於SSD架構的模型都針對TPUs進行了優化設計,利用強大的雲服務你可以很快的訓練出符合要求的網路。舉個例子,希望將基於ResNet-50的RetinaNet在coco數據集上訓練到35%mAP,通過TPUs雲服務只需要不到3個半小時就夠了。

通過量化和TF-Lite加速推理

為了更好的支持移動和嵌入式設備中低延時的需求,其中的模型提供了對於Tensorflow-lite的原生支持,這使得設備端的機器學習模型可以以更小的容量和更低的延時實現良好的表現。除此之外,新API還加入了模型量化以及對於檢測的原生操作。其中模型量化基於Jacob的論文和Krishnamoorthi的白皮書實現。

為了在有限大小下保證性能,工程師們不僅量化了權重,同時對激活也進行了量化,實現了速度(大小)和精度的平衡。下圖展現了優化後的模型在Pixel2的CPU上所測量得到的延時、模型大小和mAP值。可以發現,模型得到了大幅壓縮,速度幾乎提升了一倍(>15fps),而精度只有略微下降。

如果你想上手試試的話,Tensorflow團隊提供了一個詳細的教程。

https://medium.com/tensorflow/training-and-serving-a-realtime-mobile-object-detector-in-30-minutes-with-cloud-tpus-b78971cf1193

通過訓練你甚至可以做出一個檢測家裡小貓小狗的app安裝在自己手機上和朋友們分享。你可以通過colab來完成訓練,或者也可以用為開發者提供的docker來完成開發。

通過手把手的教程你就可以做出一個很有趣的app,最終訓練完成就會看到你的好夥伴被檢測出來啦:

下面是在訓練過程中的主要步驟:

環境搭建(安轉相應的庫和依賴文件,可以使用dockerfile完成一鍵安裝)

雲配置(配置TPUs、存儲服務,基於gcloud和gsutil)

安裝Tensorflow + Object Detection

配置資料庫(轉換為TFRecoard來加速數據IO)並上傳存儲

使用checkpoint來進行遷移學習加速訓練

在雲端訓練量化模型

導出模型、在移動端上部署並運行。

TensorFlow團隊希望通過更高效的API將高水平的視覺模型帶給更多希望解決檢測問題的人使用,並為用戶提供從模型訓練到移動端部署的順滑體驗。

-The End-


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 將門創投 的精彩文章:

「保障美國未來能源」組織報告:自動駕駛汽車搶走你的飯碗

TAG:將門創投 |