TensorFlow 物體檢測API全面升級，快來解鎖新姿勢

最新 07-16

「將門×行業龍頭企業創新行」

將門作為一家以技術創新為切入口的早期創新發掘機構，重磅啟動「將門×行業龍頭企業創新行」計劃，邀請各地技術小夥伴們一同走入來自零售、交通、醫療、金融、地產等行業龍頭企業，深入理解AI落地場景，發掘更多AI價值的應用空間。

7月20日（周五）的首站，我「門」將來到全球醫療健康領域的領導者—飛利浦。我們也很榮幸邀請到飛利浦人工智慧實驗室總監周子捷博士，屆時他將到場和大家分享「飛利浦人工智慧驅動的醫療解決方案」，介紹飛利浦在「人工智慧應用於醫療健康」領域的研究方向和創新成果。戳我來報名

來源：Google AI blog 編譯：T.R

自從去年TensorFlow Object Detection API發布以來，谷歌團隊不斷擴充其性能，除了通過神經架構搜索和實例分割來提高模型的學習能力，還用如Open Images 等不斷出現的新數據集來訓練模型。它在世界範圍內被用於各種各樣的任務中，從城市街頭中的異常行為檢測，到茂密叢林里的植物識別都有著它的身影。

GIF

近日，為了不斷擴充和壯大這一API的能力，谷歌又為目標檢測API進行了升級，最新的能力包括以下幾個方面：

支持通過谷歌雲TPUs來對模型訓練進行加速；

通過加速推理和基於TF-Lite格式的模型導出來提升移動端的部署能力；

加入了很多新的架構，包括：

RetinaNet;

MobileNet版本的RetinaNet；

新型的SSD架構PoolingPyramidNetwork，縮小了三倍的大小。

同時還給出了每一個模型在coco數據集上的預訓練權重供用戶使用。

通過雲TPUs加速訓練

用戶常常需要在大量的時間去調節一個模型的超參數，如果可以大幅節省訓練時間將十分有意義。所以這次推出的基於SSD架構的模型都針對TPUs進行了優化設計，利用強大的雲服務你可以很快的訓練出符合要求的網路。舉個例子，希望將基於ResNet-50的RetinaNet在coco數據集上訓練到35%mAP，通過TPUs雲服務只需要不到3個半小時就夠了。

通過量化和TF-Lite加速推理

為了更好的支持移動和嵌入式設備中低延時的需求，其中的模型提供了對於Tensorflow-lite的原生支持，這使得設備端的機器學習模型可以以更小的容量和更低的延時實現良好的表現。除此之外，新API還加入了模型量化以及對於檢測的原生操作。其中模型量化基於Jacob的論文和Krishnamoorthi的白皮書實現。