當前位置:
首頁 > 新聞 > DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

2018年6月28日,由電子自動化設計頂級會議DAC』2018主辦的「低功耗目標檢測系統設計挑戰賽」於加州舊金山於落下帷幕。來自中科院計算所的ICT-CAS團隊和來自清華大學的TGIIF團隊在全球114支參賽隊伍中脫穎而出,分獲GPU組和FPGA組的冠軍。本屆比賽旨在為無人機設計高精度且高能效的物體檢測系統,以滿足實際複雜場景的需要。比賽任務極具挑戰性,參賽設計需要考慮小物體及被遮蔽物體檢測,需要區分同場景多個相似目標,也需要考慮檢測速度及功耗等多方面因素。參賽隊伍來自清華大學、北京大學、中科院、UIUC、CMU、IBM、Cadence 等全球多個優秀科研機構。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

無人機在工業、農業、軍事及消費級市場均有如土地測繪、巡檢監測、物資配送、災後救援等重要作用。其中,實現高精度且高能效物體檢測是開展所有無人機任務的基本要素,也是本領域急需提高的方向。由於航拍數據集(無人機視角)的缺失,進一步提升無人機物體檢測系統變得更加困難。

在這樣的背景下,聖母大學的史弋宇教授,匹斯堡大學的胡京通教授,香港城市大學的余備教授和Cognite Ventures公司的CEO Christopher Rowen發起「低功耗目標檢測系統設計挑戰賽」,並在DAC『2018成功舉辦。該比賽由Nvidia、Xilinx和DJI大疆創新贊助,由聖母大學博士後徐小維和匹斯堡大學博士生張鑫燚進行評測。Nvidia和Xilinx分別為GPU和FPGA組的參賽隊伍提供免費的嵌入式計算設備TX2 GPU和PYNQ Z-1 FPGA。大疆創新為比賽提供了高達150k份由無人機在實際環境中採集的數據並提供了準確標註。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

比賽中使用到的兩種硬體平台: TX2 GPU (左)和PYNQ Z-1 FPGA(右)

比賽從2017年10月16日正式開始,於2018年5月28日結束,共吸引114支來自全球多個科研機構的隊伍參加。其中,53支隊伍參與GPU組比賽,61支隊伍參與FPGA組比賽。最終,兩個組別前三名的隊伍將被邀請至舊金山,在DAC』2018上接受頒獎。同時,獲獎隊伍將能在大會上分享他們的設計並進行現場展示。

挑戰1: 小物體及遮蔽物檢測

由於所有圖片均在無人機視角下拍攝,大量圖片中的待檢測物體都非常小,且有很大的概率被樹木和建築物遮擋。這些物體本身的特徵在如此小的尺度下會大大提升檢測的難度。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

小物體檢測:綠色框對應行駛中的汽車為檢測目標

挑戰2: 同一物體檢測

與傳統的物體檢測不一樣,本次比賽需要參賽隊伍檢測同一個物體。在無人機跟隨應用中,無人機需要準確地檢測出指定物體(如無人機操控者、車輛、動物等)並進行跟隨飛行。當場景出現多個相似物體時,無人機也不能跟丟或跟錯對象。此應用給物體檢測帶來了新的挑戰。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

特定行人檢測:綠色框對應的是正確的檢測目標,藍色和紅色狂均對應錯誤的行人。

挑戰3:高精度vs低功耗

比賽採用的評價指標是精度,速度和能耗的結合(評分細則詳見1)。考慮到GPU組及FPGA組使用了不同的計算能力硬體設備,比賽對檢測速度提出了不同的要求。其中GPU設計需運行至20 FPS,FPGA設計需達到5 FPS。

GPU組前三強

GPU組的前三名分別是中科院計算所的ICT-CAS團隊,浙江大學的DeepZ團隊和山東大學的SDU-Legend團隊。三個隊伍均採用了深度學習完成比賽,也都採用Yolo神經網路作為他們的基礎設計。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

GPU組第一名: ICT-CAS

ICT-CAS團隊使用了feature extractor, tucker decomposition and precision scaling相關技術。在每一種具體的方案中嘗試了多種技術記憶組合以減少計算和內存消耗。在計算中採用了半精度(16bits)進行計算並使用TensorRT來提高計算速度。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

GPU組第二名: DeepZ

DeepZ團隊使用Yolo-v2作為骨幹網路進行特徵提取和檢測。為了應對較小物體檢測的問題,該團隊使用了Feature Pyramid Network來獲得上下文相關的特徵。同時,focal loss function的引入來緩解單一物體檢測與多個候選框的不平衡問題。該團隊 對Yolo-v2網路進行了一定的改進,改進後的網路結構如下圖所示。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

GPU組第三名: SDU-Legend

SDU-Legend團隊基於Yolo v-2進行優化。首先,該團隊將Yolo v-2網路由32層刪減為27層。其次,為了滿足檢測小目標的要求,該團隊降低了下採樣率。在體系層次,該團隊也做了一些優化:將網路最後兩層的計算放在CPU上進行。該團隊實現了16bits的半精度計算來進一步提升計算速度。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

FPGA組前三強

FPGA組的冠軍是來自清華大學的TGIIF團隊,亞軍是蘇黎世聯邦理工大學的SystemsETHZ,季軍來自UIUC的iSmart2團隊。這三支參賽隊伍分別在FPGA上部署了SSD,SqueezeNet和MobileNet神經網路,完成了比賽要求的物體檢測任務。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

FPGA組第一名: TGIIF

TGIIF團隊在採用了深鑒科技的硬體加速器架構DPU、全棧式工具鏈DNNDK和深度壓縮技術的基礎上,從演算法、軟體和硬體對整個目標檢測系統進行了全棧式的協同優化。通過採用硬體友好的SSD網路和多線程優化技術,結合深度壓縮和定點訓練,在保證識別精度的前提下,滿足了低功耗和實時性的要求。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

FPGA組第二名:SystemsETHZ

SystemsETHZ團隊使用低量化網路進行物體檢測。特別的該團隊採用squeezenet為基礎進行設計,並將網路層數修改為18層。在具體的實現中,該團隊採用了folded computing的方式來配置多路復用器和多路輸出選擇器進而實現神經網路不同階段的計算。該團隊使用一個DMA引擎實現CPU和FPGA間的數據傳輸。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

FPGA組第三名:iSmart2

iSmart2組採用以Mobilenet為基礎的輕量化網路設計,共12層。網路包含depth-wise 3x3卷積層,傳統1x1卷積層和max pooling層,並採用簡化的Yolo後端進行物體檢測。在硬體實現上,該團隊採用基於模塊(IP)復用的結構,讓相同種類的網路層復用同一個模塊以節約硬體資源。此外,該團隊將每層特徵圖分割成大小相同的數據塊,以數據塊為單位進行計算,實現了數據塊之間的細粒度流水線結構,以縮短圖片的處理延時。

DAC 2018 挑戰賽落幕,中科院、清華分別獲GPU與FPGA組冠軍

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

Feature Tools:可自動構造機器學習特徵的Python庫
自動「腦補」3D環境!DeepMind最新Science論文生成查詢網路GQN

TAG:機器之心 |