當前位置:
首頁 > 科技 > 斯坦福學者提出GIoU,目標檢測任務的新Loss

斯坦福學者提出GIoU,目標檢測任務的新Loss

作者 | Slumbers,畢業於中山大學,深度學習工程師,主要方向是目標檢測,語義分割,GAN

責編 | Jane

本文是對 CVPR2019 論文《Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression》的解讀,通過對 Loss 的修改提升檢測任務的效果,覺得思路很棒。

該文作者來自斯坦福大學與澳大利亞阿德萊德大學。

IoU是檢測任務中最常用的指標,由於IoU是比值的概念,對目標物體的scale是不敏感的。然而檢測任務中的BBox的回歸損失(MSE loss, l1-smooth loss等)優化和IoU優化不是完全等價的(見下圖)。

而且 Ln 範數對物體的scale也比較敏感。這篇論文提出可以直接把IoU設為回歸的loss。然而有個問題是IoU無法直接優化沒有重疊的部分。為了解決這個問題這篇paper提出了GIoU的思想~

IoU與L2範數的優化不是等效的。要將IoU設計為損失,主要需要解決兩個問題:

預測值和Ground truth沒有重疊的話,IoU始終為0且無法優化

IoU無法辨別不同方式的對齊,比如方向不一致等。

IoU 無法代表 overlap 的方式


GIoU

所以論文中提出的新 GIoU 是怎麼設計的呢:

假如現在有兩個任意性質 A,B,我們找到一個最小的封閉形狀C,讓C可以把A,B包含在內,然後我們計算C中沒有覆蓋A和B的面積佔C總面積的比值,然後用A與B的IoU減去這個比值:

GIoU有如下性質:

與IoU類似,GIoU也可以作為一個距離,loss可以用(下面的公式)來計算

同原始 IoU 類似,GIoU 對物體的大小不敏感。GIoU 總是小於等於 IoU,對於 IoU,有

GIoU 則是

在兩個形狀完全重合時,有

由於 GIoU 引入了包含 A,B 兩個形狀的 C,所以當 A,B 不重合時,依然可以進行優化。

總之就是保留了IoU的原始性質同時弱化了它的缺點。於是論文認為可以將其作為IoU的替代。


GIoU 作為 BBox 回歸的損失

具體一點,如何計算損失呢?我們以 2D detecation 為例:

假設我們現在有預測的 Bbox 和 groud truth 的 Bbox 的坐標,分別記為:

注意我們規定對於預測的 BBox 來說,有

主要是為了方便之後點的對應關係。

作者做了一系列的實驗(針對分割任務和分類任務有一定 loss 的調整設計,不過論文中沒有詳細給出)結果是 IoU loss 可以輕微提升使用 MSE 作為 loss 的表現,而 GIoU 的提升幅度更大,這個結論在 YOLO 演算法和 faster R-CNN 系列上都是成立的:

PASCAL VOC 2007上的提升with Yolo

MS COCO的提升with Yolo

PASCAL VOC 2007 with faster-RCNN

更多內容大家可以參考項目主頁:

https://giou.stanford.edu/

代碼實現:

https://github.com/generalized-iou

https://zhuanlan.zhihu.com/p/57992040

--【本文完】--

近期 CVPR 2019 論文解讀推薦:


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI科技大本營 的精彩文章:

PFLD:簡單、快速、超高精度人臉特徵點檢測演算法
3.8,這些「科技女神」將閃耀「婦女節」

TAG:AI科技大本營 |