性能超越何愷明Mask R-CNN！華科碩士生開源圖像分割新方法

科技 03-05

安妮乾明發自凹非寺

量子位報道 | 公眾號 QbitAI

實習生又立功了！

這一次，亮出好成績的實習生來自地平線，是一名華中科技大學的碩士生。

他作為第一作者完成的研究Mask Scoring R-CNN，在COCO圖像實例分割任務上超越了何愷明的Mask R-CNN，拿下了計算機視覺頂會CVPR 2019的口頭報告。

也就是說，它從5000多篇投稿中脫穎而出，成為最頂尖的5.6%。

無論搭配的基幹怎麼變，表現一直穩定，總是比Mask R-CNN好一點。

可謂青出於藍而勝於藍。

並且，他們的演算法已經開源了（傳送門在文末）。

給蒙版打分

Mask R-CNN，一種簡潔、靈活的實例分割框架，大神何愷明的「拿手作」之一。自2017年一出場就驚艷了四方研究者，何愷明也藉此一舉拿下ICCV 2017最佳論文獎。

何愷明

新鮮出爐的Mask Scoring R-CNN，性能是怎樣超越前輩的呢？

關鍵就在名字里的「打分」（Scoring）。這篇論文中，研究人員提出了一種給演算法的「實例分割假設」打分的新方法。這個分數打得是否準確，就會影響實例分割模型的性能。

而Mask R-CNN等前輩，用的打分方法就不太合適。

這些模型在實例分割任務里，雖然輸出結果是一個蒙版，但打分卻是和邊界框目標檢測共享的，都是針對目標區域分類置信度算出來的分數。

這個分數，和圖像分割蒙版的質量可未必一致，用來評價蒙版的質量，可能就會出偏差。

於是，這篇CVPR 2019論文就提出了一種新的打分方法：給蒙版打分，他們稱之為蒙版得分（mask score）。

MS R-CNN架構

Mask Scoring R-CNN中提出的計分方式很簡單：不僅僅直接依靠檢測得到的分類算分，而且還讓模型單獨學一個針對蒙版的得分規則：MaskIoU head。

MaskIoU head是在經典評估指標AP（平均正確率）啟發下得到的，會拿預測蒙版與物體特徵進行對比。MaskIoU head同時接收蒙版head的輸出與ROI的特徵（Region of Interest）作為輸入，用一種簡單的回歸損失進行訓練。

最後，同時考慮分類得分與蒙版的質量得分，就可以去評估演算法質量了。

評測方法公平公正，實例分割模型性能自然也上去了。

實驗證明，在挑戰COCO benchmark時，在用MS R-CNN的蒙版得分評估時，在不同基幹網路上，AP始終提升近1.5%。

優於Mask R-CNN

下面的表格，是COCO 2017測試集（Test-Dev set）上MS R-CNN和其他實例分割方法的成績對比。

無論基幹網路是純粹的ResNet-101，還是用了DCN、FPN，MS R-CNN的AP成績都比Mask R-CNN高出一點幾個百分點。

在COCO 2017驗證集上，MS R-CNN的得分也優於Mask R-CNN：

作者是誰？

第一作者，名為黃釗金，華中科技大學的碩士生，師從華中科技大學電信學院副教授王興剛，王興剛也是這篇論文的作者之一。

其他的作者，分別是地平線的Chang Huang、Yongchao Gong和Lichao Huang。

如果你對這項研究感興趣，請收好傳送門：

Mask Scoring R-CNN論文：

https://arxiv.org/abs/1903.00241

GitHub地址：

https://github.com/zjhuang22/maskscoring_rcnn

Mask R-CNN的其他優化思路

在此之前，也有人提出了優化Mask R-CNN的思路。

比如，香港中文大學、北京大學、商湯科技、騰訊優圖在CVPR 2018發表的一篇論文，提出了一個名為PANet的實例分割框架。

優化了Mask R-CNN中的信息傳播，通過加速信息流、整合不同層級的特徵，提高了生成預測蒙版的質量。

在未經大批量訓練的情況下，就拿下了COCO 2017挑戰賽實例分割任務的冠軍。

論文地址：

Path Aggregation Network for Instance Segmentation

https://arxiv.org/abs/1803.01534

代碼地址：

https://github.com/ShuLiu1993/PANet

—完—

加入社群

量子位現開放「AI 行業」社群，面向AI行業相關從業者，技術、產品等人員，根據所在行業可選擇相應行業社群，在量子位公眾號（QbitAI）對話界面回復關鍵詞「行業群」，獲取入群方式。行業群會有審核，敬請諒解。

此外，量子位AI社群正在招募，歡迎對AI感興趣的同學，在量子位公眾號（QbitAI）對話界面回復關鍵字「交流群」，獲取入群方式。

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話界面，回復「招聘」兩個字。

喜歡就點「好看」吧 !

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 量子位 的精彩文章:

TAG:量子位 |