當前位置:
首頁 > 科技 > 性能超越何愷明Mask R-CNN!華科碩士生開源圖像分割新方法

性能超越何愷明Mask R-CNN!華科碩士生開源圖像分割新方法

安妮 乾明 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

實習生又立功了!

這一次,亮出好成績的實習生來自地平線,是一名華中科技大學的碩士生。

他作為第一作者完成的研究Mask Scoring R-CNN,在COCO圖像實例分割任務上超越了何愷明的Mask R-CNN,拿下了計算機視覺頂會CVPR 2019的口頭報告。

也就是說,它從5000多篇投稿中脫穎而出,成為最頂尖的5.6%

無論搭配的基幹怎麼變,表現一直穩定,總是比Mask R-CNN好一點。

可謂青出於藍而勝於藍。

並且,他們的演算法已經開源了(傳送門在文末)。

給蒙版打分

Mask R-CNN,一種簡潔、靈活的實例分割框架,大神何愷明的「拿手作」之一。自2017年一出場就驚艷了四方研究者,何愷明也藉此一舉拿下ICCV 2017最佳論文獎。

何愷明

新鮮出爐的Mask Scoring R-CNN,性能是怎樣超越前輩的呢?

關鍵就在名字里的「打分」(Scoring)。這篇論文中,研究人員提出了一種給演算法的「實例分割假設」打分的新方法。這個分數打得是否準確,就會影響實例分割模型的性能。

而Mask R-CNN等前輩,用的打分方法就不太合適。

這些模型在實例分割任務里,雖然輸出結果是一個蒙版,但打分卻是和邊界框目標檢測共享的,都是針對目標區域分類置信度算出來的分數。

這個分數,和圖像分割蒙版的質量可未必一致,用來評價蒙版的質量,可能就會出偏差。

於是,這篇CVPR 2019論文就提出了一種新的打分方法:給蒙版打分,他們稱之為蒙版得分(mask score)。

MS R-CNN架構

Mask Scoring R-CNN中提出的計分方式很簡單:不僅僅直接依靠檢測得到的分類算分,而且還讓模型單獨學一個針對蒙版的得分規則:MaskIoU head

MaskIoU head是在經典評估指標AP(平均正確率)啟發下得到的,會拿預測蒙版與物體特徵進行對比。MaskIoU head同時接收蒙版head的輸出與ROI的特徵(Region of Interest)作為輸入,用一種簡單的回歸損失進行訓練。

最後,同時考慮分類得分與蒙版的質量得分,就可以去評估演算法質量了。

評測方法公平公正,實例分割模型性能自然也上去了。

實驗證明,在挑戰COCO benchmark時,在用MS R-CNN的蒙版得分評估時,在不同基幹網路上,AP始終提升近1.5%。

優於Mask R-CNN

下面的表格,是COCO 2017測試集(Test-Dev set)上MS R-CNN和其他實例分割方法的成績對比。

無論基幹網路是純粹的ResNet-101,還是用了DCN、FPN,MS R-CNN的AP成績都比Mask R-CNN高出一點幾個百分點。

在COCO 2017驗證集上,MS R-CNN的得分也優於Mask R-CNN:

作者是誰?

第一作者,名為黃釗金,華中科技大學的碩士生,師從華中科技大學電信學院副教授王興剛,王興剛也是這篇論文的作者之一。

其他的作者,分別是地平線的Chang Huang、Yongchao Gong和Lichao Huang。

如果你對這項研究感興趣,請收好傳送門:

Mask Scoring R-CNN論文

https://arxiv.org/abs/1903.00241

GitHub地址

https://github.com/zjhuang22/maskscoring_rcnn

Mask R-CNN的其他優化思路

在此之前,也有人提出了優化Mask R-CNN的思路。

比如,香港中文大學、北京大學、商湯科技、騰訊優圖在CVPR 2018發表的一篇論文,提出了一個名為PANet的實例分割框架。

優化了Mask R-CNN中的信息傳播,通過加速信息流、整合不同層級的特徵,提高了生成預測蒙版的質量。

在未經大批量訓練的情況下,就拿下了COCO 2017挑戰賽實例分割任務的冠軍。

論文地址:

Path Aggregation Network for Instance Segmentation

https://arxiv.org/abs/1803.01534

代碼地址:

https://github.com/ShuLiu1993/PANet

加入社群

量子位現開放「AI 行業」社群,面向AI行業相關從業者,技術、產品等人員,根據所在行業可選擇相應行業社群,在量子位公眾號(QbitAI)對話界面回復關鍵詞「行業群」,獲取入群方式。行業群會有審核,敬請諒解。

此外,量子位AI社群正在招募,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式。

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

喜歡就點「好看」吧 !


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

《紐約時報》最新撰文:AI已成必需品,機器人記者正在崛起
「深度學習不是學習」:英特爾高管與AI大牛LeCun展開互懟

TAG:量子位 |