當前位置:
首頁 > 新聞 > 堆疊解卷積網路實現圖像語義分割頂尖效果

堆疊解卷積網路實現圖像語義分割頂尖效果

選自arXiv

機器之心編譯

參與:路雪

本文介紹了一種堆疊解卷積網路(Stacked Deconvolutional Network),它可用於高效的圖像語義分割。該方法堆疊多個淺層解卷積網路,採用層級監督幫助網路優化,在多個數據集上實現了頂尖效果。機器之心對該論文進行了介紹。

堆疊解卷積網路實現圖像語義分割頂尖效果

鏈接:https://arxiv.org/pdf/1708.04943.pdf

摘要:語義分割領域的近期進展主要由改善全卷積網路(FCN)下的空間解析度而得到。為了解決該問題,我們提出了一種堆疊解卷積網路(Stacked Deconvolutional Network/SDN)用於語義分割。在 SDN 中,多個淺層解卷積網路(即 SDN 單元)依次堆疊,以整合語境信息,確保位置信息的精細恢復。同時,單元間和單元內的連接被用來支持網路訓練和提升特徵融合,因為這些連接可以改善信息流和整個網路內的梯度傳播。此外,在每個 SDN 單元的上採樣過程中使用層級監督(hierarchical supervision),可以確保特徵表示的區別並幫助網路優化。我們實現了綜合性實驗,並在三個數據集(PASCAL VOC 2012、CamVid、GATECH)上實現了頂尖結果。尤其是,我們的最好模型沒有使用 CRF 後處理就在測試集上的 intersection-over-union 得分是 86.6%。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 1. 我們方法的架構。上半部分表示我們提出的堆疊解卷積網路(SDN)的結構,下半部分表示 SDN 單元(a)、下採樣模塊(b)和上採樣模塊(c)的具體結構。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 2. 上採樣過程中帶有分數圖連接(score map connection)的層級監督。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 3. 不同的堆疊 SDN 結構。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 4. 我們的方法在 PASCAL VOC 2012 驗證集上的結果。每一列列出了輸入圖像(A)、SDN_M1 網路的語義分割結果(B)、SDN_M2 網路的語義分割結果(C)、SDN_M3 網路的語義分割結果(D)和真值(E/Groundtruth)。

堆疊解卷積網路實現圖像語義分割頂尖效果

表 5. 我們的方法在 PASCAL VOC 2012 測試集上的實驗結果。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 5. 我們的方法在 PASCAL VOC 2012 數據集上的結果。每一行的圖像從左到右分別是(1)輸入圖像(2)真值(3)語義分割結果。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 6. 我們的方法在 CamVid 數據集上的結果。每一列從上到下依次是:(1)輸入圖像(2)語義分割結果(3)真值。

堆疊解卷積網路實現圖像語義分割頂尖效果

表 6. 我們的方法在 CamVid 測試集上的實驗結果。

堆疊解卷積網路實現圖像語義分割頂尖效果

表7. GATECH 測試集上的實驗結果

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 7. 我們的方法在 GATECH 數據集上的結果。每一列的圖像從上到下依次是:(1)輸入圖像(2)語義分割結果(3)真值。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

推出兩款32線激光雷達的速騰聚創,重點仍是打磨16線和固態研發
9種人臉情緒識別、22類人臉屬性,竹間智能要讓情感機器人更理解人訪
人工智慧引領 「鋼鐵城」 匹茲堡的蛻變——卡內基梅隆大學專訪
人工智慧引領鋼鐵城匹茲堡的蛻變——卡內基梅隆大學專訪

TAG:機器之心 |