當前位置：

首頁 > 新聞 > 堆疊解卷積網路實現圖像語義分割頂尖效果

堆疊解卷積網路實現圖像語義分割頂尖效果

新聞 09-15

選自arXiv

機器之心編譯

參與：路雪

本文介紹了一種堆疊解卷積網路（Stacked Deconvolutional Network），它可用於高效的圖像語義分割。該方法堆疊多個淺層解卷積網路，採用層級監督幫助網路優化，在多個數據集上實現了頂尖效果。機器之心對該論文進行了介紹。

堆疊解卷積網路實現圖像語義分割頂尖效果

鏈接：https://arxiv.org/pdf/1708.04943.pdf

摘要：語義分割領域的近期進展主要由改善全卷積網路（FCN）下的空間解析度而得到。為了解決該問題，我們提出了一種堆疊解卷積網路（Stacked Deconvolutional Network/SDN）用於語義分割。在 SDN 中，多個淺層解卷積網路（即 SDN 單元）依次堆疊，以整合語境信息，確保位置信息的精細恢復。同時，單元間和單元內的連接被用來支持網路訓練和提升特徵融合，因為這些連接可以改善信息流和整個網路內的梯度傳播。此外，在每個 SDN 單元的上採樣過程中使用層級監督（hierarchical supervision），可以確保特徵表示的區別並幫助網路優化。我們實現了綜合性實驗，並在三個數據集（PASCAL VOC 2012、CamVid、GATECH）上實現了頂尖結果。尤其是，我們的最好模型沒有使用 CRF 後處理就在測試集上的 intersection-over-union 得分是 86.6%。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 1. 我們方法的架構。上半部分表示我們提出的堆疊解卷積網路（SDN）的結構，下半部分表示 SDN 單元（a）、下採樣模塊（b）和上採樣模塊（c）的具體結構。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 2. 上採樣過程中帶有分數圖連接（score map connection）的層級監督。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 3. 不同的堆疊 SDN 結構。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 4. 我們的方法在 PASCAL VOC 2012 驗證集上的結果。每一列列出了輸入圖像（A）、SDN_M1 網路的語義分割結果（B）、SDN_M2 網路的語義分割結果（C）、SDN_M3 網路的語義分割結果（D）和真值（E/Groundtruth）。

堆疊解卷積網路實現圖像語義分割頂尖效果

表 5. 我們的方法在 PASCAL VOC 2012 測試集上的實驗結果。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 5. 我們的方法在 PASCAL VOC 2012 數據集上的結果。每一行的圖像從左到右分別是（1）輸入圖像（2）真值（3）語義分割結果。

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 6. 我們的方法在 CamVid 數據集上的結果。每一列從上到下依次是：（1）輸入圖像（2）語義分割結果（3）真值。

堆疊解卷積網路實現圖像語義分割頂尖效果

表 6. 我們的方法在 CamVid 測試集上的實驗結果。

堆疊解卷積網路實現圖像語義分割頂尖效果

表7. GATECH 測試集上的實驗結果

堆疊解卷積網路實現圖像語義分割頂尖效果

圖 7. 我們的方法在 GATECH 數據集上的結果。每一列的圖像從上到下依次是：（1）輸入圖像（2）語義分割結果（3）真值。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

※推出兩款32線激光雷達的速騰聚創，重點仍是打磨16線和固態研發
※9種人臉情緒識別、22類人臉屬性，竹間智能要讓情感機器人更理解人訪
※人工智慧引領「鋼鐵城」匹茲堡的蛻變——卡內基梅隆大學專訪
※人工智慧引領鋼鐵城匹茲堡的蛻變——卡內基梅隆大學專訪

TAG:機器之心 |