當前位置:
首頁 > 最新 > Facebook漸變網路、多尺度DenseNet、最新街景數據集、集成學習新方法

Facebook漸變網路、多尺度DenseNet、最新街景數據集、集成學習新方法

01

Facebook漸變生成式網路

本文為Facebook發表在NIPS2017上的文章,本文介紹了一種新的編碼器 - 解碼器架構,通過直接解析圖像的顯著信息和潛在空間中的屬性值來重構圖像。因此,經過訓練之後,該模型可以通過改變屬性值來生成不同的輸入圖像的實際版本。通過使用連續的屬性值,我們可以選擇在生成的圖像中哪些特定屬性是多少可感知的。該屬性可以允許用戶使用滑動旋鈕修改圖像的應用程序,例如混音器控制台的開關,從而改變肖像的面部表情或者某些對象的顏色。在現有的技術中,通常採用在訓練階段,改變像素空間中的屬性值來訓練對抗網路,本文的方法更為簡單,並且可以良好的擴展到多個屬性。實驗表明,該模型可以顯著改變屬性的感知價值,同時保留圖像的自然性。

02

PixelSNAIL自回歸生成模型

近年來,自回歸生成模型在涉及高維數據(如圖像或音頻)的密度估計任務中多次獲得最佳結果。自回歸生成模型將密度估計作為序列建模任務,採用RNN模型對已知前面元素時的下一個元素的條件分布進行建模。

在這個範例下,性能的瓶頸在於RNN對於遠距離依賴的模擬程度,其中,最成功的方法採用因果卷積,實現比傳統RNN更好地對序列的早期數據的訪問。此外,受到最近的元強化學習的啟發,處理遠程依賴關係也是必不可少的,本文引入的新的生成模型架構,結合了因果卷積和自我關注。作者采CIFAR-10和ImageNet數據集進行了測試。

03

DenseNet多尺度升級版

該論文為DenseNet原作者黃高的最新力作,也獲得了ICLR2018最佳論文。在該論文中,作者探究了在測試階段用有限的計算資源實現圖像分類任務。實驗中作者採用了兩個設定:1)即時分類。對於某個測試樣本,網路的預測輸出會逐漸更新,以保證隨時輸出預測結果;2)批預算分類,其中計算資源是有限的,且這些資源對於輸入圖片可以進行不均衡處理,對「簡單的」和「困難的」圖片分開對待。

與大多數先前的工作相比(如流行的 Viola 和 Jones 演算法),本文方法基於卷積神經網路。我們訓練多個具有不同資源需求的分類器,並在測試期間自適應地應用這些分類器。為了最大化這些分類器計算資源的使用效率,我們將它們整合進一個深度卷積神經網路中,使用密集連接將它們聯通。為了更快實現高質量的分類,我們使用了二維多尺度網路架構,在網路中同時保持了粗糙與精細的特徵。在三個圖像分類任務上的實驗證明,本文框架可以大大提升上述兩種設置下的目前的業內最佳水平。

04

最新開源街景數據集

Mapillary Vistas Dataset(簡稱MVD)是最新開源的、大規模街景圖像數據集,包含25,000張高解析度圖像,66個對象類別注釋,並附加了37個類別的特定實例標籤。通過使用多邊形來劃分單個對象,注釋以細緻且精確的風格進行。該數據集的精細注釋比Cityscapes數據集多5倍,並包含來自世界各地的圖像,在各種天氣、季節和光線條件下拍攝。圖像來自不同的成像設備(手機,平板電腦,運動相機,專業捕捉平台)和不同經驗的攝影師。因此,該數據集具有多樣性、細節豐富性、地理範圍完備性。針對該數據集的基準任務,作者定義了語義圖像分割、實例分割等。

05

集成學習:訓一得多

通過訓練多個模型並將其預測輸出值進行平均,往往能獲得比單個模型更高的精度和魯棒性。然而,訓練多個神經模型通常十分耗費資源。本文作者在無需額外的計算負擔的前提下,實現了得到多個模型的目的。本文對單個網路進行訓練,在迭代過程中使它收斂到不同的局部最優點,並且保存每個最優點對應的網路權值。為了幫助快速收斂,作者參考了最近周期學習率的研究進展。

結果表明,文中採用的Snapshot Ensembling的方法,雖然簡單粗暴但是很有效率。一系列的實驗均表明,本文訓練得到的模型與其他的網路框架不同的集成模型效果可比擬。此外,無需額外的訓練量,本文可實現比前沿技術更低的誤差率,在CIFAR-10和CIFAR-100上作者使用的DenseNet Snapshot Ensembling分別可以獲得3.4%和17.4%的誤差。

以上就是全部內容啦~關注「習悅智能」,獲取更多行業新鮮資訊~


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 習悅智能 的精彩文章:

15分鐘實現數字驗證碼自動識別,基於OpenCV+Keras

TAG:習悅智能 |