當前位置:
首頁 > 最新 > 自適應無監督學習的特徵提取方法

自適應無監督學習的特徵提取方法

【今日聚焦】

自動化所胡衛明研究員課題組提出一個新的非線性層級正交自適應子空間自組織映射網路(NOASSOM),可以自適應地、無監督地學習有效的特徵表示。

特徵提取是行為識別中的關鍵步驟。手工特徵往往因其固定的形式而受到限制,深度特徵十分有效,但需要大規模的標籤數據進行訓練。

自動化所胡衛明研究員課題組提出一個新的非線性層級正交自適應子空間自組織映射網路(NOASSOM),可以自適應地、無監督地學習有效的特徵表示。ASSOM是一種不同於卷積神經網路(CNN)的模型,通常情況下不用於分類預測,而是用於特徵表示。ASSOM可以從數據中學習統計模式,並對學到的模式進行自組織排列,從而對輸入數據進行特徵表示。但是ASSOM只能處理有標籤的數據,並且只針對線性化的數據有效,無法勝任其他複雜情形。NOASSOM的提出解決了ASSOM的這兩個重要問題,相關成果發表在AAAI2018上。

來自網路

首先,研究人員引入一個非線性正交映射層,NOASSOM能夠處理非線性的輸入數據,並使用核函數來避免定義該映射的具體形式。其次,修改ASSOM的損失函數,使輸入數據的每個樣本可以獨立地貢獻於損失函數,而不需要標籤。這樣,NOASSOM可以有效地、無監督地學習數據的統計模式。

來自文章

通過修改損失函數使每個樣本獨立地貢獻於損失函數,而不必使用Class-specific 的數據進行有監督訓練。研究人員使用隨機梯度下降法對網路進行訓練。在每次迭代之後,重新對基向量進行正交化處理。

研究人員還同時提出了一個層級的NOASSOM來提取高層的抽象的特徵表示,來有效地描述視頻中行為軌跡的表觀和運動信息。最後研究人員構建了一個層級的NOASSOM結構提取視頻中的局部行為特徵,使用FISHER VECTOR進行聚合編碼,採用SVM進行分類。

研究人員可視化了訓練結束後的基向量,從動作行為的表觀信息和運動信息學到的濾波器,如上圖所示。左邊是表觀信息濾波器,右邊是運動信息濾波器。可以看出表觀信息濾波器可以學到一些類似邊緣檢測的濾波器,這樣類型的濾波器對圖像的水平邊沿和垂直邊沿能進行檢測,從而提取良好的輪廓紋理信息。右邊的運動信息濾波器學到了一些類似Gabor濾波器的濾波器,這樣的濾波器對運動信息更加敏感,實現對運動信息進行良好的提取。

來自網路

NOASSOM在國際公開大型數據集UCF101, HMDB51和小型數據集KTH上進行了評測,獲得了93.8%,69.3%和98.2%的識別率。在UCF101和HMDB51上,分別超出使用手工特徵的iDt+HSV基準方法5.9%和8.2%,並且分別超出使用卷積神經網路模型的iDt+CNN方法2.3%和3.4%,在KTH上超過iDT+MBH的基準方法3.2%以及基於3D CNN的方法8.0%。公開數據集上的實驗結果表明,這種方法優於之前基於手工特徵的方法和大多基於深度特徵的方法。該方法的獨特優勢在於,可以從大量沒有標籤的數據進行更加快速的訓練,並且獲得和其他基於有標籤數據方法性能相當甚至更加優越的性能。此外,在小資料庫上,性能更加由於基於CNN的方法。

文章信息

Hierarchical Nonlinear Orthogonal Adaptive-Subspace Self-Organizing Map based Feature Extraction for Human Action Recognition

Yang Du, Chunfeng Yuan*, Weiming Hu, Hao Yang

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!

TAG: |