當前位置:
首頁 > 最新 > 遷移學習的發展和現狀

遷移學習的發展和現狀

AI 研習社系列公開課持續進行中,高水平的嘉賓、精彩的分享主題、寬廣的學術視角和敏銳的行業理解,肯定會讓每個觀眾 / 讀者都有所收穫。

伴隨著最近幾年的機器學習熱潮,遷移學習 (Transfer Learning)也成為目前最炙手可熱的研究方向。遷移學習強調通過不同領域之間的知識遷移,來完成傳統機器學習較難完成的任務。它是解決標定數據難獲取這一基礎問題的重要手段,也是未來更好地研究無監督學習的重要方法。在近日雷鋒網 AI研習社的公開課上,來自中國科學院計算技術研究所的在讀博士王晉東帶來了題為《遷移學習的發展和現狀》的分享。

觀看完整回顧大概需要60分鐘

王晉東,現於中國科學院計算技術研究所攻讀博士學位,研究方向為遷移學習和機器學習等。他在國際權威會議ICDM、UbiComp等發表多篇文章。同時,也是知乎等知識共享社區的機器學習達人(知乎用戶名:王晉東不在家)。他還在Github上發起建立了多個與機器學習相關的資源倉庫,成立了超過120個高校和研究所參與的機器學習群,熱心於知識的共享。個人主頁:http://jd92.wang

分享開始

各位聽眾各位同學大家晚上好,很榮幸收到 AI研習社的邀請,這次的主題是《遷移學習的發展及現狀》。

我是中國科學院計算技術研究2014級直博生王晉東,主要研究方向是遷移學習及其應用,下面是我的一些基本資料。今天主要是來分享知識,歡迎大家批評指正。

今天主要分為五部分。一是遷移學習的基本介紹,即為什麼要用遷移學習;二是遷移學習方法的常見分類;三是把遷移學習與深度學習結合起來的研究;四是遷移學習的一些最新進展;五是學習資源的推薦以及總結。

遷移學習基本介紹

先做一個小小的引子,吳恩達曾經說過,遷移學習將會是機器學習的下一個驅動力。

我們先來看一下背景:在智能大數據時代,面對數據量以及數據類型的不斷增加,需要能快速構建具有強泛化能力的機器學習模型。大部分數據往往沒有標註,收集標註數據或者從頭開始構建模型,代價高昂且費時。這時候就產生了一個問題:如何基於已有的數據和模型,對新數據快速構建相應的模型?

這個問題引出了遷移學習,遷移學習可以解決上述標定數據難以獲取的問題。

遷移學習基本思想是利用學習目標和已有知識之間的相關性,把知識從已有的模型和數據中遷移到要學習的目標上去,如下圖中所示。目前,遷移學習已被廣泛應用於機器學習的許多應用中。

從數據、模型和應用這三個角度來說,遷移學習都很有必要。

總的來說,遷移學習可以減少對標定數據的依賴,通過和已有數據模型之間的遷移,更好地完成機器學習任務。

遷移學習常見方法分類

下面是遷移學習的集中方法,目前常用的主要是同構和異構遷移學習,最常用的是下圖右邊的幾種方法。

先看基於實例的遷移學習方法。假設是源域中的一些數據和目標域會共享很多共同的特徵。方法是對源域進行instance reweighting,篩選出與目標域數據相似度高的數據,然後進行訓練學習。

下面為大家介紹幾個經典的基於實例的遷移學習方法,方法比較簡單,容易實現。

第二是基於特徵的遷移學習方法。

假設是源域和目標域含有一些公共的交叉特徵,方法是通過特徵變換,將兩個域的數據變換到同一特徵空間,然後進行學習。

下面是幾種比較經典的方法。

第三種是基於模型的遷移學習方法。

特點是模型相同部分直接進行遷移,好處是可以直接把已有的模型拿來用,針對目標任務做相應的修改。

代表工作有下面幾個比較經典的,優點是充分利用模型之間的相似性。

最後是基於關係的遷移學習方法,可以由師生關係類比上下級關係,也可以從生物病毒的傳播規律類比計算機病毒的傳播。

假設是如果兩個域是相似的,那麼它們會共享某種相似關係。方法是利用源域學習邏輯關係網路,再應用於目標域上。這部分的研究工作比較少。

深度遷移學習

下面來分析深度遷移學習。深度學習可以學習到更魯棒的、泛化能力更強的特徵表達,遷移學習能學習到領域無關的特徵表達,這和深度學習不謀而合,將兩者結合,能充分利用神經網路的表達能力,學習域不變的特徵表示。

下面看下最近的一些工作,14年有一篇論文探討了神經網路的可遷移性,橫軸是層數,縱軸是精度。

第二篇也是14年的,這篇文章是在AlexNet的分類器層前加入domain loss層,目前引用量也比較多。

15年發表的DAN網路對AlexNet網路的後三層都進行了域適配,還利用了Multi-kernel MMD進行距離度量,這是核心的亮點貢獻。

17年的ICML提出了JAN網路,兩個核心貢獻如下:一是聯合適配x和y的分布(JMMD度量),二是在網路中加入了adversarial學習。

這個工作加了soft labels,同時進行domain和task transfer,網路看起來比較複雜,大家可以看原文,也可以看我的專欄鏈接。

ADDA提出用adversarial的思想去進行domain adaptation,這篇文章也特別新,代碼也開源了。

以上介紹都是我認為的比較經典的方法,是目前來說在深度遷移學習裡面比較好的工作。

遷移學習的最新進展

下面來談談遷移學習的最新發展。做遷移學習最重要的點是找到相似度,當源域和目標域相似度減少,如何進行成功遷移呢。15年的Transitive transfer learning給我們在這個領域開闢了道路。17年的Distant domain transfer learning是對15年的論文的延伸。

第二個比較新的進展是利用物理學知識輔助學習任務。實驗效果是實線部分,作者的想法非常具有開創性。

第三個是學習遷移。我的理解是把遷移學習和增量學習進行結合,作者提出從已有的知識里自動學習比較適合的演算法和參數,這個很有前瞻性,也非常有意義。

學習資源推薦及總結

下面給大家推薦一些學習資源,前面是比較經典的兩個綜述,第一個是楊強老師的。下面也給大家推薦一些比較知名的學者、會議、期刊等。最後是我的GitHub,在持續更新,我的知乎專欄是《小王愛遷移》,歡迎大家投稿。

今天主要是希望大家了解到遷移學習,知道遷移學習的常用方法,大概了解到深度遷移學習以及一些最新的方向。

不要等到演算法出現accuracy不好、

loss很高、模型overfitting時,

才後悔沒有好好掌握基礎數學理論。

走穩機器學習第一步,夯實數學基礎!

「線性代數及矩陣論、概率論與統計、凸優化」

3大數學基礎課程,火熱團購中!

掃碼參團

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI研習社 的精彩文章:

從事人臉識別研究必讀的N篇文章
從傳統演算法走向神經網路
Yann Lecun CoLR演講全解讀:機器該如何像動物和人類一樣有效學習?
從傳統神經網路的角度解讀Geoffrey Hinton的Capsule模型
數據科學工作者 的日常工作內容包括什麼?

TAG:AI研習社 |