當前位置:
首頁 > 科技 > 清華魯繼文:深度強化學習與視覺內容理解

清華魯繼文:深度強化學習與視覺內容理解

不到現場,照樣看最乾貨的學術報告!

嗨,大家好。這裡是學術報告專欄,讀芯術小編不定期挑選並親自跑會,為大家奉獻科技領域最優秀的學術報告,為同學們記錄報告乾貨,並想方設法搞到一手的PPT和現場視頻——足夠乾貨,足夠新鮮!話不多說,快快看過來,希望這些優秀的青年學者、專家傑青的學術報告 ,能讓您在業餘時間的知識閱讀更有價值。

人工智慧論壇如今浩如煙海,有硬貨、有乾貨的講座卻百里挑一。由中國科學院大學主辦,中國科學院大學學生會承辦,讀芯術作為指定合作自媒體的「AI未來說·青年學術論壇」第三期「計算機視覺」專場已於2019年3月24日下午在中科院舉行。清華魯繼文老師為大家帶來報告《深度強化學習與視覺內容理解》。

魯繼文,清華大學自動化系副教授、博士生導師,主要研究方向為計算機視覺、機器學習和智能機器人。以第一/通訊作者發表IEEE彙刊論文50餘篇(其中PAMI論文12篇),CVPR/ICCV/ECCV會議論文50餘篇,論文被Google學術引用7000餘次(H指數為44),2篇論文獲IEEE 國際會議最佳論文獎。主持國家自然基金聯合重點基金1項,國家重點研發計劃課題1項。擔任國際期刊PRL主編,IEEET-IP、IEEE T-CSVT、IEEE T-BIOM和PR編委,IEEE信號處理學會多媒體信號處理技術委員會委員、信息取證與安全技術委員會委員、IEEE電路與系統學會多媒體系統與應用技術委員會委員、電路與系統學會視覺信號處理與通訊技術委員會委員,中國計算機學會計算機視覺專委會常務委員,中國圖象圖形學學會視覺大數據專委會常務委員。擔任AVSS和DICTA等國際會議程序委員會主席4次,ICIP、ICME和ICPR等國際會議領域主席20餘次。2015年入選中組部青年千人計劃,2018年獲國家優秀青年基金。

報告內容:深度強化學習是人工智慧領域的研究熱點,被認為是人類邁向通用人工智慧的重要技術。深度強化學習通過將深度學習的感知能力與強化學習的決策能力相結合,以端對端的方式實現從原始輸入到語義輸出的感知與決策,在許多視覺內容理解任務中取得了重要突破。報告將介紹清華大學自動化系智能視覺實驗室近年來提出的面向視覺內容理解的多個深度強化學習方法,主要包括多智能體深度強化學習、漸進式深度強化學習、上下文感知深度強化學習、圖模型深度強化學習等,以及它們在人臉檢測與識別、物體檢測與跟蹤、圖像識別與檢索、行為預測與識別等多個視覺內容理解任務中的應用。

深度強化學習與視覺內容理解

魯教授帶來了題為《深度強化學習與視覺內容理解》的分享。

視覺內容理解的本質是對圖像或視頻進行語義理解。計算機視覺本身要解決兩個問題:「看得清」,「看得懂」。魯教授的團隊主要關注於「看得懂」這一問題,即理解圖像和視頻的內容。

視覺內容理解的研究目標有:

圖片描述的場景

圖片中有什麼物體

圖片中物體的位置

物體之間的關係

圖片與場景關係

圖片未來會發生什麼

視覺內容理解要解決的問題有:

場景理解,場景識別

物體識別,物體檢測,物體跟蹤

物體之間的關係,物體與場景的關係,即關係推理

行為識別,行為預測

視頻分析

視覺內容理解有很多挑戰。在識別任務中,同樣一個對象,不同的光照、不同的姿態、不同的視角、不同的尺度,數據差別很大。同時,深度學習需要大量的數據,但很多場景的訓練樣本很小,比如稀有的動物和醫學圖像,即小樣本學習的問題。視覺推理任務則需要找到外部關係,通過場景和物體來推理髮生的事件,視覺推理的問題是一個比較難的問題。視覺定位和導航(視覺交互問題)則需要多種感測器採集信息,進行跨模態的數據關聯和匹配(多模態分析問題)。

魯教授還介紹了強化學習的模型與應用,使用馬爾科夫決策過程對視頻進行建模,使用強化學習來選取和度量視頻的有用幀,多智能體交互的過程就是馬爾科夫決策過程。

魯教授指出,近幾年深度學習在大多數視覺理解任務上相比於非深度學習有著很好的性能提升,未來的趨勢是通過引入自主學習,以搭積木的方式搭建模型。通過在深度學習中引入強化學習,把強化學習的決策能力和深度學習的表示能力結合起來,是一種更好的建模策略,從而提升相應視覺任務的性能。如何把深度強化學習方法與認知計算結合,提出更加符合人類認知的深度強化學習計算模型,進一步提升視覺內容任務的性能是未來視覺內容理解的重要研究方向。

第一期數據挖掘專場回顧

第二期自然語言處理專場回顧

留言 點贊 發個朋友圈

我們一起分享AI學習與發展的乾貨


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 讀芯術 的精彩文章:

哈工大劉一佳:通過句法分析看上下文相關詞向量
TensorFlow.js:讓你在瀏覽器中玩轉機器學習

TAG:讀芯術 |