專家雲集CSIG圖像圖形學科前沿講習班,共同探索「深度學習+視覺大數據」
2017 年 6 月 2 日,由中國圖象圖形學學會主辦的 CSIG 圖像圖形學科前沿講習班(Advanced Lectures on Image and Graphics,簡稱 IGAL)第 1 期會議在北京中國科學院自動化所學術報告廳如期舉行。本次講習班的主題為時下最火熱的「深度學習+視覺大數據」,十位學科領域內的頂級專家將結合自身研究背景,分享大數據時代下的前沿計算機視覺技術及最新進展,詳解深度學習方法及其在各視覺場景中的落地應用。
6 月 2 日上午,繼中國科學院院士譚鐵牛和中國科學院自動化所研究員王亮發表致辭後,北京大學信息科學技術學院教授、計算機科學技術系主任黃鐵軍率先展開《大數據背景下的視覺信息處理》主題學術報告。黃鐵軍以視頻大數據面臨的三大挑戰為切入點,分別針對海量數據的存儲、傳輸以及計算過程進行詳細的解讀。
北京大學信息科學技術學院教授、計算機科學技術系主任黃鐵軍
百萬路視頻高質量的清晰存儲成本較大,為了控制成本,在保證圖像質量和成本可接受的條件下,研究高效視頻壓縮方法對解決這一問題至關重要。不過,即便視頻編碼效率按照目前的發展趨勢可以在五年內翻倍,但是能夠同步實時傳輸的只有百/千路,多數不能實時訪問。那麼,如何在寬頻允許的情況下完成實時傳輸?對此,黃教授一語點出,視頻是給機器看的,不需要重建視頻,只需要傳輸分析識別需要的特徵即可,因此,研究視覺特徵高效編碼方法成為打破視頻大數據傳輸壁壘的良方。
另外,黃鐵軍還從進化大數據下的視覺信息處理角度,介紹了仿生物視覺的視覺信息表達、分析方面的最新研究進展,並肯定了生物視覺模擬模擬研究的巨大潛力。
接下來,山東大學計算機與技術學院、軟體學院院長陳寶權帶來了一場關於《城市場景三維感知與分析》的主題學術分享。數據的獲取是建立智慧城市的基礎,其中獲取城市場景的三維描述和理解是一個新穎並充滿挑戰的課題。城市場景的三維獲取是陳寶權重點研究的領域,他著重介紹了基於影像以及激光掃描兩種方式下三維數據獲取的發展歷程、研究進展以及存在的難點。與此同時,陳寶權以街景—街拍融合、航拍—監控視頻融合、三維場景—監控視頻融合為例,解析了多源數據的交互融合以及此基礎上對城市場景和事件開展可視分析的過程,並提出未來研究內容包括:城市場景的全息表達與漸進式構建、城市多模態數據的語義計算與融合、複雜事件的臨場分析與推理。另外,他特別指出,增強現實的信息呈現構成了人與機器的融合,未來,時空精準耦合、虛擬—現實無縫融合、人腦智能高度融合將成為這一領域研究的重點。
山東大學計算機與技術學院、軟體學院院長陳寶權
隨後,浙江大學計算機學院副院長、浙江大學人工智慧研究所所長吳飛針對《跨媒體計算:從淺層關聯到深度建模》這一主題進行了詳細的解析。互聯網時代湧現了類型複雜多樣、來源廣泛的海量數據,這些不同類型的媒體數據(文本、圖像和視頻等)之間以跨媒體形式表達共同語義。跨媒體計算的本質是通過學習和推理,實現從一種媒體類型到另外一眾媒體類型的跨域,但這個過程存在著異構鴻溝、語義鴻溝、深度推理等難點。
吳飛從模態互補、逐層抽象和結構約束等角度,詳細介紹了包含典型相關性分析等跨媒體淺層關聯方法,並從深度模型基本概念由淺入深,詮釋了深度建模模型,如深度隨機遊走、跨媒體組合語義深度學習、跨媒體哈希索引等。
浙江大學計算機學院副院長、浙江大學人工智慧研究所所長吳飛
今天的第四場學術報告是上海交通大學電子信息與電氣工程學院副院長、圖像通信研究所副所長楊小康帶來的《過程深度學習》。生命在於過程,進入數字時代後,人類在生產和生活過程中積累了海量數據。過程大數據的分析和利用,使人類可以動態、持續地認知、適應、改變生產和生活環境,主要包括語音、視頻等離散採樣的同步序列和神經脈衝、交易、犯罪等隨機觸發的非同步序列。過程的分析方法則包括模型驅動和數據驅動兩類。在這裡,楊小康詳細介紹了模型驅動的過程建模方法,通過反覆驗證建立過程的抽象及簡化表示。但這種方法的局限性在於框架相對固定、不易適應信息社會不斷湧現的新現象。
人類生產生活中產生並積累的過程大數據,使得數據驅動的過程分析成為可能。將深度學習引入到過程分析,可以推動隨機過程和機器學習的學科交叉,進一步加強機器學習技術在信息社會的滲透性,帶來過程學習的新突破。楊小康結合計算機視覺和社交媒體分析等實例,介紹了他所研究領域內點過程深度學習、交互過程深度學習、多尺度過程深度學習、混合過程深度學習等方面的研究進展。
上海交通大學電子信息與電氣工程學院副院長、圖像通信研究所副所長楊小康
CSIG 圖像圖形學科前沿講習班第 1 期會議第一天,四位教授所帶來的學科領域前沿技術分享,不僅有助於參與者開拓視野、提高技術水平,還加強了領域內學者之間的交流和溝通。期待未來兩天講習班更多頂級學者的精彩分享。


※ACL 2017 傑出論文公布,國內四篇論文入選
※初學者必讀:IBM長文解讀人工智慧、機器學習和認知計算
※谷歌雲李佳:谷歌如何開發和應用人工智慧
※騰訊AI Lab副主任俞棟:語音識別研究的四大前沿方向
※微軟發行 CNTK 2.0 完整版:從性能更新到應用案例
TAG:機器之心 |
※全國MATLAB數據、圖像處理及機器學習與深度學習研討會
※「深度學習不是學習」:英特爾高管與AI大牛LeCun展開互懟
※ASSIA|中國自動化學會「深度與寬度強化學習」智能自動化學科前沿講習班(二)
※TechX 深度強化學習導師和舜成專訪
※中科視拓推DTaaS深度學習訓練服務 可大幅降低AI研發門檻
※IBM推AI深度學習計劃
※CMU 深度學習導論更新
※深度學習out了?深度解讀AI領域三大前瞻技術
※CMU課程:深度增強學習與控制
※周志華揭牌英特爾-南大聯合研究中心:探索DNN與GPU之外的「廣義深度學習」
※深度學習AI美顏系列—-基於摳圖的人像特效演算法
※亞馬遜AWS首席科學家談深度學習的多領域應用
※吳恩達團隊公布最大醫學影像數據集 MURA,基於深度學習檢測骨骼疾病
※ArcGIS 10.6 影像集成深度學習和立體測圖
※利用深度學習幫助科學圖像分析
※Github熱門圖深度學習源碼與框架
※AI在網路安全領域的應用:機器學習 VS.深度學習
※專欄 | 讓AI簡單且強大:深度學習引擎OneFlow技術實踐
※用AI設計微波集成電路,清華大學等提出深度強化學習方法RINN
※深度學習得靠它!NVIDIA Volta GPU核心架構深層技術