北航教授李波：說AI會有低潮就是胡扯，這是人類長期的追求

科技 09-29

這一輪所謂人工智慧的高潮，和以往的幾次都有所不同，那是因為其受到了產業界的極大關注和參與。而以前並不是這樣。

當今世界是一個高度信息化的世界，甚至我們有一隻腳已經踏入了智能化時代。而在我們日常交流和信息互動中，迅速發展的多媒體技術起到了至關重要的作用。

在日前結束的「2017中國多媒體大會」上，提出了「智能媒體，創新未來」的主題。會後，我們採訪了大會主席、北京航空航天大學教授李波，就當前人工智慧技術在多媒體中的應用以及二者相互促進展開對話。

多媒體（Multimedia）是數據的最主要的現形式。在計算機系統中，多媒體指文本、圖形、圖像、視頻、聲音、動畫和影片等，在實際應用中，也可以多種媒體綜合使用。多媒體的應用領域已涉足諸如安防、影視、娛樂、廣告、藝術、教育、工程、商業及科研等諸多行業。

AI熱起來首先爆發在多媒體領域

多媒體技術是把信息技術與應用結合起來的核心技術。很多信息在現實生產和生活中的使用，都會涉及到聲圖文視頻等，還有在我們常說的人機交互中，多媒體技術也都發揮著重要的作用。

當前這一輪的人工智慧熱起來，與多媒體關係很大，首先是深度學慣用於語音識別，很大程度上提升了識別效果。其次是圖像分析，對圖像分類、人臉識別、以及圖像檢索等也有大幅度提升。這些都是AI與多媒體應用結合的表現。

另一方面，關於多媒體技術本身的發展。多媒體的數據量很大，其內容豐富多彩，理解難度大，它本身的內容分析就需要智能處理，目前多媒體處理正在朝著智能化方向發展。所以本次大會的主題里有一個叫做「智能媒體」，體現的就是這件事情。

關於主題中的「創新未來」，因為多媒體技術是一種與應用結合十分緊密的技術，所以說它必將在各行各業、方方面面發揮越來越重要的作用。大家目前聽到的、看到的很多東西都是這樣，比如無人駕駛系統，它首先要感知周圍的場景，要有視覺技術支撐。又比如大家看到的機器人問詢系統，它的核心在於語音識別、自然語言理解，也是以模擬人的聽覺和語音處理來實現的。

所以說，多媒體技術的智能化對經濟社會、生產生活的方方面面產生了重大影響，這也是另一個主題「創新未來」的由來。

圖像識別和語音識別之外有更多的AI應用在我們身邊

首先呢，我們要區分人工智慧和深度學習。人工智慧是一種跨學科的、多學科交叉的技術，它在不同的應用行業對其的要求也有所區別。

現在所說的深度學習影響很大，它最早是在語音和圖像識別取得突破。但是，深度學習只是其中一種技術，人工智慧還有很多其他的技術，遠遠不只深度學習這種技術，例如數據分析、模式識別、智能控制等，也都是屬於人工智慧技術的範疇。

例如數據內容分析方面的技術，在金融行業的風控、在股票市場的監管、在電信行業的反欺詐、在智慧物流的調度等方面，也都在發揮重要的智能作用。此外，在工業生產過程中，例如各種複雜調度、零件裝配、故障檢測等，也都用到很多人工智慧技術做支撐。

AI技術本身並沒有落與不落退潮之後也沒有裸泳者

常說人工智慧有「三起兩落」，現在正處於第三次「起」的階段，那將來還會有第三次的「落」嗎？如果有，哪些技術和應用會成為退潮之後的裸泳者？

人工智慧為什麼會有所謂的「三起兩落」？因為人來一直在不斷地拓展自己的智力，在追求更高更大的目標，並用於方方面面。

人類發明了車輛，讓我們可以跑的更快；發明製造了飛機，讓我們可以飛上天空。

所以說，人工智慧的起落過程並沒有什麼值得擔憂的，它只是人來在追求更高目標過程中正常的階段性體現。另外，落與不落，只是發展狀況的一種相對說法。

但是，這一輪所謂的人工智慧高潮，和以往幾次都有所不同。為什麼呢？因為本輪的人工智慧之所以這麼熱，那是因為其所處的環境有了本質的變化，並受到產業界的極大關注和參與，而前兩輪並不是這樣。

雖然從第二輪開始，產業界對智能系統開始逐步重視，但相比這一輪來說，重視程度遠遠不及，並沒有現在的普及和全面，對普通老百姓的工作和生活的影響也遠不如現在這麼大。原因是什麼？首先是現在的環境不一樣了，現在是互聯網時代的快速發展，另外是在大數據的背景下，再加上計算系統的高性能化（現在普通手機的計算性能抵得上以前的一台大型計算機），使得這一輪人工智慧在某些應用方面可以做的很實，真正體現較高的智能特徵。

當然，由於各個行業之間千差萬別，其對人工智慧技術的需求不盡相同，所以也使得人工智慧對具體行業的影響各有不同。比如說對我們的聽、說、寫等相關度比較高的，以及與大數據聯繫緊密的行業，影響就非常大；而對於其他的行業（需要做綜合的決策，而數據量又不夠多），影響可能就會相對較小。