當前位置:
首頁 > 科技 > 北航教授李波:說AI會有低潮就是胡扯,這是人類長期的追求

北航教授李波:說AI會有低潮就是胡扯,這是人類長期的追求

這一輪所謂人工智慧的高潮,和以往的幾次都有所不同,那是因為其受到了產業界的極大關注和參與。而以前並不是這樣。

當今世界是一個高度信息化的世界,甚至我們有一隻腳已經踏入了智能化時代。而在我們日常交流和信息互動中,迅速發展的多媒體技術起到了至關重要的作用。

在日前結束的「2017中國多媒體大會」上,提出了「智能媒體,創新未來」的主題。會後,我們採訪了大會主席、北京航空航天大學教授李波,就當前人工智慧技術在多媒體中的應用以及二者相互促進展開對話。

多媒體(Multimedia)是數據的最主要的現形式。在計算機系統中,多媒體指文本、圖形、圖像、視頻、聲音 、動畫和影片等,在實際應用中,也可以多種媒體綜合使用。多媒體的應用領域已涉足諸如安防、影視、娛樂、廣告、藝術、教育、工程、商業及科研等諸多行業。

AI熱起來首先爆發在多媒體領域

多媒體技術是把信息技術與應用結合起來的核心技術。很多信息在現實生產和生活中的使用,都會涉及到聲圖文視頻等,還有在我們常說的人機交互中,多媒體技術也都發揮著重要的作用。

當前這一輪的人工智慧熱起來,與多媒體關係很大,首先是深度學慣用於語音識別,很大程度上提升了識別效果。其次是圖像分析,對圖像分類、人臉識別、以及圖像檢索等也有大幅度提升。這些都是AI與多媒體應用結合的表現。

另一方面,關於多媒體技術本身的發展。多媒體的數據量很大,其內容豐富多彩,理解難度大,它本身的內容分析就需要智能處理,目前多媒體處理正在朝著智能化方向發展。所以本次大會的主題里有一個叫做「智能媒體」,體現的就是這件事情。

關於主題中的「創新未來」,因為多媒體技術是一種與應用結合十分緊密的技術,所以說它必將在各行各業、方方面面發揮越來越重要的作用。大家目前聽到的、看到的很多東西都是這樣,比如無人駕駛系統,它首先要感知周圍的場景,要有視覺技術支撐。又比如大家看到的機器人問詢系統,它的核心在於語音識別、自然語言理解,也是以模擬人的聽覺和語音處理來實現的。

所以說,多媒體技術的智能化對經濟社會、生產生活的方方面面產生了重大影響,這也是另一個主題「創新未來」的由來。

圖像識別和語音識別之外有更多的AI應用在我們身邊

首先呢,我們要區分人工智慧和深度學習。人工智慧是一種跨學科的、多學科交叉的技術,它在不同的應用行業對其的要求也有所區別。

現在所說的深度學習影響很大,它最早是在語音和圖像識別取得突破。但是,深度學習只是其中一種技術,人工智慧還有很多其他的技術,遠遠不只深度學習這種技術,例如數據分析、模式識別、智能控制等,也都是屬於人工智慧技術的範疇。

例如數據內容分析方面的技術,在金融行業的風控、在股票市場的監管、在電信行業的反欺詐、在智慧物流的調度等方面,也都在發揮重要的智能作用。此外,在工業生產過程中,例如各種複雜調度、零件裝配、故障檢測等,也都用到很多人工智慧技術做支撐。

AI技術本身並沒有落與不落退潮之後也沒有裸泳者

常說人工智慧有「三起兩落」,現在正處於第三次「起」的階段,那將來還會有第三次的「落」嗎?如果有,哪些技術和應用會成為退潮之後的裸泳者?

人工智慧為什麼會有所謂的「三起兩落」?因為人來一直在不斷地拓展自己的智力,在追求更高更大的目標,並用於方方面面。

人類發明了車輛,讓我們可以跑的更快;發明製造了飛機,讓我們可以飛上天空。

所以說,人工智慧的起落過程並沒有什麼值得擔憂的,它只是人來在追求更高目標過程中正常的階段性體現。另外,落與不落,只是發展狀況的一種相對說法。

但是,這一輪所謂的人工智慧高潮,和以往幾次都有所不同。為什麼呢?因為本輪的人工智慧之所以這麼熱,那是因為其所處的環境有了本質的變化,並受到產業界的極大關注和參與,而前兩輪並不是這樣。

雖然從第二輪開始,產業界對智能系統開始逐步重視,但相比這一輪來說,重視程度遠遠不及,並沒有現在的普及和全面,對普通老百姓的工作和生活的影響也遠不如現在這麼大。原因是什麼?首先是現在的環境不一樣了,現在是互聯網時代的快速發展,另外是在大數據的背景下,再加上計算系統的高性能化(現在普通手機的計算性能抵得上以前的一台大型計算機),使得這一輪人工智慧在某些應用方面可以做的很實,真正體現較高的智能特徵。

當然,由於各個行業之間千差萬別,其對人工智慧技術的需求不盡相同,所以也使得人工智慧對具體行業的影響各有不同。比如說對我們的聽、說、寫等相關度比較高的,以及與大數據聯繫緊密的行業,影響就非常大;而對於其他的行業(需要做綜合的決策,而數據量又不夠多),影響可能就會相對較小。

但即使是人工智慧不那麼熱的時候,也不能說AI技術就沒用了。事實上,人工智慧已經悄然進入我們生活的方方面面,在潛移默化中發揮作用並影響世界。

只要人類追求智能、追求更高目標的決心不變,人工智慧的高潮就會一直存在且持續下去。

數據驅動和知識驅動相結合的思維方式是未來AI的目標

人類思維是一種綜合的思維,來自兩個方面:一方面是來自數據驅動的學習,通過數據在人腦中的不斷抽象,就會形成高一層的語義。也就說,基於深度學習的智能,更多的就表現在這個方面。

另一方面,是知識驅動展現的智能。人類的思考是有目的的,在同樣條件下,出於不同的目的,思考的結論可能不同;所以在同一個場景里,今天和昨天可關注的事不同。

原因是什麼?因為我們的目的不一樣。也就是說,人類思考同樣存在至上而下的目標驅動;在展現智能方面,也存在利用高層知識去影響分析理解,這就是所謂的知識驅動。

在複雜的應用中,數據驅動和知識驅動都會存在,這樣才能展現高水平的智能,所以說這兩方面都是需要的。在我們常說的小樣本分析,更需要知識驅動發揮作用。

在數據不足時,人類依靠經驗也能實現正確的判斷和思維;這說明機器也需要借鑒其他領域學習的知識,提高小數據或小樣本下的學習效果,目前在這方面還存在著很多不足和缺陷,需要深入系統的研究。

現在的攝像設備更多是在被動采圖未來將要實現主動視覺

在視覺這件事情上,人類的視覺範疇比我們目前見到的圖像和視頻的範疇更加廣泛。人類的視覺能感受到客觀世界的方方面面,而我們在客觀世界裡能見到的物理現象是很多的,有聲光電熱、位置、方向、速度等等。

但目前的攝像頭只能做到被動感知。直白的說,就是你讓攝像頭照什麼,它就會照什麼。而人類不是這樣,當人類在思考需要什麼之後,自己就會去主動獲取什麼。

舉個例子,在同一個場景里,人類看到了一輛汽車。如果他要想把車牌看清楚,他就會調整視覺到車牌的位置;如果他想把駕駛員看清楚,他就會調整視覺到駕駛員的位置。

而我們的攝像頭在這方面就做的比較差勁了,它並不會主動根據目標而調整自己的拍攝視覺。在主動去感知周圍的場景和全方位、立體的感知周邊環境等方面,做得很不夠。

此外,現在大多用的是以光學攝像頭為主的設備,但上面也說到了客觀世界除了視覺還有很多方面,而這些僅憑光學攝像頭是根本無法完全收集到的。所以我們將來會需要像激光、紅外、雷達、GPS等結合起來的攝像設備。

將來計算機的感知系統應該是用綜合型的視覺來完成,而不是現在被動式的采圖。將來的攝像頭也應該是一雙很聰明的慧眼,類似甚至要超過人眼的功能。

未來的Tof深度相機需要把更多信息整合到一起

在說到深度相機和傳統相機區別的時候,首先要說一下我們的客觀世界。

眾所周知,我們的客觀世界是三維的,我們在認識世界的時候,深度信息、位置信息等是非常重要的。傳統相機的成像也好、視頻也好,都是二維的信息,缺乏深度信息。

而深度相機是在傳統相機的基礎上,加上了深度信息,使得機器在分析周圍場景的時候,多了一維信息,從而提高了分析的準確性。

同時,由於客觀世界遠遠不止深度,還有很多像溫度、濕度、速度、方向等等,所以未來的深度相機應該要把更多的信息也整合到一起。

不過,在深度信息的獲取方面,如在特定場景、遮擋、距離等的情況下,準確感知深度就存在著較大的困難。

所以目前的應用也相對有限,像只在室內、倉庫、遊戲交互等短距離的場景下,才能有理想的效果,而在其他場景則會大打折扣。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 鎂客網 的精彩文章:

指紋、面部識別解鎖都out,科學家要用心臟解鎖電腦
酷騎就押金難退問題發表聲明,原CEO高唯偉已被罷免
這款腕帶型智能「小空調」,可以提供帶節奏的漸進式熱傳遞
人民網三評智能演算法,矛頭直指今日頭條,技術又一次為平台背了鍋
他曾讓谷歌、Facebook成就傳奇,現在正努力把AI推向公益化

TAG:鎂客網 |