當前位置:
首頁 > 科技 > 過去60年人工智慧的起起伏伏 高文助陣談AI機遇

過去60年人工智慧的起起伏伏 高文助陣談AI機遇

在首屆JDD(JD Discovery)大會上,劉強東開門見山表示:往前20年和往後20年,都找不到如此巨大的機會。這位京東創始人還說,各行各業,都不可能像中國一樣發生巨變,都可能有如此巨大的機會。

這個歷史機遇,正是人工智慧,也是基於如此原因,京東決定此後每年都要舉辦全集團最高級別的技術大會——JD Discovery/Data大會,簡稱JDD。

在首屆JDD大會上,中國工程院院士、北京大學信息科學與工程科學部主任高文,同樣針對於人工智慧的現狀,過去以及未來進行了分享,以下為演講實錄:

各位嘉賓早上好,我和楊強教授是多年的朋友,從1991年我們一起參加世界人工智慧聯合會,相識了以後,二十幾年每年都保持一些溝通、交往,所以開始他動員我來這裡說幾句,這是一個金融創新的會,我就說說比較宏觀的東西。

我們現在已經從大數據時代,移到人工智慧時代。實際上這和大數據本身的內涵關聯性比較強,大數據本身的規模特別地大,越來越大,從原來的EB級現在正在往ZB級發展,數據本身在不停地增加,我們叫數據泛濫。這個數據泛濫,比如和零售有關有很多數據,再早一點是科學的數據,不管哪種數據都是和網路關聯的,個人自媒體出來以後網路數據又非常多。但這些數據以前大家都把它叫做大數據,最近有一個講法,大數據不是規模大,而是垃圾多的數據叫大數據,利用率低的數據。

AI自主學習仍需前提條件

比如視頻數據,另外網路的個人數據,真正被利用的比例還是很低的,大數據本身的概念越來越大,但這個數據大了以後到底怎麼使用怎麼發展,最近一段時間大家都深入討論,比如說數據是不是越大越好,是不是什麼東西都一定要一個數據?回答是No。最近有一個非常好的案例,AlphaGo下圍棋,以前是需要使用人類下圍棋的數據,同時自己嘗試了三千萬局的數據,最近的AlphaZero不需要人類對弈數據了,自己會生產數據。現在我們就可以提問,什麼樣的情況不需要外部數據,自己生產數據就夠了?我和有些專家討論,覺得,什麼樣的AI系統不需要外部數據就可以戰勝人,實際上就是滿足三個條件:

1、集合是封閉的。不管你是狀態集還是什麼集,你的集合是封閉的,我們知道圍棋集合是封閉的。

2、規則是完備的。也就是說下棋什麼地方能下,什麼地方不能下,這個規則完全完備的,不能隨便更改。

3、約束是有限的。也就是說你在約束條件下,不可以遞規,因為有了遞規之後往下推延就停不下來,而有限的時候就能停下來。

滿足這三個條件,不需要外部數據,系統自己產生數據就夠了。所以可以想見,今後有很多的情況你去判斷這個人和機器最後誰能贏,滿足這三個條件機器一定贏,不管德撲、圍棋,類似的情況很多了。

是不是所有的情況都是這樣?當然不是。

你可以看現在很多的交易、物流、零售,其實它有很多的條件一直在變,不滿足剛才的條件。

這時候你需要很多外部的數據,但是不是有外部數據就夠了?當然不是。

外部數據怎麼用?它自己不會去產生一個用法,這個用法需要靠人,通過人工智慧的這些手段,去用這些數據。所以人工智慧實際上就是從大數據科學到人工智慧是一個非常非常自然的遷移過程。

人工智慧可以火多久?

最近人工智慧非常熱,熱到每一個人,每一個投資人都說我要投人工智慧或者我要幹人工智慧,這件事好不好呢?不知道。

但我們可以看看歷史,以史為鑒,人工智慧到現在的發展,到去年剛好是60年。我們看看60年的發展實際上是經歷了三個階段,第一個階段20年,1956年到1976年。第二個階段,從1976到2006年,30年,2006年是第三波浪潮剛剛開始,它會持續多長時間?不知道,可能25年,可能35年,也可能是40年。當然按照20、30,下面到底是40年、30年甚至60年。但你知道這個規律就知道人工智慧絕不是已經把所有的事情做完了,如果用人的一生來比喻,人工智慧其實現在大概剛上小學的程度,有的還不到小學的程度,所以現在它的歷程可能只是1/10,後面有很長的路可走。

在人工智慧路上有很多關鍵人物不能忘記,圖靈。不能忘記,計算機領域特別重要的一個獎圖靈獎,其他學科有諾貝爾獎,諾貝爾時代沒有計算機,後來有了計算機以後,大家就想計算機界也應該設一個和諾貝爾獎相當的獎,這個獎就是圖靈獎,現在全世界一共65個人得了一個圖靈獎,姚期智教授,是華人當中唯一得到圖靈獎的。

在人工智慧領域得到圖靈獎的一共8位,馬文.明斯基(1969),約翰.麥卡錫(1971),艾倫.紐厄爾(1975),赫伯特.西蒙(1975),愛德華.費根(1994),拉吉.瑞迪(1994),萊斯利.瓦倫特(2010),猶大.伯爾(2011),就是照片上這八位。整個計算機科學領域人工智慧實際上是插在寶塔尖的1/8。萊斯利.瓦倫特,猶大.伯爾,後面這兩位是2010年和2011年獲獎,都是和概率推理和概率學習、因果學習有關的兩個學者。

總體來說,人工智慧到現在有三個主要的代表性的學派,哪三個呢?第一個是用邏輯的方法做人工智慧,通常我們把它叫做邏輯主義學派,或者叫做符號主義學派。第二個是以連接主義為基本工具,就是用神經元網路,今天的深度學習就是它一個典型的代表。第三個學派,從搞控制論的人,比較主張的一個學派,更多的是做這種自適應和進化、計算。這三個學派里各有千秋,不能說哪個好哪個壞。

什麼叫人工智慧?剛才主持人說的非常好,說我們今後可能就是人類智能和人工智慧的一個對決,其實人工智慧是人類智能的一個計算機的實現,從對決的角度,它永遠不可能超過人類智能,只是說在某一個特定的方面它可能勝出,但從智能本身它沒辦法勝出。我們看看智能的定義,其實智能有很多方面,包括邏輯能力,語言能力、空間能力、感知能力,包括音樂感知的能力,肢體的控制能力。後面這幾個是比較難的,包括人的內省、自我反省,包括人際關係的能力,包括自然探索的能力,比如發現一些新的東西,完全沒有任何線索,你能想出我要做這個,我把這個問題解決掉,自然探索的能力,包括圖像、圖形的感知能力。

其實智能分為這九個能力,而現在的人工智慧在這九個方面只有三個做的還可以,有六個方面還相當的遠,所以我們說現在的人工智慧要想挑戰人類智能,路還很長。

為什麼我們說人工智慧60年呢?因為1956年當時有一個里程碑式的會議,達特茅斯會議。當時人工智慧這幾個最元老,那時候很年輕,他們集聚到一起開了兩個月的會,怎麼樣讓機器具有人的智能,討論定出了人工智慧的最終目標,什麼叫人工智慧。現在看起來1956年定義的人工智慧的白皮書,到現在一點都不過時。所以我們說年輕人還是非常厲害的,特別同意剛才劉強東說的,對新事物、對年輕人要充分認可,那時候三四十歲的年輕人,那時候計算機剛剛興起,人工智慧概念沒有,他們就提出來我們要怎麼做這個東西,這是非常了不起的一件事,現在看起來確實他們做的是對的。

這次會議開了以後,全世界(主要是美國、歐洲),那時候很多學校都開始跨入人工智慧熱潮當中,典型的像斯坦福大學、CMU、MIT、哈佛大學很多人都做相關的這些研究,那個階段大家採用的技術手段,主要是邏輯主義或者符號主義。

什麼叫邏輯或者符號呢?實際上就是他認為一切的推理,我都可以用邏輯演算的方式來實現,我只要定義了整個邏輯演算的體系,做一個規則,就可以完成任何事,可以進行推理、數學證明,可以創作、奏樂等等,所以全是通過符號的方式來做。這個事其實我們小學就學過代數運算,邏輯它也是運算,但它不是用的代數運算,是用的布爾運算,它其實和代數運算非常接近。有了這個運算就可以對它進行推理,推理你要使用一個工具,他們使用了演繹推理的工具。

到現在為止,最主要的自然科學的定理使用的都是演繹推理的方式來完成的。比如說亞里士多德他的三段論體系就是非常典型的演繹推理,歐幾里得的幾何學也是用這樣完成的,牛頓力學,麥克斯韋、愛因斯坦全都是用演繹定理推出來的。

所有演繹推理的基礎滿足是三段論方程,什麼叫三段論,我有一個大前提,這是一個一般的原理,我有一個小前提是我要研究的特殊情況,根據大前提、小前提得到一個結論,這個結論是根據一般情況,對特殊情況做出一個判斷,這就完成了演繹推理,這就叫三段演繹推理。

所有的基礎邏輯的方法都是這樣做的,為了做這個當時設計了很多的人工智慧語言,用這種語言可以寫人工智慧的方程,機器就可以去證明。

過去60年人工智慧的起起伏伏

當然這聽起來很好,而且第一次浪潮,大家都認為十年之內人工智慧一定可以完成很多事,但一直到1976年前後大家發現一開始定的那麼高調的東西絕大多數都實現不了,加上當時有人落井下石。1973年有一個英國人發了一個報告,給AI撥一大盆冷水,把AI研究分三類系統,A是指自動機、B是機器人、C為中央神經系統。自動機和中央神經系統研究是有價值的,但進展太慢,機器人的研究毫無價值,而且非常令人失望,所以他建議把所有的機器人研究都取消掉。A和C因為它本身令人失望,所以也是非常低調。這個報告出來以後各國政府全部都把對人工智慧投入的經費砍掉,馬上就進入了嚴冬。所以1976年實際上是人工智慧第一次的嚴冬的到來。

1976年之後儘管沒有經費,學者的可愛之處是給錢也做,不給錢也做。因為做邏輯的,前面已經把自己的體量拉的很大,沒錢物的馬上就地卧到,沒得到錢的還在繼續做。當時做神經網路的,基本上沒有得到什麼錢,不看好,所以本身就是教授帶幾個學生在那玩,這個領域雖然面臨寒冬了,但對他來講沒有變化,反正盛夏的時候沒有錢,寒冬的時候還是沒錢,所以帶著學生繼續玩。這一玩玩出花樣來,1976年開始有很多做神經元網路的,不停的寫東西、發東西,一直到1986年出來一個讓人眼睛一亮的東西,這個東西叫BP演算法。

以往的神經元網路只能做非常小的事,做不了大事。但這個東西出來以後可以做大事了,所以就推動了這個領域發展的速度非常快,時間關係我就不展開了。

但這個也是它能解決一些問題,一開始也是要解決很多問題,這個其實也是遙遙無期,到最後又來了第二次的低谷,包括日本第五代機的失敗,當時在斯坦福大學要建一個知識百科全書的項目都失敗了,使得第二次人工智慧又跌入了低谷。

第三次是從2006年開始的,現在是人工智慧的三個大牛,一位在多倫多大學,一位在蒙特利爾大學,一位在紐約大學,這一年分別發表了三篇文章在講一件事。剛才說神經元網路可以進行大規模的學習,而且可以學習的速度很快,精度很高。這個文章出來了以後,當時大家並不知道這個東西要怎麼用,這個東西被誰給激活了,李凱和李飛飛做的,主要操刀是李飛飛做的,ImageNet是一個全球的圖像識別的比賽,在2012年以前都是用常規的方法,2012年開始有一個參賽隊用了這個方法,比別的隊錯誤率馬上降低了一半。到2013年其它方法全部退出,全都是深度學習,2014年不停地改進。所以可以看出2015年的時候錯誤率已經降的非常多,深度學習的網路也非常多。到2016年的時候幾乎做到不光人沒法比,錯誤率已經低到不需要再做了,所以李飛飛選擇2017年宣布這個比賽停止,不再做了,因為其實已經沒有太大促進意義了。

所以今天的第三輪由於深度學習,由於剛才所說的產業界的熱情參與,所以我們產生了很多新的企業,有很多新的機遇,這是非常好的事。

人工智慧的新時代

在這個機遇下國家干點什麼,國家有一個中國人工智慧2.0的發展戰略研究,這是中國工程院一起來搞的,今年發布了一個重大研究計劃。關於這個中國下一代人工智慧,起初是叫AI2.0,後來經過中央高層決定,把它正式名稱叫作中國新一代人工智慧,這裡面主要是做五個關鍵技術和一批應用。

這五個關鍵技術,包括大數據智能,這和前面講的大數據關聯性非常強。第二個方面是群體智能,依靠群體的力量推進智能的研究。第三個是跨媒體智能,要把聲音、圖像、文字、自然語言所有這些東西聯結在一起來研究智能,這是跨媒體智能未來所希望達到的目標。第四個是人機混合增強智能,人和機器混合起來怎麼樣讓智能更高能力更強。第五個是自主智能系統,其實就是無人機,強東總剛才也強調我們在物流方面做無人系統。這五個方面和應用以及下面支撐的關係,我們有五個支柱,上面是應用,下面是基礎支撐。

那麼這樣一個輪廓,實際上就是對整個從國家戰略來說已經進行了非常圓滿的布局,這個是不是夠了?其實還不是。就是如果看整個人工智慧學科的輪廓,包括計算機視覺、語言識別、自然語言、人機交互、機器人學習等等這樣的方向,這些方面目前大的布局是沉浸到應用這個方面。涉及到人的九類智能,是我們在邏輯語言文字和圖形圖像來說現在已經做的相當不錯,中間六類還是有相當的距離需要探索。

總結

歷史總是這樣螺旋前進的,它基本上人工智慧的三次浪潮也是從符號主義到連接主義,到目前還是以連接主義為主的浪潮。這個符號主義到現在為止已經有30多年比較寂寞了,但它作為人類智能的一個高等抽象,它應該是發揮作用的,怎麼發揮作用,這個是未來大家可以慢慢觀察。

連接主義,就是神經元網路、深度學習,目前是非常非常大行其道的,但怎麼樣解決小數據甚至沒有數據的學習?實際還是有相當大的挑戰,特別是很多的學習結果是不可解釋的,這是最大的挑戰。

行為主義是注重自適應和進化,這是從人從猴子演化過來,它可能更接近。它怎麼樣在學習方面做得更好,還是需要探索。

不管是企業、國家投資,大家利用好天時地利要好好乾一場,不管這一輪是20年,我們現在剛剛11年,所以後面還有9年的好日子過,如果是30年還有19年好日子過。所以我想人工智慧肯定至少還有10年到20年左右的好日子過,大家珍惜這個機會。

當然人工智慧既然是一個少年,少年主要的成長靠什麼?靠學習,靠知其所以然的學習的研究,中國下一代人工智慧也會在這個方面進行一些布局,我們就知道今後的方向,也許對在座各位,也許會有點幫助。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT耳朵 的精彩文章:

黃牛被坑買家笑哭 iPhoneX缺貨只是煙霧彈
馬化騰的公開信透露了一個秘密,騰訊今年的開放將從這兩點發力
小米note3之殤,小米能玩好新零售嗎?
融資超5000萬美元的智能耳機公司Doppler Labs宣布倒閉 物聯網整體方案提供商艾拉物聯獲6000萬美元D輪融資

TAG:IT耳朵 |