人工智慧與深度學習的現狀

健康 05-28

專訪院士張鈸，對人工智慧與深度學習的現狀進行了淺談。

人工智慧與深度學習的現狀

圖片來源：全景視覺

在Alphago與韓國圍棋選手李世石對戰獲勝三年過後，一些跡象逐漸顯現，張鈸院士認為到了一個合適的時點，並接受了此次的專訪。

張鈸，計算機科學與技術專家，俄羅斯自然科學院外籍院士、中國科學院院士，清華大學教授、博士生導師，現任清華大學人工智慧研究院院長。

深度學習目前人工智慧最受關注的領域，但並不是人工智慧研究的全部。張鈸認為儘管產業層面還有空間，但目前基於深度學習的人工智慧在技術上已經觸及天花板，此前由這一技術路線帶來的「奇蹟」在Alphago獲勝後未再出現，而且估計未來也很難繼續大量出現。技術改良很難徹底解決目前階段人工智慧的根本性缺陷，而這些缺陷決定了其應用的空間被局限在特定的領域——大部分都集中在圖像識別、語音識別兩方面。

人工智慧與深度學習的現狀

同時，在張鈸看來，目前全世界的企業界和部分學界對於深度學習技術的判斷過於樂觀，人工智慧迫切需要推動到新的階段，而這註定將會是一個漫長的過程，有賴於與數學、腦科學等結合實現底層理論的突破。

作為中國少有的經歷了兩個人工智慧技術階段的研究者，張鈸在過去數年鮮少接受採訪，其中一個原因在於他對目前人工智慧技術發展現狀的估計持有部分不同看法，在時機未到之時，張鈸謹慎地認為這些看法並不方便通過大眾媒體進行傳播，即使傳播也很難獲得認同。

「現在很多方面大家看得比較清楚，已露出苗頭來了，我現在也接觸到很多企業，找我談這個問題，說明企業在第一線已經發現了很多問題，就想找個機會稍微說說。」張鈸對記者表示。

一、「奇蹟並沒有發生，按照我的估計，也不會繼續大量發生」

人工智慧在最近三年時間中受到的關注很大程度來自於其在圍棋領域超越人類的「奇蹟」，人工智慧一次又一次的證明了人類「圍棋智慧」優越的脆弱性。

容易被忽略的是，儘管圍棋複雜多變，但是與牌類遊戲相較，圍棋的規則簡單，信息完全且確定這恰恰是目前階段人工智慧所擅長的。

在張鈸看來，儘管此前數年，人工智慧在語音識別、圖像識別、圍棋三個領域顯現了「奇蹟」，但此後，這個「奇蹟」再未在其他領域出現，其技術應用的邊界和條件已經逐漸清晰。

記者：您是如何估計和評價目前人工智慧發展的現狀？

張鈸：這一輪人工智慧熱潮是本世紀初興起的。首先是出現在學術界。學術界過去對人工智慧是冷遇的，但是多層神經網路的出現帶來了一些改變，神經網路的理論在上世紀50年代就有了，但是一直處於淺層的應用狀態，人們沒有想到多層會帶來什麼新的變化。

真正引起大家注意的就是2012年斯坦福的實驗（註：2012年谷歌和斯坦福利用多層神經網路和大量數據進行圖像識別的實驗），過去實驗的圖像樣本數最多是「萬」這個級別，斯坦福用了1000萬，用多層神經網路來做，結果發現在人臉、人體、貓臉三個圖像類別中，這個模型的識別率大概有7%-10%的提高。

這給大家非常大的震動，因為通常識別率要提高1%要做好多努力，現在只是把層數增加了，竟然發生兩大變化，一個是識別率提高這麼多；第二個是能處理這麼大數據。這兩個變化給大家非常大的鼓舞，何況在2012年之前，人工智慧沒有解決過實際問題。

記者：這種突破的原因是什麼？

張鈸：現在分析下來是三個原因，大家也都非常清楚了，一個大數據、一個是計算能力、一個是演算法。認識到之後，一夜之間業內業外對深度學習都非常震動，然後就發生了三件歷史性的事件。

第一件事是2015年12月，微軟通過152層的深度網路，將圖像識別錯誤率降至3.57%，低於人類的誤識率5.1%；第二件事，2016年微軟做的語音識別，其詞錯率5.9%，和專業速記員水平一樣；第三件事：Alphago打敗韓國圍棋選手李世石。

通過人工智慧，利用深度學習、大數據這兩個工具，在一定條件下、一定領域內竟然能夠超過人類，這三件事情給大家極大的鼓舞。

特別是對於業外的人，都認為我只要掌握了大數據，利用深度學習說不定還能搞出奇蹟來，於是大家做了很多很多預測，比如在多短時間內計算機會在什麼事情上能超過人。

但實際上，在這個之後，奇蹟並沒有發生，按照我的估計，今後也不會大量發生。準確一點說，今後或許會在個別領域取得進展，但是不會像之前預計的那樣全面開花。

特別是中國市場樂觀的認為「中國市場大、數據多，運用又不受限制，所以將來奇蹟一定會發生在中國」。

結果很多企業在做的時候發現，不是那麼回事。從目前的情況來看效果最好的事情還是這兩件：圖像識別、語音識別。我看了一下，中國人工智慧領域20個獨角獸30個准獨角獸企業，近80%都跟圖像識別或者語音識別有關係。

記者：為什麼會出現這樣的情況？或者說在這麼長時間後，我們對人工智慧目前能做什麼有一個清晰的認識了嗎？

張鈸：人工智慧在圍棋上戰勝人類後產生了這種恐慌，「大師才能做的事，人工智慧居然能做，我的工作這麼平凡，肯定會被機器所替代」。這裡需要考慮一下它的局限性，我一直在各種各樣的會上談到不要過於樂觀。

人工智慧能做的那三件事（語音識別、圖像識別、圍棋）是因為它滿足了五個條件，就是說只要滿足了這五個條件，計算機就能做好，只要有任何一個或者多個條件不滿足，計算機做起來就困難了。

第一個是必須具備充足的數據，充足不僅僅是說數量大，還要多樣性，不能殘缺等。
第二個是確定性。
第三個是最重要的，需要完全的信息，圍棋就是完全信息博弈，牌類是不完全信息博弈，圍棋雖然複雜，但本質上只需要計算速度快，不要靠什麼智能，可是在日常生活中，我們所有的決策都是在不完全信息下做的。
第四個是靜態，包括按確定性的規律演化，就是可預測性問題，在複雜路況下的自動駕駛就不滿足這一條；實際上它既不滿足確定性，也不滿足完全信息。
第五個就是特定領域，如果領域太寬他做不了。單任務，即下棋的人工智慧軟體就是下棋，做不了別的。

記者：就是說在滿足這五個條件的前提下，目前的人工智慧是勝任部分工作的？

張鈸：如果你的工作符合這五個條件，絕對會被計算機替代，符合這五個條件的工作特點很明顯，就是四個字「照章辦事」，不需要靈活性，比如出納員、收銀員。如果你的工作富有靈活性和創造性，計算機絕對不可能完全代替，當然部分代替是可能的，因為其中肯定也有一些簡單和重複性的內容。如果認識到這一條就會認識到人工智慧仍處於發展階段的初期。不是像有些人估計的那樣「人工智慧技術已經完全成熟，而進入發展應用的階段」。

二、「深度學習技術，從應用角度已經接近天花板了」

人工智慧在本世紀第二個十年的活躍得益於深度學習領域的突破，深度學習搭建在神經網路之上，而神經網路的概念則脫胎於上世紀50年代科研人員對人類腦神經系統的研究和模擬。

近三十年來數學領域，特別是概率統計理論的突破為多層神經網路的落地提供了基礎——它們為多層神經網路和海量數據處理提供了有效的數學工具，但與此同時，「黑盒」學習法也成為深度學習的缺陷之一：即使人工智慧能給出正確的選擇，但是人們卻並不知道它根據什麼給出這個答案，人們無法像理解彼此一樣去理解這個新的智能。

圖靈獎得主朱迪亞·珀爾指出：儘管深度學習演算法具有大腦的靈感，但它們也可以算作另一種強大的數據分析工具，是「曲線的擬合」。諾貝爾經濟學獎得主托馬斯·薩金特則認為人工智慧其實就是統計學。

那麼，人們是否需要機器給一個解釋呢？

記者：我們應該怎麼去定義目前的深度學習技術路線，它是基於概率學的一個事物嗎？

張鈸：現在的深度學習本質是基於概率統計，什麼叫做概率統計？沒有那麼玄，深度學習是尋找那些重複出現的模式，因此重複多了就被認為是規律（真理），因此謊言重複一千遍就被認為真理，所以為什麼大數據有時會做出非常荒唐的結果，因為不管對不對，只要重複多了它就會按照這個規律走，就是誰說多了就是誰。

我常常講我們現在還沒有進入人工智慧的核心問題，其實人工智慧的核心是知識表示、不確定性推理這些，因為人類智慧的源泉在哪？在知識、經驗、推理能力，這是人類理性的根本。現在形成的人工智慧系統都非常脆弱容易受攻擊或者欺騙，需要大量的數據，而且不可解釋，存在非常嚴重的缺陷，這個缺陷是本質的，由其方法本身引起的。

記者：就是說通過改良的方式無法徹底解決？比如我們再增加神經網路層數和複雜性或者再提升數據的量級，會解決它的缺陷嗎？

張鈸：改良是不行的，深度學習的本質就是利用沒有加工處理過的數據用概率學習的「黑箱」處理方法來尋找它的規律，這個方法本身通常無法找到「有意義」的規律，它只能找到重複出現的模式，也就是說，你光靠數據，是無法達到真正的智能。

此外，深度學習只是目前人工智慧技術的一部分，人工智慧還有更大更寬的領域需要去研究，知識表示、不確定性處理、人機交互，等等一大片地方，不能說深度學習就是人工智慧，深度學習只是人工智慧的一部分。一直到去年人工智慧大會交流的論文還是三分之一是機器學習方面，三分之二是其他方面。

經濟觀察報：學界在這上面還是有一個比較清晰的認識？

張鈸：我可以這麼說，全世界的學界大多數有清晰的認識；全世界的企業界大多持過於樂觀的估計。

為什麼出現這樣的情況呢？因為從事過早期人工智慧研究的人，大多已經故去或者年老，已經沒有話語權。現在活躍在人工智慧研究第一線的都是深度學習、大數據興起以後加入的，他們對人工智慧的了解不夠全面。

記者：如果說每一個技術路線都有一個「技術潛力」，那麼在深度學習方面，我們已經把這個潛力用了多少？

張鈸：科學研究是很難精確估計的，但是深度學習如果從應用角度，不去改變它，我覺得已經接近天花板了，就是說你要想再出現奇蹟的可能性比較小了。

記者：那基於此，目前商業公司在底層技術和產業應用上還是有很大的空間嗎？

張鈸：只要選好合適的應用場景，利用成熟的人工智慧技術去做應用，還有較大的空間。目前在學術界圍繞克服深度學習存在的問題，正展開深入的研究工作，希望企業界，特別是中小企業要密切注視研究工作的進展，及時地將新技術應用到自己的產品中。當然像谷歌、BAT這樣規模的企業，他們都會去從事相關的研究工作，他們會把研究、開發與應用結合起來。

記者：有一種觀點認為我們強調的「白盒」（可理解性）它實際上是從人的思維來強調的，但是通過大數據、概率統計工具離散到連續的投射，它實際上是機器的思維，你不一定需要它給你一個解釋，只要正確的答案就可以了？

張鈸：目前有兩種意見，一種觀點認為智能化的道路是多條的，不是只有一條路能通向智能，我們通過自然進化產生了自然智能，那麼我們為什麼不能通過機器產生機器智能？這個智能和自然智能不會是完全一樣的，條條大路通羅馬，我們通過自然進化獲得的智能也不見得是最佳的。這個觀點我贊成，機器智能與人類不相同，其實是有好處的，恰恰可以互補，發揮各自的長處。

但是從長遠來看，必須得走人類智能這條路，為什麼？因為我們最終是要發展人機協同，人類和機器和諧共處的世界。我們不是說將來什麼事情都讓機器去管去做，人類在一邊享受。我們要走人機共生這條路，這樣機器的智能就必須和人類一樣，不然沒法共處，機器做出來的事情，我們不能理解，我們的意圖機器也不知道，二者怎麼能合作？

記者：就是必須具有可解釋性？

張鈸：是，就是可解釋性，你要它做決策，你不理解它，飛機就讓它開，誰敢坐這架飛機？所以目前的階段，車和飛機還是不能完全讓機器開的。為什麼司機坐在上面我們放心？因為我們和他同命運，要撞死一塊撞死，機器和你可不是同一命運，它撞不死，你撞死了。

有的人非常脫離實際的去想這個問題，這是不對頭的，人類怎麼會去那樣發展機器呢（註：指把人類的命運全部交給機器）？人類不會去那麼發展的，有些人在那邊擔憂什麼機器人統治人類，我說這最多只能算遠慮。

記者：所以圖靈的論文中也說這種觀點「不值一駁」。

張鈸：是，那是遠慮，我們目前還有很多近憂，發展人工智慧必須要考慮安全問題，這已是現實問題。

你看語音合成，利用現有的技術可以做到以假亂真，和真人基本沒有差別。現在看來這種技術不能推廣應用，因為一旦推廣就全亂套了，只要搞一段用語音合成技術做成的假錄音，就可以讓任何一位名人身敗名裂。這些都是非常危險的技術。人工智慧的治理已經提到日程上了。

三、「我們培養不出愛因斯坦、培養不出圖靈」

人工智慧在中國市場的快速商業化吸引了各類科研人員投身於此，在論文發表量和平均引用量兩個指標上中國研究者表現出了競爭力，一種樂觀的觀點是「中國人工智慧研究已經可以和美國並列」。

對此，張鈸院士則謹慎地認為儘管在工程、產業化層面的某些方面中國人工智慧已經接近世界水平，但在技術創新上，中國與世界水平差距還很大，實際上，至今為止幾乎所有的人工智慧原創研究成果都來自於美國。

作為中國人工智慧科研的領軍機構，清華大學也正在嘗試改善這一情況，5月18日成立的清華大學「人工智慧學堂班」（以下簡稱「智班」）是其中的一個舉措。智班旨在培養人工智慧領域領跑國際的拔尖科研創新人才，為未來一二十年的人工智慧技術發展儲備中國尖端人才，智班將從2019年秋季開始招收招本科生，首批預計招收30人，圖靈獎得主、清華大學交叉信息院院長姚期智院士將擔綱智班首席教授。

「我們清華開辦一個人工智慧班就是基於這個原理。中國在幾十年前曾經喪失了一些和國際上同時起步的時機，我想我們現在有一個非常好的機會，在以後十年二十年人工智慧會改變這個世界的時候，我們應該在這個時候跟別人同時起步甚至比別人更先走一步，好好培養我們的人才，從事我們的研究」姚期智表示。

清華大學副校長、教務長楊斌教授招生信息交流會的開場演講中，拆解「人工智慧」四字中所蘊含著的清華大學人才培養理念。他圍繞「人」闡述了清華大學的「三位一體」教育理念、成人成才成群、人在才先、為國育士等；圍繞「工」描述了清華人以此為生、精於此道、樂此不疲的工匠精神、追求做第一等事業的境界追求；圍繞「智」解讀了跳出「能衡量才發展」的怪圈、重視教育價值自在的清華思考；圍繞「能」刻畫了一代代清華人勇於擔當、積極貢獻的主人翁立場以及靠譜肯干、讓人信賴的風格特質。

記者：一種觀點認為中國有更多的數據和更多的工程師，這種規模能倒推帶來基礎研究層面的突破或者決定技術的路線？

張鈸：這裡混淆了好多概念，科學、技術、工程。科技水平需要三個標準來衡量，一個是科研水平、一個是技術水平、一個是工程實踐能力，或者產業化能力。

我們中國什麼情況？從工程角度來看，在一些領域我們「接近世界水平」；技術水平我用的詞是「較大差距」，因為不少東西還是外國會做我們不會做；科研究領域我用的詞是「很大差距」，科學研究就是原創，實際上，所有人工智慧領域的原創成果都是美國人做出來的，人工智慧領域圖靈獎得主共十一人，十個美國人，一個加拿大人。

記者：數據顯示中國在人工智慧領域的論文發表量和被引用次數都已經進入前列位置，這是否說明中國人工智慧科學研究領域的突破？

張鈸：如果單從論文來看研究水平，基本反映在三個指標上：數量、平均引用率、單篇最高引用率。拿人工智慧來講，中國研究者論文的數量和平均引用率都還不錯，但是單篇最高引用率和世界差距就很大，而這個指標恰恰是反映你的原創能力。

也就是說深度學習這個領域，我們的平均水平達到世界水平了，但是最高水平和世界差距還是很大的。不過還是要肯定的，我們應用上發展比較快。

記者：清華在這方面有什麼優勢嗎？

張鈸：在人工智慧重要的會議雜誌上，這十年期間論文數量、平均質量CMU（美國卡耐基梅隆大學）排第一，清華大學排第二。我們培養的人，在計算機這個領域，清華的本科、博士生都是世界一流的。

目前我們的跟蹤能力是比較強的，一旦有人起個頭，我們能迅速跟上去。但是很可惜，我們缺乏頂尖人物，也培養不出頂尖的人才，如愛因斯坦、圖靈等。

我個人認為原因之一，可能與中國的文化有點關係，我們的從眾心理很嚴重，比如在人工智慧領域，深度學習很熱，發表的論文作者中幾乎70%是華人，但是其他非熱門領域，包括不確定性推理、知識表示等幾乎沒有華人作者。這就是從眾扎堆，不願意去探索「無人區」。

當然也不要著急，科學研究本來就是富人乾的事情，是富國乾的事情，我們還是發展中國家，科學研究起點比較低，暫時落後是難免的，我們會迎頭趕上。

四、「低潮會發生，但不會像過去那樣」

既有的深度學習技術到達它的頂點，好像難以發展了。但這不等於說我們不可以在它的基礎上，向新的方向發展，走出一條新的發展道路。實際上，這項研究正在進行中。

張鈸院士正在提倡第三代人工智慧，按照目前的設想，新的技術路線應該要解決目前存在的不可理解性，脆弱性等缺陷，而這些可能還需要計算機科學與數學和腦科學的結合與突破。

在上世紀，人工智慧技術也曾經因為技術方向「碰壁」而經歷過漫長的低潮期，未來我們還將再經歷一次這樣的過程嗎？

記者：如果說深度學習已進天花板，那麼人工智慧未來的前進方向將會在哪？

張鈸：最近我們準備提出一個新的概念，就是第三代人工智慧的概念，人工智慧實際上經歷過兩代，第一代就是符號推理，第二代就是目前的概率學習（或深度學習），我們認為現在正在進入人工智慧的第三代。原因很明顯，第一代、第二代都有很大的局限性。

記者：你所說的第三代人工智慧技術是有明確的實現方向或者特點嗎？

張鈸：我們現在提出的是要建立可解釋、魯棒性（註：可以理解為穩健性）的人工智慧理論和方法，發展安全、可靠和可信的人工智慧技術。

記者：這樣的技術可能要等很久？

張鈸：是啊，很難預計，我們也很著急。

記者：是不是還得回歸到數學等理論層面里再去找新的方法？

張鈸：這個目前我們有兩條路，一個是和數學結合，一個是和腦科學結合。你想想如果沒有新的數學工具，沒有來自於腦科學啟發下的新思路，哪來的新理論？另一方面是要把數據驅動和知識驅動結合起來，因為通過數學、腦科學上尋求突破是比較艱難的，前面這件事現在則完全能夠做。

記者：這個結合是指之前幾十年人工智慧的經驗統合到一塊？

張鈸：是的，至少有一個方向就是要把第一代和第二代結合，利用各自的優勢。但是這兩個結合很困難，因為他們在不同空間中操作，一個是向量空間，一個是符號空間，也需要有新的數學工具的加入。

記者：看人工智慧歷史，每一代技術之間有很長的間隔期，第三代人工智慧技術也會這樣嗎？

張鈸：我認為會更長，因為需要攻堅，因為遇到的問題更困難。

記者：會不會再過10年、20年，人工智慧在學界或者公眾心中，又變成一個「隱學」，就像70、80年代那樣，大眾又不會再經常提起來這個詞？

張鈸：低潮會發生，但不會像過去那樣，原因在哪？因為有大數據、互聯網和強大的計算資源，這些都會支撐人工智慧繼續走下去，儘管有的時候還只是表面上的繁榮。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 顧建文教授醫學科普 的精彩文章:

※兒童聰明靠聊天
※加州打造「機器人醫院」成為百姓就醫服新亮點

TAG:顧建文教授醫學科普 |