一個北大教授眼中的人工智慧

科技 06-04

AlphaGo再戰柯潔，AI繼續成為國內外熱議的話題，當下AI近乎顯學，路人皆知，「名人輩出」。這種情況下，我們也希望能夠「回歸學界」，與學術界的科研人員聊一下大家關心的AI話題，希望獲得一些新的認知收穫。

近期，我們拜訪了北大林作銓教授。他現為北大數學學院信息科學系一級教授，曾任信息科學系系主任。林教授從事AI研究30年，連續講授AI課近20年，帶博士研究生做AI問題的研究，見證了人工智慧60年歷史的後半程。

林教授表示願意從教學角度去做這次分享討論，因為從教學上老師需要了解不同研究和應用的最新進展，不會受自己研究偏好的影響，能更好講授知識。

以下為關於此次分享的整理。

如何看待AlphaGo與柯潔對戰的結果？

戰前大家已普遍預測AlphaGo會戰勝柯潔。在圍棋上，一旦機器取勝，這個人機大戰遊戲也就結束了，就象當年的國際象棋一樣。我想可簡單說一下這個道理。

圍棋是完美信息的博弈，即對弈雙方都看得見棋盤和走子變化。計算機圍棋的基礎演算法是搜索，模擬人下棋的過程，如果將下棋的每一步看做搜索的一個決策點，搜索過程形成一顆樹，樹展開每個可能的走子，從中尋找最佳的走法，獲取使對方不利己方有利的勝算。

這樣搜索的空間是很龐大的，尋找最佳走法所需花的時間是很長的，比如，即使把全世界的計算機都拿來算一萬年也不可能窮盡整個搜索空間，換句話說，不管有多大的計算能力都不能窮盡搜索空間，這是所謂的難解問題。如果搜索樹很小，比如五子棋，可在很短時間內考慮到所有的情況，這樣對弈雙方都能找到最佳走法，不管是人還是機器原則上雙方都會和棋了。因此，搜索演算法研究的關鍵就是要想辦法減少搜索空間，通過啟發式方法來把搜索樹中一些不值得考慮的分枝剪掉，人下棋所謂靠直覺或經驗，實質上也是收縮搜索空間，因為人下棋有一些章法或定式使得我們可以較快下手，不會走明顯的無用的俗手，這就是所謂的剪枝法，AI最初取得的重大突破之一。

既然不能窮盡搜索，剪枝有可能會剪錯了，這是一種近似優化的方法，就可應用概率模型，在每一個決策點尋找下一個節點時，把它變為一個隨機模擬的過程，如果模擬得到最大期望效用的話就用這個決策點的走子，否則就剪枝，這就是蒙特卡羅樹搜索演算法，這時，計算機圍棋可以達到業餘棋手的水平，但離職業棋手水平還有一段距離，普遍估計還得10年。

AlphaGo取得了重大突破，把下圍棋走子過程看成識別問題，每下一子棋盤的變化容易被識別，這樣就可以用深度學習方法，簡單點說，AlphaGo中所謂的價值網路和決策網路是用強化深度學習把搜索空間大大地減少，減少到用合理的計算資源可在較短時間找到最優的搜索樹的路徑，相當於該考慮的決策點都考慮到了，下一步棋先看了幾十步棋，不嚴格地說，近似窮盡了整個搜索空間，演算法就「幾乎」不出錯，或出錯的概率遠比人小，人經常會下惡手，這時候人就再也下不過機器了。

如果有人想繼續研究計算機圍棋，必須尋找比AlphaGo更好的演算法才有意義，若只是重複AlphaGo的演算法，即使性能提高了，這種做法基本上是浪費資源，不如做計算機輔助的圍棋教學。

人機大戰是想挑戰人類下圍棋這種智能水平，從而想表明機器具有這種智能水平。柯潔若想贏，一種可能的方式應該和AlphaGo研發人員合作，他們知道程序的缺陷可能在哪裡，柯潔與他們一起研究戰勝機器的策略，這反過來挑戰AlphaGo，對AI的發展有幫助。但估計也比較難有結果，因為深度學習不能「理解」下棋的過程，所訓練出來的神經網路參數也不能解釋。

AlphaGo戰勝柯潔沒關係，AI中還有很多這種戰勝人類的比賽，只是圍棋是一種中國文化，由於搜索空間最大難度也是棋類遊戲中最難的，大家比較關注，但大家很快會習以為常，20年前國際象棋的人機大戰就是這樣。可以預想，今後所有遊戲比賽AI都可能戰勝人類，這就涉及到了人類與機器如何共處，大家該下棋打牌照樣如常。

AI研究選擇類似圍棋和定理證明這些代表人類智能活動的領域進行研究，其本意是想找到能解決廣泛一類問題的通用智能原理，如搜索的剪枝演算法就是一個智能的基本原理，它能解決廣泛一類問題，而不只是下棋。AlphaGo對深度學習中的無監督學習有很大的貢獻，但想發展成通用AI技術很難，除非深度學習就能發展成通用AI，取代AI中其它研究，但這在我看來是不可能的。

什麼樣的人工智慧才算是具有智能？

這背後關係到對智能的定義，人類的智能是無法精確定義的。AI依賴於計算模型，如圖靈機這些計算模型給出了計算的數學定義，但找不到定義智能的模型。智能是一個直觀、主觀的概念，從圖靈測試提出開始，AI研究者希望通過計算機模擬人類的智能，找到智能的基本原理，就像當年模仿鳥飛行製造出飛機，找到空氣動力學等原理，用空氣動力學反過來可解釋鳥的飛行，潛水艇模仿魚兒，都是這個道理。因此，AI研究肇始就選擇如下棋等比較典型反映人類智能水平的領域進行研究，並希望通過比賽戰勝人類，希望尋找到某種通用智能的機制，時至今日，如AlphaGo還只能表明在下棋方面找到某種方法，AlphaGo演算法可容易複製到如中國象棋這類完美信息的遊戲，但想推廣到更廣泛一類問題的解決就是新的研究問題了，比如推廣來打麻將或橋牌。

AI想達到的智能就是人類級別的智能。那麼到底什麼是人類級別的智能？問題在於人的智能是一個相對的概念，計算器比小孩做算術做得快，也可以說有智能，那並不是人類共同體的智能，AlphaGo戰勝人類，肯定是有智能的，但AlphaGo不能做其它，比如不能證明定理。

早在50年前，學術界就討論這個問題，並提出了 AI需要更高的標準來衡量智能。30年前AI已將很多問題思考透徹了，知道了AI的難度很大，很多地方難於突破。首先，象人類一樣，AI需要擁有知識，並運用知識去解決問題，知識體現智能。AI研究中，除了目前的深度學習，還有一些通過自動控制做的機器人之外，AI的主體都是基於知識的系統。AI實踐表明，精確的專門的知識能夠處理，但人的常識難於處理，人類並沒有將全部常識寫出來，人們在交談時也不需要把常識都說出來，否則言語行為將無從進行，常識通常是只可意會不可言傳的。AI學者普遍認為，應以常識作為衡量AI是否達到人類級別的智能水平的標準。

深度學習帶來了一定的進步，可以解決很多識別問題，如語音、圖像和對象的識別，這些是對外界環境的感知方面的常識，還有更多的常識問題，如有關人的心智狀態的推理，就不是深度學習所能解決的。

AI追求通用智能，所謂的強AI，但還停留在專用智能上面，能做到類似AlphaGo能下圍棋，所謂的弱AI，從應用看，弱AI已經很成功很有價值了。相對來說，只是簡單地應用某項AI技術，不能看成AI，如果是能在某方面達到了人類級別的智能程度就可以看成AI。

如何評估深度學習的優勢與局限？

深度學習適於解決識別問題，如語音和語言文本，圖像和對象等，只要能把某類問題看成識別，如AlphaGo識別棋盤，一些AI醫療系統通過識別人的皮膚變化和醫療圖像診斷疾病，具有廣泛的應用前景。但是，深度學習並不能拿來解決所有的AI問題，比如，AlphaGo演算法不能發展來證明定理。

有人以為，靠深度學習單一演算法，有可能解決AI的所有問題，做到通用AI，其實不切實際。歷史上，每一個AI演算法做得好的時候，都有人想將其變成單一的通用演算法，但很快都失敗了。這種情況在哲學中的各種單一論已屢見不鮮了。

深度學習是人工神經網路研究的第三次高潮，從2006年算起已經發展了十年。有高潮就有低潮，前兩次人工神經網路的低潮都是被證明了它的局限性。深度學習的優點很突出，它以一種表徵學習的方法，通過在神經網路中逐層加深，以識別從低級到高級的特徵，自動抽取特徵，這種識別問題以前應用數學和傳統的模式識別也在做，但抽取特徵需要人工的幫助，以語音和文本識別為例，深度學習比傳統方法，包括應用數學和統計學習都做得好，把識別準確率提高一個數量級，如從85%提高到95%，這種進步是很大的。以應用數學一些方法來比，數學方法雖然更優雅，可畢竟是要解決同樣的問題，既然比不夠深度學習，那就是問題了。現在深度學習框架已搭到一千多層，實際應用經驗驗證確實是層次越深效果越好，從理論上，也可證明深度是有意義的。

深度學習也有局限性。首先，深度學習是對神經網路的權重參數進行優化，用數學表示為損失函數，簡單地說就是減少誤差，誤差減少是有極限的，換句話說，到一定深度就沒有意義了，這時它所能解決問題的局限會表現出來，因此，暴力地一味加多層次的蠻幹並不見得是好辦法。

其次，在實際應用中，以語音識別為例，即使做到99.99%的準確率也不見得可比擬人，我們聽一個有口音的人講普通話識準確率不高，有些聽不懂的地方，但不影響我們交流，因為人在聽時是有理解的，而深度學習對神經網路的參數不能解釋，因此就不能理解，這是為什麼深度學習對語音識別的準確率超過人類，像手機想用語音去取代觸摸屏輸入還是做不到。

再者，深度學習現在做成熟的主要是監督學習，用大數據集做演算法的訓練來優化參數，有現成的數學方法來建立相應的模型，如卷積函數對應卷積神經網路，進一步發展的無監督學習更有用，但所需優化的非線性函數在數學上同樣是問題，如果數學上沒有找到所需的函數形式，這需要有所突破，這種突破從數學上也是很重大的，現在無監督深度學習只能應用一般的強化學習方法，如AlphaGo所做的應該就是這樣子。

最後，深度學習不等於機器學習，機器學習只是AI的一個方面，深度學習之外的AI技術沒有一項是深度學習能做的，如推理這種反映人類高級智能的能力，深度學習做不了最基本的數學中的演繹推理。

如何評價深度學習以外的研究方向？

由於深度學習的火熱似乎AI的其它研究方向顯得不重要了，其實不然。AI是屬於計算機科學的一個分支，旨在用計算機模擬人的智能，希望找出人的智能原理，並把計算機做得具有智能，讓人使用更方便。

以深度學習為代表的AI研究某種意義上已偏離了AI的方向，一來，深度神經網路本來想借鑒神經科學中對大腦神經網路的了解來建立模擬網路，但花樣百出的人工神經網路已跟大腦神經網路不相干；二來，通過人工神經網路模擬智能，想促進對大腦神經網路原理的認識，也無從談起了。學習是人類智能的基本特點之一，學習很複雜，基本上有兩種形式，一種是象嬰兒學習，沒有先驗知識，從觀察示例開始，這方面可以說深度學習模擬得最好；另一種，人成長過程，更多的是基於知識的學習，有其它機器學習方法就是研究知識中的學習，這是深度學習做不了的，因為深度學習不能運用知識。

深度學習之外的AI研究方向很多，舉個例子，知識圖譜是深度學習外的另一個時下熱門。谷歌收購了Freebase後提出知識圖譜名稱，並不是新東西，微軟稱為概念圖譜，都是要建造本體庫，也就是一種知識庫，可應用到各種知識系統，例如，在Web搜索中可通過知識圖譜理解一些網頁的知識，建立一些知識卡片，使得搜索引擎更加智能化。這是下一代Web的目標，W3C組織早在近20年前就提出語義Web作為下一代Web，並提出現在知識圖譜常用的RDF等本體表示語言和標準。再往前看，語義Web和知識圖譜想解決的語義網路早再30年前AI就研究清楚了，甚至再過幾年知識圖譜仍達不到當時AI理論上已搞清楚的能力。學術研究總是超前的，知識圖譜可看成AI這方面研究開始落地生根了。知識圖譜應用範圍和影響力將不比深度學習差，也能改進機器學習方法。

AI還有一個當下的熱點，就是會話式AI系統。自從蘋果iPhone Siri以來，到現在以亞馬遜Echo／Alex音箱為代表的所謂智能音箱，會話式AI具有廣泛的應用場景，很多企業都湧入這個領域。會話式AI其實很難的，屬於自然語言理解領域，幾十年來對自然語言理解研究進展不大，因此AI主要進行各種語音和文本語言處理，前段時間主要採用概率統計的方法，現在深度學習不僅在語音識別上獲得成功，也開始用到文本信息處理，如機器翻譯，用深度學習比用統計學習效果要好。

關於自然語言理解，有理論派和經驗派之爭。理論派以喬姆斯基提出的文法理論為代表，機器學習就是經驗派的代表，50年前就發現用機器學習根本學不出一些基本的語法，更別說更複雜的語義和語用，因此理論派甚至認為，人一出生大腦就對語言有某種天然的結構能理解語言，後天才能很自然地學習並運用自然語言，AI學者堅持認為通過軟體可以逐步理解自然語言。40年前，蒙塔格（Richard Montague）企圖形式化英語，若自然語言（如英語）能被形式化，就可轉化為形式語言，可作為類似程序語言來使用，雖然蒙塔格達不到目的，由此以來，在自然語言理解方面積累了很多深奧的理論，這些理論遠比現有的各種自然語言處理系統理解得深遠，但還未能被應用。

自然語言理解幾乎包含了AI研究各方面的內容，可以說，如果自然語言理解問題解決了，AI問題也就解決了，用自然語言進行達到人類程度的人機交互是個夢想，還很遙遠。

回過頭來說深度學習，現在監督深度學習技術已經比較成熟，有很多開源的開發平台，甚至設計專用晶元從硬體上直接提高計算性能。AI發展中一些相對成熟的技術，未能帶來對AI的進一步發展，就會歸入計算機科學其它分支，現在做深度學習大多是技術的應用，做出來的水平也差不多，已有這種趨向。

人工智慧的學術研究未來比較有可能在哪個方向有突破？

AI各個研究方向都在繼續發展，我常跟學生說，任何研究領域都時熱時冷，AI由於其研究智能這個問題的特殊性命運更是大起大落，看潮起潮落，AI研究者要保持恆溫。

若要我挑一個下一步AI學術研究方向，我想很可能是：「邏輯+概率+神經元」。

先講下邏輯，按教科書的定義，邏輯學是研究人的思維，換言之，邏輯是研究智能的，可看成人類兩千多年來對智能研究的學科，直至上世紀初，發展到數理邏輯，邏輯成為數學基礎，已偏離了原始目標，邏輯進一步發展成為計算機科學基礎，也自然成為AI的基礎，因為數理邏輯仍是至今最好的工具來表示知識，AI邏輯進一步發展從數學中走出來回到邏輯的原始目標，解決思維即智能的問題。邏輯在AI研究的作用主要體現在模擬人類擁有知識，並運用知識去解決問題，這方面研究是AI中的知識表示，命題邏輯表達能力不夠，一階邏輯具有強大的表達能力，但不能表達常識，也難於實現。深度學習之前上一個AI研究熱點就是擴展一階邏輯來解決常識推理問題。邏輯在AI中有很多應用，如邏輯程序設計語言Prolog，只是大眾不知道而已，再之前，AI邏輯中的歸結方法能做定理機器證明，這在當時引起的轟動不下於阿爾法圍棋，因為數學定理證明也是一個體現高級智能行為的領域，數學定理所代表的這部分知識可稱為理性知識，也是AI要面對的，以深度學習為代表的機器學習方法對這種理性知識或定理證明顯然無能為力了。

接下來簡單點講概率。概率論是古老的數學工具，AI實踐表明，概率仍然是處理不確定知識最好的工具，AI發展的概率圖模型有很多應用。實際上，很多應用領域缺乏工具時，都可用概率統計來解決問題。概率從基礎上看是從公理出發來定義的，跟邏輯有關，但概率只能表達相當於命題邏輯的知識，不能表達一階邏輯的句子，「邏輯+概率」已有一些研究結果，如一階概率邏輯和統計關係學習，可把邏輯和概率的能力互補。

最後講神經元。1943年McColluch和Pitts發表神經元的數學模型的論文，主要就是要證明神經元組成的網路具有命題邏輯的表達能力。1951年數理邏輯學家Kleene基於神經元模型，發展出正則表達式和有限自動機，並證明了其等價性，因此人工神經網路由於等價於有限自動機可作為一種計算模型，象正則表達式在程序語言和自然語言處理中隨處可見，深度學慣用來進行如機器翻譯這種文本處理是有理論根源的。從根本上說，神經網路並不完全是所謂的連接主義方法，並不與邏輯和概率所代表的符號主義截然分開。1969年Minsky和Papert證明了人工神經網路連命題邏輯中「異或」這種表達式都表達不了，這刺破了神經網路的泡沫，導致神經網路研究的第一次低潮。從另一方面看，深度學習所代表的神經網路能很好地解決識別問題，比如語音識別，對於這種識別問題邏輯是毫無用武之處的，只有經過深度神經網路學習獲得並變成知識才能進一步用邏輯來做推理。深度學習仍有許多處理不了的問題，甚至還沒有命題邏輯的表達能力，這些問題現有最好的方法仍是用各種概率模型，而一些深度神經網路早就結合了概率模型。深度學習本質上是歸納學習，歸納學習哲學上稱為歸納推理，從邏輯上把歸納學習看成歸納推理，可在學習過程中用到知識。

總之，從技術上，邏輯如知識圖譜為代表的工作表現為圖形式，概率已有各種圖模型，深度神經網路也是圖模型並與一些概率圖模型很密切的關係，假設能以圖模型把三者結合在同一框架中，那是很了不起的工作，可獲得現在AI所能看到的最好的結果。當然，「邏輯+概率+神經元」不是簡單的集成，那是沒有學術意義的，需要新的突破。不僅學術研究，現在AI學術界與工業界有緊密的互動，這種新方向的研究成果也有可能從一些公司中產生。

說到這裡，這個研究方向有我的個人偏好，不一定是正確的方向，只是我感興趣的問題。

人工智慧在企業中應用，對智能產品和企業智能化發展有什麼看法？

這個問題涉及太多，不是短時間能說清楚的，簡要聊聊。AI在企業中應用，有一個商業模式問題。現在很多AI初創公司都趕深度學習這趟車，如語音人臉識別等等，所用技術都一樣，性能差不多，顯然這些公司大多數終將倒閉。基於AI的商業模式設計比較難把握，要能把AI技術貫穿到整個商業活動中，看到盈利可行性。例如，汽車出行模式就較好用到AI技術，而共享單車模式顯得簡單粗暴，不如十幾年前有過的能夠基於AI技術的分時資源共享系統。

更多企業應用AI到產品，智能產品模式是由iPhone為標誌，是一個革命性的工業產品，普遍接受相對於以黑莓為代表的功能手機，iPhone稱得上智能手機。原來預測，下一個代表性的智能產品可能是智能電視，但現在市場上的所謂智能電視都不是真正的智能電視。家電市場幾十年來經過充分的市場競爭，為了尋找賣點佔有市場一直是很新潮的，從20年前的信息家電到現在的互聯網／物聯網家電，無所不用其新，但現在的電視機是智能電視嗎？顯然不是，只是能上互聯網，把智能手機的做法幾乎照搬到電視機上，電視機企業並不清楚作為一種電視服務如何設計智能電視產品模式，不清楚客廳人機交互如何象iPhone那樣做到革命性的突破，不能用AI技術使得電視服務變聰明，讓用戶獲得好的體驗。這個問題沒搞好，顯得非常可惜。至於各種其它家電產品，如智能冰箱、智能電飯煲等等，由於其應用場景不夠複雜到需要智能，稱為智能家電純屬噱頭。現在大家最關注的是智能音箱和智能汽車，智能音箱有自然語言理解問題，跟聊天機器人有關，在比較狹窄的特定領域可以做得很好，如亞馬遜的智能音箱。至於智能汽車，由於不需涉及太多的知識處理，主要用深度學習和計算機視覺技術等機器人技術反而可行，但涉及更多包括立法等社會問題，智能車不象十年內就能滿大街跑。

企業智能化上有政府各種計劃，下有企業競爭需求，尤其是傳統企業，如製造業，這是一個很現實的問題。對比企業信息化的發展，20年前對企業信息化還有爭議，認為企業搞信息化是個黑洞，很燒錢，產出難於衡量，但是，現在搞得又大又強的企業都是信息化搞得好，就無爭議了。很多企業信息化還沒搞完，又要搞智能化，信息化是智能化的基礎，但又不能等傳統的信息化做完了再搞智能化，那競爭又落後了，可以預見，今後智能化做得好的企業更有競爭力。另一方面，現有的企業管理軟體產品都缺乏AI技術，特別是一些大型軟體幾乎不可能基於AI重新構架開發，只能為了市場營銷需要做了一些智能化功能，不能滿足企業智能化的需要。此外，許多初創公司做的智能化管理軟體需要更多在企業中應用完善，傳統企業可能不敢被當試驗品。總的來說，跟企業信息化一樣，很多企業可能要走彎路、甚至碰壁，付出不菲成本。

企業搞智能化首先是一個戰略和規劃的問題，企業內部若沒有相應的人才，只能找諮詢公司要方案，而諮詢公司也缺少AI人才和經驗，這樣一來，企業智能化首要的問題是先找到既有信息化經驗又懂AI還能結合企業經營管理做好戰略規劃的人才。無論如何，市場競爭使然，總有一些企業會先搞起智能化，並最終獲得成功。

來源：轉載自36Kr，作者：石亞瓊