當前位置:
首頁 > 哲理 > 劫波研究系列之四:人工智慧

劫波研究系列之四:人工智慧


劫波研究系列之四:

人工智慧









(01)




人工智慧是計算機出現之後發明的,用機器來模仿人類學習和其他智能的技術。




是否會出現超越人類的機器生命是頗具爭議的話題,混沌的數字世界需要我們攜手同行。




(02)




相比數據,機器智能的發展歷史遠沒有那麼悠久。雖然人類歷史上有過關於智能生命的諸多神話和幻想,比如古希臘火神赫菲斯托斯用黃金鍛造的機器人少女,文藝復興時期的鍊金術士通過注入意識製作的人工生命何蒙庫魯茲,以及19世紀幻想小說中會思考的機器人等等。

但真正進入科學家嚴肅研究視野的機器智能始於20世紀40年代基於抽象數學推理的可編程數字計算機的發明。


 


由於分析和理解常常容易產生誤差,人類發明了數學這一相對精確的工具。在描述了一些基礎問題後,歷史上許多偉大的數學和哲學學者開始試圖將一切人類思考過程都簡化為數學表達。霍布斯就在其著作《利維坦》中談到:「推理就是計算「,羅素和其老師懷特海共同撰寫的《數學原理》則想要證明整個純粹數學是從邏輯的前提推導出來的,並嘗試只使用邏輯概念定義數學概念。


 

然而羅素等人的理論在很多情況下只能是設想,因為那時的我們還遠遠沒有掌握海量的數據資源,也就無法真正將數理邏輯全部付諸現實領域。計算機的發明深刻地改變了這一狀況,通過快速迭代的計算能力,它在短短几十年間不斷地突破著人類對於數據邊界的想像。著名的邱奇-圖靈論題就曾指出:

一台僅能處理0和1這樣簡單二元符號的機器(計算機)能夠模擬任意數學推理過程——既然計算機有一天可能「推理萬物」,這就大大激發了人類探討機器思考的興趣。




(03)



後來我們將這種計算機能夠模仿人類思考的技術稱之為人工智慧

(Artificial Intelligence,簡稱AI),該詞源自1956年的達特茅斯會議。在這次會議中,一群計算機和信息科學專家花了兩個月的時間討論「用機器來模仿人類學習以及其他方面的智能」的問題。雖然最後大家並沒有達成普遍的共識,但是卻為會議討論的內容起了一個名字:人工智慧。這標誌著人類更為清晰地認識到計算機可能發揮的巨大價值,並希望藉此發明一套能夠幫助我們解決數理邏輯的應用和提升人類自身智慧的方法,

1956年也被普遍認為是人工智慧的元年。


 


在這之後的50至60年代中期,AI迎來了第一波高潮。這個階段的AI在多個領域都取得了突破性的成績。這其中包括獨立證明羅素《數學原理》中的若干條定理,以及擊敗跳棋的美國州冠軍等,我們驚呼不久就會產生超越人類智慧的計算機器。但很快,研究者發現自己對未來的估計過於樂觀,由於計算機性能的瓶頸、計算複雜性指數級增長以及數據量缺失等原因,在完成一些初級問題的回答之後,AI在語音識別、機器翻譯等領域遲遲不能突破,行業很快陷入低谷。


 


1980年代,一類名為「專家系統「的AI開始為全世界的公司所採納,它的優勢在於能夠依據一組從專門知識中推演出的邏輯規則回答解決某一特定領域的問題。由於設計簡單、容易編程且能夠規避不少常識錯誤,專家系統在醫學診斷、氣象預測、工程物理等多個領域發揮了作用。


 

如果說最初的AI是人類在剛剛獲得新工具的時候自信滿滿地全面進擊的話,專家系統則是我們暫時與遠大情懷作別,退回到一步步去解決具體問題的實踐之中。

但這一次的「腳踏實地」也沒能持續多長,在經歷了幾次耀眼的亮相之後,專家系統很快就由於維護費用高昂,且實用性僅針對某些特定場景逐漸式微。進入到90年代初,不僅僅是專家系統,整個AI行業都因無法找到合適的發展路徑而徹底停滯不前。


 


這個時候的很多人已經對所謂智能不再抱希望,整個技術界都不看好AI的未來,許多頂尖的計算機科學家也紛紛離開了這個行業。到了90年代中期,很多研究團隊甚至已經拿不到任何的資助。但即使面臨這樣的窘境,以後來被稱為「深度學習之父」的辛頓教授為代表的一群資深研究人員仍舊沒有放棄。在獲得了加拿大高級研究所的贊助之後,辛頓團隊遷往了多倫多,與他同期的理查德·薩頓和約書亞·本西奧同樣也在加拿大政府的支持下,以堅韌的精神繼續著自己的研究。


 


我們常常說的對於一項新事物,人類很容易在短期內高估,而在長期低估其價值——這句話用在AI身上再合適不過了。

上帝為人類打開了一扇門,只不過他擔心擠進去的人太多,而且不夠虔誠,所以總是會頗費心機的為我們設置重重障礙。

很多時候,疑惑的產生不過是我們沒有投入足夠的思考和耐心,找出混沌中左右事情發展的關鍵矛盾而已。好在總有一些像辛頓這樣的傑出人物,能夠不為外界一時的看法所動,始終專註地堅持著自己的理想,並靜靜等待觸發它轉變的臨界點。


 

對於AI來說,這個臨界點就是數據。

沒錯,就是一開始我們早就習以為常的數據。我們在之前大數據的文章中也已經提到,數據量在達到一定的規模之後,就可以發揮與以往完全不同的巨大影響力。就在AI研究者們人生中最為灰暗的時刻,對行業未來走向起到至關重要作用的互聯網技術逐漸在商業領域走紅。伴隨著互聯網的興起,數據維度和數量急速增加,我們在前面文章中談到的始於70年代的數據統計驅動的方法開始發揮價值。通過引入這一方法,AI開始進入又一輪發展高潮。


 


尤其是2006年以來,由辛頓等人主導的深度學習、人工神經網路的研究方法開始大放異彩,將AI從實驗室和小規模場景真正推向了應用化、商業化的前台。今天我們一談到AI,很多問題都會和它們相關,比如人工神經網路聽上去很神秘,意思是AI在模仿人腦的神經系統嗎?深度學習是說計算機可以像人類一樣學習和掌握複雜深入的知識?在這個基礎上,未來會不會有能夠替代人類的智能出現?諸如此類等等。 






(04)




對於上面每個問題的回答都不簡單。AI本身就包含各種複雜的數學和計算模型,加上媒體五花八門的報道,常常會把很多非專業人士弄得一頭霧水。我們大可不用理會這些晦澀的概念,僅僅稍微了解一下AI的發展軌跡,就可以獲知以上問題的基本答案。




AI主流技術的發展經歷過三個階段。第一個階段大致對應我們前面所說的達特茅斯會議之後的早期通用人工智慧時期。我們認為只要機器被賦予邏輯推理能力就可以實現智能,因而傾向於利用AI解決所有的問題。第二個階段開始,不同的學術派別、研究方法此起彼伏,我們上面談到的專家系統大多採用的就是這其中一支叫做「符號學派」的方法。與第一階段不同,這個時候最有影響力的觀點是需要將人類知識總結起來灌輸給AI。


 


第三個階段一直持續到今天,在擁有了更多數據之後,

這個階段的主要方法是將計算機需要學習的數據丟進一個複雜的、包含多個層級的數據處理網路

,也就是我們經常聽說的人工神經網路(其實只是借用了生物學名詞做了形象的比喻而已,和人腦沒有半點關係),然後不斷調整結果數據直至得到滿意的目標模型。這個分析過程非常像人類學習新知識,

於是科學界給它起了一個名字叫做「深度學習」

。AlphaGo戰勝李世石主要採用的就是這種方法,通過在單個圍棋領域不斷地對機器進行數據「訓練」,AlphaGo在這個代表人類最高智慧的遊戲上所具備的「聰明」程度已經超過了我們。




(05)




關於未來會不會有替代人類智能的機器出現,這是一個老生常談,且一直存在爭議的話題。

但至少目前可以比較肯定的是,我們現在還處在弱人工智慧的時代,只能依賴AI解決一些局部的問題。

雖然AI已經在圍棋中獲勝,但這並不代表它能夠在各個方面都超過人類——從某種角度來說,那隻不過是通過給機器「喂」數據得到的暴力破解結果而已。




判斷AI是否超過人類的更為核心的標準在於其是否能夠具備跨領域推理、抽象和嘗試的能力。考慮到目前的AI在這些方面還相當稚嫩——

比如懂得下圍棋的程序並不能欣賞棋局中的博弈之美,也不能將之抽象出來用於商業決策,人類距離開發真正能夠達到甚至超越自身智慧的物種還有相當長的路要走。


 


但無論如何,我們已經切身體會到AI帶給我們的便利。藉助對大數據的使用,世界被亞馬遜、騰訊們的演算法圍繞著。它們精心計算著人類社會發生的一點一滴,並且小心翼翼地進入到我們的生活。AI會根據你過往的消費記錄,智能的計算出你的消費傾向,並據此推送旅遊折扣券或者促銷信息給到你,你甚至會驚奇地發現它能夠預測到你下個月國外旅行的計劃;AI還可以幫助我們翻譯論文、查找資料,以及在不久的將來為所有人駕駛汽車。人類開始有能力把自己從日常瑣事中解放出來,從事一些更加高級的工作,並擁有更多時間去娛樂和享受生活。


 


在這個智能的世界,一切將會變得更加高效。AI會幫我們尋找複雜問題的解決方案,從而省去許多無謂的奔波;AI將會朝著越來越接近人類智慧的方向發展,直到有一天帶給我們目前無法想像的繁榮……說到這裡,我們似乎找到了之前文章中提出的問題的答案,腦海中再一次湧現出完美世界的圖景。我們知道AI是在大數據基礎上建構的一整套演算法模型,既然如此,我們是不是可以把這個理想的世界簡單表述為下面的公式:




理想模型=(萬物數據化+相對精確+相關性)+演算法




似乎還缺點什麼?對了,我們還需要很多很多這樣的機器,開足馬力去計算所有複雜的數學方程,也就是被全部數據化了的世界,然後只需給到人類一個簡潔優美的答案。按照嚴謹的計算機語言,能夠支撐這個世界高速運轉的機器的能力被統稱為「算力」。我們再將前三項合併為「理想數據模型「,這樣公式就可以被寫作:




理想模型=理想數據模型+演算法+算力




因為演算法和算力作用的發揮非常依賴大數據的搜集和發展,因而我們暫時沒有在公式中給它們加上任何限定的辭彙。

在演算法方面,目前的AI實際上是以大數據的相對精確、相關性為底層,比如AlphaGo和它之後的改進版本主要都是通過不斷豐富數據實現迭代升級的,雖然模型本身也會調校,但相比早先的演算法改進並不大。

而且AlphaGO在下棋的時候,演算法也不會告訴它為什麼要下這一步,只是程序的計算結果說明這樣走更合理而已。


 


從算力角度,AI也在不斷地提升,以匹配持續增加的數據計算量。

AlphaGo的計算能力已經是1997年戰勝當時國際象棋世界冠軍的IBM計算機「深藍」的3萬倍。

而即使是二十多年前的深藍,每秒鐘的計算就已經達到兩億步,並且輸入了一百多年來優秀棋手的兩百多萬盤對局。






(06)




正如有一天隨著大數據「大「到一定程度之後,相對精確和相關性可能會顯得不再必要,我們現在對於演算法和算力的理解也可能隨著技術的進步而產生改變。

在未來的某個時候,人類可能會掌握更精確的演算法模型,即使在小數據的場景中也能夠解決問題;在這種情況下,算力也就不會無限地增長下去,而是在達到新的臨界點後開始下降。

這樣計算資源是否就能被極大地節省下來?我們又會將這些剩餘的資源投入什麼新的領域呢?是用於人類大腦和基因的改造?還是去探索無盡的宇宙?




我們暫時還無法完整地回答這些問題, 但是我們可以從智能的發展歷史中找到一些脈絡。 以語義理解為例, 我們的故事仍舊從熟悉的混沌-矛盾-演化模型開始。 我們的祖先在五千多年前發明了最早的文字, 而後又經過漫長的歷史演變, 逐漸形成了較為完善的語言表達和語法的規則。




人類主要就是通過學習語言、文字來了解新知識的。後來我們知道數字從中分離出來,並且在之後的幾千年與文字越走越遠。但

二者之間並不是毫無聯繫的,由於數字具有一些文字不具備的屬性,比如更有利於確保信息傳遞的無誤,早在公元前4世紀,我們就已經開始嘗試將一些語言和文字轉化為數字進行表達。

例如當時猶太人為了避免聖經在抄寫中的錯誤,會將每一個希伯來字母對應成一個數字,這樣每行文字加起來便得到一個特定的數字,以此作為這一行的校驗碼。


 


進入到20世紀,人類又將大量文字轉換成數字編碼寫入計算機,並通過智能的模型對其進行理解和推演。AI最基本的應用場景就是讓機器模仿人類去理解這些文字和它背後所表達的語義,也就是我們常常聽到的自然語言理解。


 


語義理解的歷史由來已久,中國漢代許慎的著作《說文解字》,就是對漢字字形、來源及詞意的解析;北魏酈道元編寫的《水經注》,也是對先人地理古籍《水經》進行框架上的陳述和表意上的解釋擴展。


 


除了對文字和語句進行解析之外,廣義的自然語言理解還包括機器翻譯,以及語音識別和知識理解等等。製作於公元前196年的古埃及羅塞塔石碑,用希臘、古埃及和當時的通俗體文字記載了國王托勒密五世登基的詔書,從1798年被人發現到1822年法國語言學家商博良對其破解翻譯,前後花費了整整21年的時間。雖然在AI出現之後的翻譯方法並沒有比19世紀先進多少,但因為有了數據和計算模型,現在我們翻譯石碑所需要花費的時間會遠遠少於當時。






(07)




時至今日,對於絕大多數不是特別複雜的論文、外文資料等,我們都能夠藉助機器進行理解和翻譯。我們通過發明語音識別的程序,將國際會議演講者的內容實時轉換成多國語言;我們還可以藉助餘弦定理、貝葉斯網路等數學模型對文獻資料進行分類,並從中抽取概念和分析主題。伴隨著AI的發展,我們正在掙脫巴別塔的束縛,讓思想和靈魂彼此碰撞。




(08)




然而事情的發展並不是一開始就如此順利,人類在通過計算機進行自然語言理解的道路上經歷了不少矛盾和曲折。作為AI早期犯下的一系列錯誤的重要組成部分,最初我們在自然語言理解領域採用的方式也是把人類的經驗傳授給機器。這些知識主要來自於數世紀以來已經比較成熟的語言學的語法規則、語義分析等。但很快弊端就開始顯現,首先是文法規則浩如煙海,即使用計算機覆蓋哪怕20%-30%的真實語句,規則數量就已經多到語言學家來不及寫的程度,並且隨著覆蓋度的增加,還要用新的文法規則解釋當中產生前後矛盾的語句。


 


其次是文法在文章中體現出的上下文相關特性,用程序語言很難進行解析。計算機更加善於解碼上下文無關的文法,舉例來說,我們都知道中文博大精深,「方便」一詞在不同的上下文語境中涵義大不相同。比如以下三個句子:


1. 我今天下午去你家找你,不知道你方便不方便——表示有機會、有時間;


2. 我晚餐有些吃多了,現在想去方便一下——表示排泄、大小便;


3. 我和張總是老同學了,希望在這次合作上貴公司能夠給予方便——提供便利、幫助。




理解這些意思需要較好的生活常識,而基於規則方法組織起來的AI往往對此處理效果不佳,這也就是我們之前談到的現在的AI還難以和人類擁有同等智慧的情形。


 


但人類會就此變得束手無策了嗎?答案是否定的。

我們發現有些事情並不是沒有合適的解決方案,需要的僅僅是一些看問題的角度轉換而已。

既然問題出現在人類在語言學上積累的規則和經驗難以有效轉移,那麼不妨讓我們換一個角度。1970年以後,IBM華生實驗室的賈里尼克教授就拋棄了我們一直以來對於語言規則的執著,轉而採用統計學的方法處理AI遇到的問題,最早的嘗試來自於當中的語音識別領域。


 


語音識別的本質就是機器將說話者表達的語音轉化成文字的過程。

比如我們現在對著Siri(蘋果手機的語音識別程序)說話,IOS系統就可以將用戶希望了解的天氣、出行等各項信息推送出來。在這裡說話者的一系列語音首先被手機記錄下來,我們用o1,o2,o3…(觀測信號)來表示。接收到這些信號後,AI將推測出這些信息的本來樣子是s1,s2,s3…(信號源信息)。接下來AI會根據推測結果向系統發出相應的調取指令,最後, 收到這些指令的系統將會回復給用戶「今日天氣晴朗」,「建議改換路線躲避擁堵」等信息。


 


在應用統計方法之前,計算機要識別出複雜的人類語音需要學習大量的語法規則,

而轉變的核心就是將這個學習過程簡化為概率統計模型。

上面的例子中,問題變成了從所有的源信息中找到最可能產生出觀測信號的那一個信息。也就是在已知o1,o2,o3…的情況下,求令條件概率:




P(s1,s2,s3,...|o1,o2,o3,...)達到最大值的那個信息串s1,s2,s3…,即





這個公式比較複雜,但可以用隱馬爾可夫模型來估計,語音識別也成為隱馬爾可夫模型最早成功應用的場景。隱馬爾可夫模型是指這樣一種情況,其輸入狀態是不直接可見的,但輸出依賴於該狀態下,是可見的,每個狀態通過可能的輸出記號有了可能的概率分布。




對應到上述案例中,也就是運用該模型,在給定已知參數的條件下,用概率的方法求出公式中不可見(隱含)的信號源信息。

賈里尼克領導的實驗室在當時提出用隱含馬爾可夫模型來識別語音,使得錯誤率相比之前降低了2/3。接下來,這一模型還被陸續地用於基因測序、股票預測和投資等多個行業。對此吳軍老師的《數學之美》有非常詳細地闡述,這裡我們不做具體地展開。






除了語音識別,在機器翻譯等其他自然語言理解的行業原理也類似。我們可以把翻譯問題簡單理解為AI很難像人類一樣去推測文字背後所要表達的上下文邏輯,但是之所以能夠給出較為正確的識別結果,在於

它用概率的方法去判斷代表不同意思的辭彙出現在該語句中的概率。




比如「pen「在英語中的意思既可以譯為「筆「,也可以是」圍欄「,但是當句子中有「bag」(書包)一詞的話,pen是筆的意思的概率將遠遠超過圍欄,這時候機器給出的翻譯結果就會是筆。通過這種方法的運用,計算機甚至完全不知道說話者要表達的是什麼意思,僅僅通過進行概率計算就可以做出相對準確的識別。

事實上,AlphaGO下棋的核心也是採用了概率統計模型,每一步決策的背後都是概率上贏面最大的考量。


 


然而通過統計模型解決自然語言理解問題的方法並沒有在賈里尼克之後就被所有人接受,研究者們分裂成了規則學派和統計學派兩大陣營。到了90年代初期,矛盾雙方仍是唇槍舌劍不斷,互不認同彼此的方法。之所以出現這種情況是因為規則學派的人認為統計方法只能處理淺層的自然語言理解的問題,深層次的研究則仍需藉助規則經驗的使用。

直到2005年,隨著數據的不斷完備,Google基於統計方法開發的翻譯系統全面超過基於規則建構的SysTran,自然語言的處理才完全演化成採用概率統計的方式,規則學派終於徹底退出歷史舞台。


 


我們早就聽說了不少關於堅持和放棄的故事,比如20世紀美國在技術上大幅領先的調頻無線電技術花了整整半個世紀才徹底戰勝調幅技術。我們也認為自己已經汲取了不少這方面的教訓。什麼時候放棄?何時又應該堅持?事情在時時處處考驗著人類的智慧。

然而問題在於身處其中的人們經常不願意理性辯證地思考,卻總是固執地覺得自己不會是錯誤的一方。


 


在圖像和藝術繪畫方面,逐步演進的AI也開始發揮威力。目前AI在人臉圖像識別領域的精度已經達到了99.83%,這已經超過了人眼的平均精度99.15%。在藝術創作上,2016年微軟的智能設備通過自主「學習」倫勃朗的作品繪畫風格和主題「創作」了一張男子肖像畫,參觀者感覺它與掛在美術館的倫勃朗真跡相比一點也不突兀。


 


近些年我們討論AI,並不會過多涉及人腦和意識模擬的話題,而是將重點集中在解決實際落地的問題之上。但這種AI能夠代表所謂的智能嗎?著名學者侯世達就在近期接受的採訪中表示,目前的AI不過是對數據的妥協下製造出的很厲害的解題程序而已,根本談不上真正的智能。在其於上世紀70年代末撰寫的傳世名作《GEB》(《哥德爾、艾舍爾、巴赫書:集異璧之大成》)一書中,就曾

主張人類可以通過認知的循環升級,最終創造出超越自身的智慧和意識,讓機器能夠產生機器本身。






(09)




如果按照這種說法,或許我們現在發明的所有AI工具,從更長的人類歷史來看,遠遠還不能被稱為智能?未來的智能需要具備意識和情感嗎?它是否需要擁有和人類一樣的同理心?我們理想中完美的智能世界,是僅僅包含了物質的存在,還是也應該具有主觀的精神和意志?




回到我們最初的理想模型,或許真到了智能可以搞定一切問題的時候,我們可能不願意全部交給它處理,因為擔心聰明的計算機侵犯我們的安全和隱私?我們需要適應AI帶給我們的一系列變化,比如機器將會替代大量人類的工作,這種情況下我們應該以何謀生?智能的機器會變得越來越強大,為了規範它們和人類的共處模式,是否又需要建立新的法律和社會秩序?


 


在AI快速發展的今天,人類已然擁有了無比豐富的知識,全世界的經濟發展為何仍不時陷入困境?除了自然因素之外,為什麼我們居住的土地上仍然存在大量的饑荒和瘟疫?AI幫我們克服了許多過去無法克服的難題,為什麼人類依然經常生活在冷漠和猜忌之中?我們的生產力在大數據和智能的助推下獲得了長足的進步,但為什麼彼此的信任和協作還是難以大範圍達成?


 


這樣看來,我們的問題可能並不是什麼數據或者智能,如果僅僅依靠它們也根本無法建立人類心目中的完美世界。一定存在著某個關鍵的方法,只是我們暫時還沒有發現而已。即便我們訪遍了地球上每個數據的角落,也用AI翻閱了無數的經典,卻久久無法找到問題的答案。在科技為我們不斷創造繁榮的同時,無論是西方還是東方,正在被越來越多的焦慮和無措的情緒所籠罩。

站在無邊的曠野上,人類四處張望,卻總是無法找到一個溫暖的擁抱;即使身處繁華和喧囂之中,有美酒和音樂相伴,我們的心卻還是時不時感到落寞和孤單。


 


終於在2009年,一個名叫中本聰的傢伙在他發明的比特幣上給了我們最初的提示,後來我們又從中提煉出區塊鏈這項新的技術,並已經開始著手將它應用於解決各項棘手的問題。

區塊鏈將為我們提供大規模信任的基礎,消除猜忌和疑慮,降低彼此間溝通的成本。

藉助這一技術,大數據、AI和量子計算們可以發揮更大的價值,從而幫助我們穿越低潮和迷霧嗎?在它的幫助下,人類或許就可以攜起手來,勇敢地走進混沌的數字世界,然後一起邁向更完美的遠方?無論如何,對於我們來說,這是又一次巨大的希望。


 


數字無界,願相伴同行!




(10)




*文章為作者李凱龍原創獨立觀點。 未經授權, 禁止擅自轉載。




*李凱龍,劫波科技創始人兼CEO。




李先生就讀於清華大學經濟管理學院和法學院獲得碩士學位,擁有香港中文大學mba及北京外國語大學語言文學學士文憑,並被公派到歐洲多個國家留學。李先生曾供職中美頂級的一/二級市場投資及基金;曾於騰訊從事研究與投資工作,期間在騰訊研究院擔任首席研究員;曾出任中國五百強佳兆業金融控股總裁助理職務,負責戰略業務規劃及金融/科技/消費板塊的投融資和運營管理。李先生還是清華-伯克利深圳學院和香港中文大學博士及研究生課程講授學者,並為清華大學院系校友會之理事。





喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 霧滿攔江 的精彩文章:

我不慚愧,我要一輩子都啃老
霧滿攔江微文故事大賽|會講故事,人生才圓滿

TAG:霧滿攔江 |