人工智慧漫談
人工智慧現在已經有62歲了。人們普遍認為1956年美國的達特茅斯研討會Summer Research Project on Artificial Intelligence,是現代人工智慧的起點。這也是人工智慧,Artificial Intelligence這個詞首次登場。這個會議是由四個人發起的,分別是明斯基Minsky,約翰.麥卡錫McCarthy,羅切斯特Rochester和香農Shannon。作為劃時代歷史意義的一次會議,當然不會只是提出了AI的名稱,更重要的是帶來了三個標誌性的研究成果,分別是明斯基提出的 SNARC,麥卡錫John McCarthy提出的α-β搜索法,Allen Newell提出的 「邏輯理論家」。
會議原址
達特茅斯樓
明斯基Minsky在這次會議上提出SNARC(Stochastic Neural Analog Reinforcement Calculator),這是世界上第一台神經元網路計算機,用3000個真空管來模擬40個神經元組成的網路。 後來他去普林斯頓大學讀數學博士學位,博士論文題目是《神經網路與大腦模型問題》,當時評委認為神經網路不是數學,還好馮.諾依曼力挺他,說」現在不算,但很快就得算」。 馮老眼光很准,神經元網路後來遭受了幾次危機,都是靠著數學上的突破才一一化解。而且數學上可以證明,神經元網路可以無限逼近任何連續函數,這是堅實的理論基礎。 遺憾的是後來隨著研究的深入,Minsky對神經元網路的態度越來越消極,1969年他提出神經元網路不能解決XOR異或問題。確實只有一層的神經元網路是無法解決XOR問題的,Minsky承認多層神經元網路或許能做更多,但是他(認為)找不到訓練隱藏層的方法。 這導致神經元網路陷入第一次低谷。 直到1986年Hinton等人發明了BP演算法,人們掌握了訓練多層神經元網路的方法,多層神經元網路才重新回到人工智慧舞台中央。 明斯基2016年才去世,他這一輩子是真正見證和影響了人工智慧的潮起潮落。
Minsky
John McCarthy提出α-β搜索法,主要用於下棋的高效搜索問題。 如果我們把圍棋簡化為2*2的格子,那麼第一步黑棋有4種可能的落子位置,第二步白棋有3種可能,第三步黑棋有2種可能,最後白棋只有一種可能。真實的圍棋是19*19的格子,所以每一步落子都有19*19種可能(實際後面落子選擇少於19*19),一盤棋的總落子大概有19*19步(實際棋局多在200步左右,小於19*19),也就是總的搜索空間為 (19*19)(19*19)。 我們把問題一般化,總的搜索空間為Bd,其中B(Branch)為每一次的搜索分支,而D(Depth)則為搜素樹的深度。 也就是我們可以把總的搜索空間看成是一個樹形結構, B和D分別是樹的寬度和深度。搜素演算法的核心就是通過一些規則來減少搜索樹上的一些分支,也就是剪枝。所以α-β搜索法也叫做α-β剪枝演算法。1997年IBM的深藍打敗世界象棋冠軍卡斯帕羅夫,使用的主要就是α-β搜索法,當然當時使用了分散式計算,跑在30台IBM電腦上。
John McCarthy
Allen Newell和西蒙一起提出「邏輯理論家」Logic Theroist。這是一個推理程序,可以證明羅素《數學原理》的第二章的大部分定理。這個程序給所有與會人帶來了深刻的印象。 但之前Newell曾給邏輯學最重要的刊物《符號邏輯雜誌》投稿,被慘遭退稿,理由是「把一本過時的邏輯書中的定理用機器重新證明一遍沒有價值」。
Newell和西蒙認為,現實世界中所存在的對象和過程,都是可以用符號來描述和解釋。Newell現在被認為是符號主義學派的創始人。 符號主義認為,所有的知識都可以用符號(也就是規則)來表示,人類的認知過程,就是各種符號進行運算的過程(各種規則的組合推理),推理就是採用啟發式知識及啟發式搜索對問題求解的過程。符號主義在人工智慧發展的大部分歲月里,一直佔據著主導地位,決策樹和專家系統是這個流派的力作。
Newell
1956年,Minsky,McCarthy和 Newell三個人都是28歲,都是年輕小夥子, 也沒有什麼名氣。 所以當時 McCarthy把香農Shannon請去了參加這個會議,扯虎皮做大旗, 因為在1953年 Minsky和McCarthy都曾在貝爾實驗室給香農打工。 當時香農已經40歲了,作為資訊理論的發明人, 他在科學史上的地位基本上跟圖靈差不多。 香農在貝爾實驗室的同事們把香農和愛因斯坦相提並論, 並認為「這樣的比較是不公平的,對香農不公平!」。香農發明的信息熵函數,在決策樹演算法中扮演著關鍵角色。
香農
這次會議被認為是里程碑式的,是人工智慧的歷史起點,主要有兩個原因。
第一,人工智慧隨後發展的20年,基本上被這些人,或者這些人在MIT、斯坦福、CMU等的同事、學生們主宰了。Minsky,McCarthy和 Newell三個人後來都獲得了圖靈獎。
第二, 這次會議提出的演算法和思想,深刻的影響了隨後人工智慧幾十年的發展。
人工智慧歷史的60年,普遍認為有兩個主要的流派,一個是符號邏輯主義,就是Newell提出的思想,專家系統和知識工程就屬於這個流派,在AI歷史上長期佔據主流地位。 另一個是聯接主義, 神經元網路是其出色代表,歷史上神經元網路三起三落,但自從2006年以來的這十年可以說是風頭正盛,深度學習儼然成了人工智慧的代名詞。現在看,這兩個流派的思想,在1956年的會議上就已經提出來了。α-β搜索法和其後續的變種,也深刻影響著搜索問題的求解。
現在我們站在2018年往回看, 當年的人工智慧思想和現代人工智慧思想,有一個本質的不同,就是缺少概率和統計學的引入。在AI發展之初,本質上還是由人類輸入各種邏輯推理的思想並程序化,也就是機器的智能肯定小於人類程序員的智能。 但隨著計算機、互聯網和大數據的出現,我們現在有了超大數據集可用,算力也得到長足的發展,所以使用的方法也基本轉變為基於概率和統計的方法。 貝葉斯概率圖、蒙特卡洛搜索樹,都是基於概率和統計的演算法。 機器學習演算法,本質上也是利用大量的數據來找到合適的規律並用公式表達。
用於圖像識別的神經元網路更是如此, 只需要輸入大量帶有標記的圖片,訓練完畢的神經元網路即可以學習到識別是貓還是狗,識別的準確度甚至可以達到98%,超過人類識別率的95%。 這個過程並不需要人類編寫程序規則說貓的特徵是圓臉、圓眼睛、長有鬍子、毛茸茸的等等,所有的特徵是程序通過大量的訓練樣本自己學習得到的。所以我們說現在機器的智能在某些特定領域可以超過人類的智能。
在深度學習火爆的今天,也有很多學者指出其問題:
1)現在的訓練方法需要大樣本,跟人類的智力還有本質區別,人類基於少量的樣本就可以得到答案。
2)過程無法解釋,儘管訓練好的模型可以識別貓和狗,但是你不知道為什麼。而基於規則的符號主義模型,儘管準確度不如神經元網路模型,卻是完全可以解釋的。
3)沒有常識,也就是沒有知識工程。比如說貓可以飛嗎? 貓是動物,貓沒有翅膀,會飛的動物都有翅膀,所以貓不可以飛。 符號主義系統只需要把這幾條規則(專家知識)串到一起就可以得到正確的答案。但是你卻無法訓練一個神經元網路得到這個結果。
4)不具備預測和規劃能力。
這些聲音顯示著,儘管神經網路在工程界大行其道,學術界卻在呼喚符號主義。就跟光的波動派和粒子派之爭一樣,歷史總是螺旋式上升的,歷史不會簡單重複, 學術思想總是在不斷的豐富和完善,而工程界有了超大規模數據、超強算力的支持, 我們大可期待人工智慧科學的燦爛發展。
請持續關注「人工智慧園地」


TAG:人工智慧園地 |