當前位置:
首頁 > 科技 > 被遺忘的圖靈:計算機、神經網路、人工智慧……他是這一切之父

被遺忘的圖靈:計算機、神經網路、人工智慧……他是這一切之父

唐旭 發自 凹非寺

量子位 出品 | 公眾號 QbitAI

106年前的今天(6月23日),阿蘭·麥席森·圖靈在英國倫敦出生。

1968年,也就是圖靈逝世14年後,一份此前從未發表過的圖靈論文原稿出現在了《科學美國人》雜誌上。

在這篇寫於1948年、題為《智能機器》的論文里,圖靈第一次為世人勾勒出了人工智慧領域的輪廓。

他不僅為聯結主義理論奠定了基礎,還引入了多種對於日後的AI研究至關重要的概念。

而在此之前,聯結主義被廣泛認為起源於在1957年首次發表相關論文的弗蘭克·羅森布拉特。

然而,圖靈這篇跨時代的論文在當時被自己的領導、英國國家物理實驗室主任查爾斯·達爾文斥之為「小學生作文」,不予發表。

一份偉大的思想,就此失去了提早照亮世界的機會。

觀其一生,圖靈對於宣揚自己的思想始終缺乏足夠的熱情。他古怪、孤僻、木訥,任憑自己和作品在偏見中被埋沒,並最終如願以償……

如同那份被埋藏的論文手稿——阿蘭·圖靈,最終成為了被遺忘的那個人。

算出不可計算之物

1935年,圖靈23歲。

這一年,他構想出了一種後來被世人稱為「通用圖靈機」的抽象設備。這種設備擁有無限的內存,能夠同時存儲程序和數據;它還包括一個在內存上以一個符號為單位前後移動的掃描器,用於讀取信息及寫入額外的符號。

機器的每一種基本行為都十分簡單,比如「識別掃描器所處位置的符號」,「寫入『1』」或是「向左移動一個位置」。但當大量類似的基本行為聯結在一起,結果就會變得複雜。

雖然結構簡單,但一台通用圖靈機足以執行今天最強大的計算機能夠完成的任何任務——事實上,所有現代數字計算機本質上都是通用圖靈機。

在1935年,圖靈的目標是設計出一台儘可能簡單的機器,讓它能在無限的時間、功耗、紙和筆以及完美的專註度下進行任何人類數學家能夠藉助演算法完成的計算。稱其「通用」,就是因為它有能力進行所有類似的運算。

圖靈本人曾寫過:「電子計算機是為了執行任意特定的、依靠經驗法則的處理進程,這些進程原本可以由人類以一種有規則但卻笨拙的方式完成。」

理論而言,圖靈成功了。不過,一個引人注目的問題依然隨之產生:我們有可能設計出甚至比通用圖靈機更加強大的機器嗎?

有段時間,超計算(Hypercomputation)領域吸引著越來越多的科學家。一部分人猜測,已知最為複雜的信息處理器——人腦本身——就是一個超計算機(Hypercomputer)的自然實例。

而在人們真正燃起對於超計算的興趣之前,所有已知對於通用圖靈機而言過於複雜的信息處理工作都被作為「不可計算之物」而忽略。從這個意義上講,一台超機器(Hypermachine)應該能夠算出「不可計算之物」。

「不可計算之物」的實例在數學領域十分常見。比如,對於一些隨機選定的算術陳述,一台通用圖靈機並不能判斷出哪些屬於定理(如「7+5=12」)以及哪些不是定理(如「任意一個數都是兩個偶數之和」)。

還有一種「不可計算的」問題來自於幾何領域。一組大小不同、各條邊的顏色也不同的正方形瓷磚是否能「鋪滿「一個歐幾里得平面(沒有空隙、沒有重疊且接合各邊的顏色相同視為「鋪滿」)?夏威夷大學的邏輯學家William Hanf和Dale Myers就曾發現過一組通用圖靈機無法計算的瓷磚。

在計算機科學領域,一台通用圖靈機無法一直預測對眼前的程序是會終止,還是會永遠繼續運行下去。有時這種情況被人們稱為,沒有通用目的語言(Pascal、BASIC、Prolog、C等等)能夠擁有一個哪怕最簡單的崩潰調試器,它們難以發現能夠導致崩潰的故障,包括那些會引發無限處理循環的錯誤。

圖靈本人成為了第一個對所謂「超計算機」的構想進行研究的人。1938年,在自己的博士學位論文中,圖靈描繪了「一種全新的機器」——「預言機」(O-machine)。

「「預言機」「即一台通用圖靈機加上一個黑箱後得到的成果。黑箱又被稱為「預言家」(Oracle),是一種用以執行那些「不可計算的」任務的機制。

而在其他方面,」「預言機」「都與一般的計算機十分相似。輸入一個被數字化編碼過的程序之後,」「預言機」「會通過重複的基本行為組合一步步地輸出結果。其中一步就是向「預言家」傳輸數據並記錄其反饋。

圖靈並沒有說明「預言家」是如何工作的(他也從沒解釋過通用圖靈機的那些基本行為——識別掃描器中的符號」是如何實現的)。不過單從概念上看,一種能夠滿足「預言家」特性的機制並非難以想像。

原則上,如果神經元的活動被去同步化,一個合適的B型網路就能對那些「不可計算之物」進行計算(如果存在一個能讓各神經元協調工作的中樞生物鐘,該網路的運作就能在一台通用圖靈機中被精確地模擬出來)。

在超計算理論中,像「分辨算術定理和非算術定理」這類任務都不可解;即便是能夠分辨出程序是否由C語言寫成的調解器,也會陷入理論上可能的無限循環。

而如果超計算機能被製造出來,那麼用它破解那些看似不可解的邏輯和數學問題的潛力將會十分巨大——不過,相關的研究嘗試也很可能因無法滿足實現「預言家」所需的條件而告吹。

在數理邏輯之外,圖靈的」「預言機」「幾乎被忘得一乾二淨;相反,一個神話被人們供奉了起來:在一份子虛烏有的記錄中,圖靈在二十世紀三十年代中期成功證明了超機器是可能的——傳言中,他與自己在普林斯頓大學的博士生導師阿隆佐·邱奇宣稱一台通用圖靈機可以精確地模擬任何其他信息處理機器的行為。

這條被廣為誤讀的「邱奇—圖靈論題」意味著,沒有機器能夠解決通用圖靈機能力範圍之外的任務。

但事實上,邱奇和圖靈只說過,一台通用圖靈機能夠模擬任何人類數學家在使用筆和紙的情況下藉助演算法完成的工作——對於一個神話而言,這個命題顯然過於薄弱了。

圖靈對於超計算機的理論貢獻無疑被忽視了——即便是對於工作於這一領域的研究者而言。專家們永遠談論的是要執行「超越圖靈局限」的信息處理任務,稱自己的工作是在嘗試「打破圖靈障礙」。

《新科學家》雜誌上曾有一篇報道甚至聲稱,全新的機器已經「超出了圖靈的概念範疇」,它們是「圖靈從未構想到的計算機類型」……

就彷彿半個世紀前,那位來自英國的天才從未踏足過這片領土。憂傷的是,那隻不過是圖靈聯結主義思想的又一次復活罷了。

圖靈聯結

數字計算機都是無與倫比的神運算元。如果讓它們預測火箭的發射軌跡,或是計算大型跨國公司的賬目,它們可以在幾秒內就給出答案。

然而,換成那些對於人類而言輕而易舉的事情——比如認臉或是閱讀手寫的文字,機器會變得完全不知道從何入手。

也許是因為組成人腦的神經元網路具備專門應對這類任務的部門,而普通計算機沒有。因而,科學家們開始嘗試開發結構更加接近人腦的計算機。

1948年,圖靈36歲。

這一年,他在一篇未能發表的論文中第一次引入了聯結主義的思想。在論文中,圖靈發明了一種他稱之為「B型非結構化機器」的神經網路,包含人工神經元以及可以對神經元之間的聯結進行調節的設備。

B型機器中的神經元可以是任意數量,也可以以任意模式相聯結,但依然神經元之間的聯結必須通過調節器。

所有調節器都具有兩條訓練光纖。向其中一條光纖上加置一個脈衝,會將調節器設定為「通過模式」:在這種模式下,一個輸入(0或1)將會原封不動地從中通過並轉化為輸出。

而在另外一條光線上加置的脈衝將會把調節器設定為「干預模式」:在這種模式下,無論輸入為何,輸出結果都將為1。在這種狀態下,調節器會將所有試圖通過的信息全部破壞。

一旦被設定完成,調節器將會一直保持「通過」或「干預」的狀態,除非其收到另一條訓練光纖上的脈衝。這一獨創性的設計使得B型非結構化機器能夠以圖靈稱之為「適度干預,摹擬教育」的方式來進行訓練。

事實上,正是圖靈創立了「幼兒的皮層是一個非結構化機器,可以通過適度干預訓練來實現結構化」的理論。

圖靈設計的每個神經元模型都有兩條輸入光纖,而每個神經元的輸出就是兩個輸入的邏輯函數。網路內的每個神經元都執行相同的邏輯操作——「與非」(NAND),即只要其中一個輸入為0,則輸出為1;如果兩個輸入均為1,則輸出為0。

圖靈選擇「與非」是因為所有其他的(布爾)邏輯操作都可以通過與非神經元的組合實現。更進一步,圖靈還證明了連聯結調節器本身也能通過「與非」來構建。因而,圖靈指定了一種只由與非神經元和它們的聯結光纖所構成的網路——這也幾乎是最簡單的大腦皮層模型。

1958年,羅森布拉特曾經以一句話給聯結主義的理論基礎下了定義:「被存儲的信息以新的聯結——或是神經系統內傳輸信道的形式而存在。」

由於對已有聯結的破壞在功能上等同於新的聯結的產生,研究者們就能通過使用一個包含額外聯結的網路,並選擇性地破壞一部分聯結的方式來構建針對特定任務的神經網路。

圖靈的B型非結構化機器的訓練過程,同時包含了毀滅和創造兩種形式。

圖靈還希望能夠發掘其他種類的非結構化機器,他一直想用一台普通的數字計算機對一個神經網路極其訓練機制進行模擬。他曾說:「要允許整個系統運行可觀的一段周期,然後像(突然闖入課堂的)」督學「一般打斷它並觀察它的學習進展。」

他原本有機會這麼做。然而,在用上第一批通用電子計算機之前,圖靈就已經開始了自己在神經網路方面的工作(1954年Belmont G. Farley和Wesley A. Clark在MIT成功運行了對於小型神經網路的首次電腦模擬)。

儘管圖靈單單用紙和筆就能夠證明,一個足夠大的B型神經網路經過如此配置之後就能變成一台通用計算機。這一發現依然解決了人類認知領域最基本的問題之一。

自上而下來看,「認知」包括複雜的順序進程,如同在數學計算中一般,它通常會將語言或其他形式的符號表徵囊括在內。然而自下而上地看,「認知」只是簡單的神經元燃燒而已。認知科學家面臨的問題,是如何讓這些不同的角度協調起來。

圖靈的發現則為這一問題指明了一個方向:自上而下來看,如通用計算機一般工作的神經網路能夠執行那些連續的、富於符號表徵的處理工作,因此應該把關注點放在大腦皮層上。

在1948年,這一假說十分超前——而事實上,直到現在,它仍然是對於認知科學領域幾大難題最棒的猜想之一。

尾聲

1950年,圖靈38歲。

在自己生命的最後幾年,圖靈開闢了人工生命的全新領域。

當時他在試圖模擬一種化學機制,通過這種化學機制,一個受精卵細胞的基因將可能決定其發育而成的動物或植物的解剖結構。

他稱,這項研究與自己在神經網路方面的研究「並非毫無關聯」,因為「大腦的結構必須……通過遺傳上的胚胎學機制而實現,而且,我正在研究的這種理論可能會更好地說明這一過程意味著怎樣的局限性。」

在那幾年,圖靈成為了第一個在計算機輔助下進行非線性動力系統研究的人。他的理論使用了非線性微分方程來對發育的化學過程進行表達。

不過,這項開創性的研究只進行了一半。

1954年6月8日,圖靈被發現在自己的卧室中死於氰化物中毒。除了那顆被咬掉一口的蘋果,圖靈還留下了一大摞手寫的筆記和一些計算機程序。之後的幾十年里,這些材料仍然不能被人們完全理解。

又或許已經被忘卻。

One More Thing

如果,你對圖靈1948年那篇《智能機器》的論文感興趣,在量子位公眾號(ID:QbitAI)對話界面,回復:「圖靈」兩個字,即可下載查看。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

馬斯克發推:8月特斯拉Autopilot實現完全自動駕駛
英偉達老黃又來送大禮,全新Titan V CEO限量版GPU火力全開

TAG:量子位 |