當前位置:
首頁 > 新聞 > 邁克爾 · 喬丹:給AI潑點冷水,革命尚未發生

邁克爾 · 喬丹:給AI潑點冷水,革命尚未發生

邁克爾 · 喬丹:給AI潑點冷水,革命尚未發生



新智元推薦

本文由微信公眾號 「AI前線」原創,(ID:ai-front)

作者:邁克爾·喬丹 編譯:Natalie、Debra、Vincent

【新智元導讀】當我們在談論 AI 時,我們到底在談什麼?人工智慧三度崛起,所有的人張口閉口都是 AI,媒體的炒作讓人看到未來彷彿已經來到我們的身邊。但事實真的如此嗎?機器學習宗師級大牛、加州大學伯克利分校計算機科學與統計學教授 Michael I. Jordan 今天在 Medium 上發布了一篇文章,名為《人工智慧革命尚未發生》,看似在給這個冉冉升起的行業潑冷水,而實際上,這篇文章帶給我們更多的是冷靜的思考。

邁克爾 · 喬丹:給AI潑點冷水,革命尚未發生

人工智慧被稱為這個時代的標誌,這句話是技術人員、學者、記者和風險投資家一致同意的。如同從技術學術領域跨越到普遍發行的許多術語一樣,在使用這些術語的同時存在重大的誤解。但這是因為公眾不了解科學家所做的事情,實際上科學家經常和公眾一樣迷惑。我們這個時代在某種程度上從晶元中洞見了智能未來,並用這些成就來娛樂自己、激勵自己甚至嚇到我們自己。很不幸的事實是:這些都太讓我們分心了。

對於我們這個時代,有一種不同的描述。先來聽一個故事吧,這是一個有關人類、計算機、數據和生死的故事,這是個真實的故事,並不是一個有關智能的幻想。

14 年前,我的妻子懷孕的時候,我們進行了超聲檢查。當時病房裡有一位遺傳學家,她告訴我們,胎兒的心臟周圍有一圈白色斑點,「這是唐氏綜合症的標誌」,她這樣說:「現在風險已經高達 1/20。」 之後她進一步告訴我們,可以選擇用羊膜穿刺的辦法確定胎兒是否真的患有唐氏綜合症。但是,羊膜穿刺是有風險的,胎兒致死率是三百分之一。作為統計學家,我決定找出這些數字從哪兒來。長話短說,我發現一個統計分析在英國已經進行了十年,這些反映鈣積聚的白色斑點確實是唐氏綜合症的預測指標。但我也注意到,在我們的檢查中使用的成像機器比英國研究中使用的機器每平方英寸多了幾百個像素。我回過頭來告訴遺傳學家,我相信這些白斑可能是假陽性特徵——它們實際上是 「白雜訊」。她說:「啊,這就解釋了為什麼我們幾年前開始看到唐氏綜合征診斷的增加,就是從新儀器啟用之後開始的。」

我們沒有做羊膜穿刺術,幾個月後我們有了一個健康的女兒。但是這件事讓我感到困擾,特別是在信封計算(back-of-the-envelope calculation)後,我確信全世界當天有成千上萬的人得到這種診斷,其中許多人選擇了羊膜穿刺術,並且已經造成了一些嬰兒不必要的死亡。而這種情況一天又一天發生,不知何時才能得到修復。這個事件顯示的問題與我個人的醫療保健無關——它關乎整個醫療系統。它可以測量不同地點和時間的變數和結果,進行統計分析,並在其他地方和時間使用這一結果。這個問題不僅與數據分析本身有關,而且與資料庫研究人員所稱的數據 「來源」 有關——廣義而言,數據出現在哪裡,數據得出了什麼推論,以及這些推斷與當前情況之間的相關程度如何?或許一個訓練有素的人能夠在個案的基礎上進行所有這些工作,但問題在於如何設計一個大規模醫療系統來做到同樣的事,而無需人類進行詳細的監督。

邁克爾 · 喬丹:給AI潑點冷水,革命尚未發生

我是一名計算機科學家,在我的知識體系中,這樣的事幾乎是沒有先例的,要建立這種超大規模的推理和決策系統,需要將計算機科學與統計數據融合在一起,同時還要考慮人力資源的情況。不僅在醫療領域,在商業、交通和教育等領域,它的需求都很大,而且會比已有的花哨的 AI 系統更加耀眼奪目。

無論我們是否真能在不久的未來理解 「智能」,我們確實面臨著一個重大挑戰,那就是如何將計算機和人類結合在一起從而增強人類生活。雖然有些人認為這一挑戰是「人工智慧」 創造出來的附屬品,但其實我們也可以把它看作是一個新的工程分支,雖然看起來比較平凡,但同樣令人敬畏。就像過去幾十年的土木工程和化學工程一樣,這一新學科旨在集中一些關鍵思想的力量,在保證安全的前提下,為人們帶來新的資源和能力。土木工程和化學工程是建立在物理和化學基礎上的,而這個新的工程學科將建立在上個世紀賦予 「信息」、「演算法」、「數據」、「不確定性」、「計算」、「推理」 和「優化」等概念的基礎之上。此外,由於新學科的大部分重點將放在來自人類和與人類有關的數據上,因此需要從社會科學和人文科學的角度來看待這一學科的發展。

雖然人工智慧這個大工程的組成部件已經逐漸顯現,但如何把這些部件組合在一起的原則尚未出現,因此這些部件目前只是以臨時的方式堆在一起。

而正如人類在土木工程出現之前就已經開始建造房子和橋樑一樣,人類已經開始著手建造涉及機器、人和環境的大規模推理和決策系統。但也正如早期的建築物和橋樑有時會以無法預見的方式倒塌,並帶來悲劇性後果一樣,我們許多早期的大規模推理和決策系統已經暴露出了嚴重的概念缺陷。

不幸的是,我們並不善於預測下一個會出現的嚴重缺陷是什麼。我們所缺少的是一門涵蓋分析和設計原理的工程學科。

當前公眾談到這些話題的時候總是把什麼都說成是 「AI」,彷彿這是一個萬用通配符,這會導致人們很難推理出這項新興技術的影響範圍和帶來的後果。所以,首先讓我們開始仔細地考慮一下,「AI」 到底指的是什麼,不管是過去歷史中的 「AI」 還是最近人們經常談論的「AI」。

當我們談論 「AI」,我們到底談的是什麼?

邁克爾 · 喬丹:給AI潑點冷水,革命尚未發生

今天所謂的 「人工智慧」,特別是大眾所談論的「人工智慧」,大部分指的是過去幾十年中被稱為「機器學習」 的東西。機器學習屬於演算法領域,它融合了統計學、計算機科學和許多其他學科的思想,以設計處理數據、做出預測和幫助決策的演算法。真正給現實世界帶來影響的是機器學習,而且它所帶來的影響並不是最近才有的。事實上,業界在 90 年代初就已經非常清楚地意識到,機器學習未來可能會對工業帶來大規模的影響,在本世紀初,亞馬遜等極具前瞻性的公司就已經在所有業務中使用機器學習,以解決欺詐檢測、供應鏈預測等關鍵問題,並構建面向消費者的創新服務,如推薦系統等。在接下來的 20 年中,隨著數據和計算資源的迅速增長,很明顯,機器學習將能夠為任何決策與大規模數據相關聯的公司提供新的動力,而不僅是亞馬遜。新的商業模式不斷湧現。「數據科學」一詞開始被用來指代這一現象,反映出機器學習演算法專家需要與資料庫、分散式系統專家合作,以建立可擴展的、健壯的機器學習系統,同時也反映出推理系統的更大潛力。

在過去幾年裡,這種想法和技術趨勢的融合被重新命名為 「AI」。這種重新命名值得仔細研究。

回顧歷史,「AI」一詞是在上世紀 50 年代末被創造出來的,指的是用軟體和硬體實現一個擁有人類智能的實體這一雄心勃勃的願望。我們將使用 「仿人 AI」 一詞來指代這一願望,它所強調的是人工智慧實體應該是人類的一員,如果不是身體上相似那麼至少應該從精神上相似(先不管這意味著什麼)。這主要是一項學術研究。雖然諸如運籌學、統計學、模式識別、資訊理論和控制論等相關的學術領域早已存在,並且常常受到人類智能(和動物智能)的啟發,但是這些領域可以說集中在 「低級」 信號和決策上。比如說,松鼠能夠感知它所生活的森林的三維結構,並在樹枝間跳躍,這種能力對這些領域是很有啟發性的。而 「AI」 所應該關注的是另外一些不同的東西——人類 「推理」 和「思考」的 「高級認知」 能力。然而,60 年過去了,高級推理和思考仍然難以捉摸。現在那些被稱為 「AI」 的發展主要出現在與低級模式識別和運動控制相關的工程領域,以及統計學領域——該學科側重於在數據中發現模式,並做出有根據的預測、假設檢驗和決策。

著名的 「反向傳播」 演算法在 20 世紀 80 年代初被 David Rumelhart 重新發現,且現在被認為是所謂的 「人工智慧革命」 的核心,但事實上,這一演算法最早出現在 20 世紀五六十年代的控制理論領域。它的早期應用之一是優化阿波羅宇宙飛船飛向月球的推力。

雖然自 20 世紀 60 年代以來,我們已經取得了很大的進展,但可以說,這並不是源於對 「仿人 AI」 的追求。相反,就像阿波羅宇宙飛船一樣,這些想法往往隱藏在幕後,是專註於具體工程挑戰的研究人員的傑作。雖然公眾看不到,但文檔檢索、文本分類、欺詐檢測、推薦系統、個性化搜索、社交網路分析規劃和診斷、A/B 測試等領域的研究和系統構建取得了巨大的成功——而這些進步推動了谷歌、Netflix、Facebook 和亞馬遜等公司的發展。

人們可以簡單地同意將所有這些都稱為 「AI」,事實上,人們現在似乎就是這麼做的。這種隨意的命名標籤,可能會讓優化或統計學領域的研究人員感到意外,他們一覺醒來後發現自己突然就被稱為「人工智慧研究人員」 了。但撇開研究人員的標籤不談,更大的問題是,使用這個單一的、定義不清的首字母縮略詞,使人們無法清晰地理解當前正在發生的到底是什麼樣的技術和商業變革。

在過去的二十年里,在工業界和學術界取得重大進展的應該是 「智能增強」(IA),這通常被人們視為對「仿人 AI」 的一種補充。在 IA 領域,計算和數據被用來創建增強人類智力和創造力的服務。搜索引擎可以被看作是 IA 的一個例子(它增強了人的記憶和事實知識),自然語言翻譯也是如此(它增強了人的交流能力)。基於計算的聲音和圖像生成是藝術家的調色板和創造力增強器。雖然這類服務可能涉及高級推理和思考,但目前它們並不涉及——它們主要執行各種字元串匹配和數字操作,以捕獲人類可以利用的模式。

希望讀者能容忍最後一個縮略詞,讓我們大致設想一下 「智能基礎設施」(II)學科,即存在一個包含計算、數據和物理實體的網路,使人類環境更加穩定、有趣和安全。這種基礎設施正開始出現在運輸、醫藥、商業和金融等領域,並對個人和社會產生巨大影響。類似的問題有時會出現在關於「物聯網」 的對話中,但 「物聯網」 通常指的僅僅是將 「物」 放到互聯網上的問題,而我所指的 「智能基礎設施」 涵蓋的是更大的挑戰,包括如何分析這些互相關聯的 「物」 的數據流以發現關於世界的事實,並以比 bit 更高的抽象級別與人類和其他 「物」 交互。

一個 「以人為中心」 的新學科將會出現

例如,回到我的個人軼事,我們可以想像生活在一個 「社會規模化的醫療系統」 中,我們在周圍的醫生和設備之間建立數據流和數據分析流程,從而幫助人類進行診斷和提供護理。這個系統將我們身體里的細胞、DNA、血液檢測、周遭環境、群體遺傳學和關於藥物和治療的大量科學文獻相關信息整合起來,它將不僅關注單個病人和醫生,還關注所有人類之間的關係——就像現在的醫學檢測允許在一組人類(或動物)上進行實驗之後被大規模應用一樣。借鑒當前銀行體系著重解決財務和支付領域挑戰的方法,這將有助於保留相關性、出處和可靠性的概念。然而,人們可以預見到這樣一個系統將帶來的許多問題 ,包括隱私、責任、安全問題等。但這些問題應該被視為挑戰,而不是阻礙我們行動的絆腳石。

我們現在遇到了一個關鍵問題:傳統的仿人 AI 是否為解決這些難題的最佳且唯一的方法?事實上,最近大受歡迎的 ML 已經在一些仿人 AI 相關領域得到了成功應用,如計算機視覺、語音識別、遊戲機和機器人等。所以,也許我們應該耐心觀察這些領域的進一步發展。這裡有兩點需要說明。首先,儘管報紙上不會宣揚這樣一個事實,即仿人 AI 的成功實際上是有限的——我們距離實現仿人 AI 的願望還很遙遠。 不幸的是,仿人 AI 領域一點點的進展和風吹草動都會被媒體關注和誇大,導致過的的興奮(和恐懼),這在其他工程領域並未出現。

其次,更重要的是,這些領域的成功既不足以解決重要的 IA 和 II 問題,也不是必需的。在效率方面,以自動駕駛車輛為例。為了實現這樣的技術,需要解決一系列工程問題,但這些問題可能與人的能力(或人所缺乏的能力)關係不大。整個交通系統(一個 II 系統)可能會更像目前的空中交通管制系統,而不是目前管理鬆散,雖具有前瞻性,但注意力不集中的人類駕駛員。它將比當前的空中交通管制系統複雜得多,特別是在使用大量數據和自適應統計建模來進行精細的決策時。這些挑戰是重中之重,我們也正在為此而努力,因此過於專註於仿人 AI 將會是分心的一件事。

有一些觀點認為,仿人 AI 其實包含了 IA 和 II 目標,因為仿人 AI 系統不僅能夠解決傳統的 AI 問題(例如圖靈測試),它還是解決 IA 和 II 問題的最佳選擇。這樣的論點以前並沒有過。土木工程能靠想像創造一個人造木匠或泥瓦匠就能建立得起來的嗎?化學工程是否應該讓一個人造化學家來創建?更具挑戰性的問題是:如果我們的目標是建立一家化學工廠,那麼我們是否應該首先創造一個人造化學家,然後才能制定出如何建造化學工廠的計劃?

與此類似的一個觀點是,人類智力是我們目前所知的唯一智慧,所以第一步,我們應該模仿它。但是人類其實並不擅長所有推理——我們會有失誤、偏見和局限。而且,關鍵是我們並沒有進化出現代 II 類系統必須具備的大規模決策的能力,也沒有處理 II 類背景下出現的各種不確定性的能力。有人可能會說,人工智慧系統不僅會模仿人的智能,而且會 「糾正」 它,並且還會擴展到任意大範圍的問題。但是,這是科幻小說中才會出現的情況,這種推測性的論點雖然在小說創作中很有娛樂性,但它不應該成為我們在面臨開始出現的重大 IA 和 II 問題時,拿出的主要策略。

II 系統中的演算法和基礎設施的問題不難解決,這些並不是仿人 AI 研究的核心課題。II 系統需要管理分散式知識庫,這些知識庫在不斷發生著變化,並且可能在全球範圍內並不一致。這些系統必須在做出及時的分散式決策時應考慮到與雲端的相互作用,而且必須處理長尾現象,因為可能某個人的數據數量巨大,但大部分個人的數據則很少。另外,它們還必須跨越管理和競爭的界限,解決分享數據的難題。最後,尤其重要的是,II 系統必須將諸如激勵和定價等經濟概念帶入統計和計算基礎設施領域,這些基礎設施將人與人之間,以及有價物品聯繫起來。這樣的 II 系統不僅可以提供服務,而且在創造市場。諸如音樂、文學和新聞等領域正在翹首以盼這樣的市場誕生,讓數據分析將生產者和消費者聯繫起來。而這一切,都必須在不斷演變的社會、道德和法律規範的背景下才能進行。

當然,傳統的仿人 AI 問題仍然值得關注。然而,目前我們專註於通過收集數據,部署 「深度學習」 基礎設施,以及展示某些模仿狹隘定義的人類技能的系統(很少使用新出現的解釋原則)來研究人工智慧,卻極有可能會偏離解決經典人工智慧中重大開放性問題的目標。這些重大問題包括:將意義和推理引入自然語言處理系統的必要性,推斷和表示因果關係的必要性,開發計算上易於處理的不確定表示的必要性,以及開發制定並執行長期目標的系統的必要性。 這些都是仿人 AI 的經典目標,但在目前人們對 「AI 革命」 的喧囂中,我們很容易忘記這些問題其實還沒有得到解決。

IA 的重要性仍將持續,因為在可預見的將來,計算機還是無法與人類在抽象理解現實世界的能力相提並論。我們需要經過深思熟慮的人機互動方案來解決最緊迫的問題。我們希望計算機能夠打通人類創造力的任督二脈,而不是取代人類的創造力(無論這可能意味著什麼)。

約翰 · 麥卡錫(John McCarthy,當時是達特茅斯大學的教授,後來在麻省理工學院任職)創造了 「人工智慧」 這個詞,顯然是為了與諾伯特 · 維納(Norbert Wiener)(當時是麻省理工學院的一位老教授)所提出的 「控制論」(cybernetics)做出區分。維納創造的「控制論」 是指他自己構想的的智能系統——這一系統與運籌學、統計學、模式識別、資訊理論和控制理論密切相關。但另一方面,麥卡錫的理論強調了邏輯之間的聯繫。有趣的是,在麥卡錫術語的旗幟下,維納的理論卻在當今時代佔據主導地位。(然而,這種情況當然只是暫時的,人工智慧中各派系地位的變化比大多數領域都大得多)。

但我們需要超越麥卡錫和維納的歷史局限。

我們需要認識到,目前關於人工智慧的大討論(專註於狹隘的行業和學術子領域)讓我們面臨被蒙蔽的風險,難以看到 AI、IA 和 II 全局範圍所帶來的挑戰和機遇。

科幻小說中的幻想和超人類機器的噩夢有一天會成真並不是重點,我們更關心人類理解和塑造技術 AI 的需求,因為它在人們的日常生活中變得更加現實和有影響力。此外,在這種理解和塑造中,我們需要來自各行各業的不同聲音,而不僅僅是技術方面的。狹隘地專註於仿人 AI 也會屏蔽掉更廣泛的聲音。

雖然行業將繼續推動發展,但學術界也將繼續發揮重要作用,它不僅能提供一些最具創新性的技術思想,而且還可以將計算和統計學科的研究人員與其他領域的研究人員,特別是社會科學、認知科學和人文科學領域的研究者,他們的貢獻非常有意義且必要。

另一方面,雖然人文和科學是我們前進的關鍵,但我們也不應該假裝我們正在談論一個規模和範圍空前的工程,我們的社會從古至今一直都在致力於按照規則建造新的人類文明,人工智慧也不例外。我們不希望原本旨在幫助我們獲得醫療、交通便利和商業機會的系統,到最後被發現並不能很好地工作,它們犯下的錯誤讓人們的生活和幸福受到影響。在這方面,正如我強調的那樣,我們至今還沒有形成一個聚焦於數據和學習的學科。它們的出現將非常令人興奮,但目前還未能構成一個工程學科。

而且,我們應該接受這樣的事實:我們正目睹一個新的工程分支出現。「工程」(engineering)這個術語通常是指學術或其他領域的狹義定義——冷酷無情,不受影響,並暗含失去人類控制的含義。但是工程學科可以按照我們想要的來創造。


在當今時代,我們有一個真正的機會來設想一些歷史上不曾出現的新事物——一個以人為中心的工程學科。

我拒絕給這個新興的學科命名,但如果仍用首字母縮寫詞 「AI」 繼續作為術語,我們應意識到它的限制性。反之,我們應該有大局意識,少一點炒作,並認識到未來面臨挑戰的嚴峻性。

致謝:在寫這篇文章的時候,有很多人對我有很大的幫助,包括 Jeff Bezos,Dave Blei,Rod Brooks,Cathryn Carson,Tom Dietterich,Charles Elkan,Oren Etzioni,David Heckerman,Douglas Hofstadter,Michael Kearns,Tammy Kolda,Ed Lazowska,John Markoff,Esther Rolf,Maja Mataric,Dimitris Papailiopoulos,Ben Recht,Theodoros Rekatsinas,Barbara Rosario 和 Ion Stoica。我想特別感謝 The House 的 Cameron Baradar,他們最先鼓勵我寫這樣一篇文章。

閱讀原文:

https://medium.com/@mijordan3/artificial-intelligence-the-revolution-hasnt-happened-yet-5e1d5812e1e7

作者介紹

Michael I. Jordan 是加州大學伯克利分校計算機科學與統計學教授。他在計算、推理、認知和生物科學領域工作了三十多年,曾在加州大學聖迭戈分校就讀研究生,後在麻省理工學院和伯克利分校從事教師的工作。他最近擔任的職位之一是作為 AI @ The House 的合作夥伴和創始人,這是一家位於伯克利的風險基金和加速器。該基金旨在不僅支持人工智慧項目,而且支持 IA 和 II 項目,並且支持在大學環境的背景下研究這些項目,不僅包括工程學科,還包括社會科學、認知科學和人文學科。

據 2016 年《科學》報道,邁克爾 ·I· 喬丹是當今世界最有影響力的計算機科學家。值得一提的是,喬丹的許多學生和博士後包括 Zoubin Ghahramani, Tommi Jaakkola, 吳恩達, Lawrence Saul 和 David Blei 等,也已經成為機器學習領域的重要學者。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

華為張寶峰:NPU釋放端側AI算力, HiAI帶來雲+端+芯三位一體能力
【看圖識演算法】這是你見過最簡單的 「演算法說明書」

TAG:新智元 |