專欄 | 對話OpenAI Jack Clark：中國是人工智慧領域的領軍者

科技 10-20

機器之心專欄

來源：eye-on.ai

Eye on A.I. 是由紐約時報資深記者 Craig S. Smith 主持的一檔雙周播客節目。每一期節目，Craig 都將與這一領域有影響力的人物進行交流，推進廣義環境中的機器智能新發展，思考技術發展新蘊意。

機器之心為此系列華語合作方，為大家帶來此對話的中文譯文，讀者可點擊「閱讀原文」查閱原英文字幕對照收聽音頻。以下為此系列內容的第一篇，Craig Smith 與 Jack Clark 就全球 AI 發展進行了探討。

大家好，我是 Craig Smith，這是我創建的一個關於人工智慧的播客。今天與我對話的是 Jack Clark，他是很受歡迎的 Import AI 新聞訂閱源的作者。今天我們要談談他過去一周了解到了什麼以及為什麼這很重要。Jack 是英國科技雜誌 The Register 和 Bloomberg News 的資深行業老兵。他現在也為 Elon Musk 資助的非營利性人工智慧研究公司 OpenAI 工作，致力於政策和溝通問題。所以你可以把今天的播客看作是對當前人工智慧世界的概覽，而且是來自一位最敏銳的觀察者。

Craig：首先，我想談談本周訂閱的最後部分的內容，其中你談到了有關達沃斯世界經濟論壇上所涉及的內容。有一件事上了很多頭條，當然也引起了我的關注，那就是谷歌的 CEO Sundar Pichai 對 AI 崛起的評論，他說這比發現電甚至火還要重要。而且你也能看到很多類似的評論。但是，這些話從 Pichai 口中說出，還是挺讓我驚訝的，儘管我沒有密切關注過他。在你看來，這樣的表述是否誇張？

Jack：

並不誇張。而且我覺得他能正面談論這個問題是很值得稱道的，因為有很多公司高管都一直在講，這項技術和之前的顛覆性技術有一樣的屬性，比如智能手機的出現。實際上人工智慧技術的本質存在根本性的不同。而且儘管當我們聽到人們談論電和火時，我們會認為他們說得實在太過誇張，但我相信如果你思考一下 AI 會在未來的幾十年，而不是幾年，會如何發展，我們回頭看時也會有一樣的感覺。從歷史角度看，很可能看起來就像是計算機突然就發明出來了，之後很快計算機就具有了接近人類的能力。在那之後不久，我們看到 AlphaGo 這樣的計算機很快超越人類的事情出現了。這是非常不同尋常的，我認為這意義重大。

Craig：是的，我同意。我想我只是對時間軸有些疑慮。我能想見超級智能和智能爆炸會在人類歷史的某個節點發生。只是我並不樂觀地認為會在這個世紀發生。但未來會發生……

Jack：

嗯，其實並不需要是超級智能。我要反駁一下你的看法；當然，如果確實出現了，那超級智能顯然是個大事件。但人工智慧成就重大的變革並不需要超級智能的出現。

想一想資料庫或電子表格的出現究竟給世界帶來了多麼大的變化。讓計算機管理複雜繁瑣的文本信息是推動實現全球化的一大力量。現在，我們有能力讓計算機具備基本的人類感知能力，比如對視覺的近似、對聽覺的近似，而且它們將生活在一個實際上為人類的聽和看而構建的世界裡。

所以，只要嘗試想像一下現在計算機能夠使用多少信息，然後再思考一下過去 30 年電子表格或資料庫所造成的影響，那我就能讓你明白我們並不需要超級智能就能改變世界，而且改變的程度將遠遠超過數字革命迄今所造就的一切。對我來說，這非常讓人振奮。

Craig：是，我當然認同這一點。他談到了對全球多邊框架的需求，而且 Theresa May（英國首相）也樹立了國家的旗幟，要成為 AI 道德倫理方面的領導者。

考慮到我們在核能技術或核武器技術方面如此地不成功，我們真能構建一個各個國家都會遵守的多邊框架嗎？這是不是過於樂觀？

Jack：

在座的我們兩人都不能說出在第二次世界大戰之後地球上有誰因為憤怒而使用了核武器。另外，我也要對你說，我們建立了一些有效的機構，因此我們現在才沒有談論廣島和長崎事件之後的悲劇。有大量的證據表明我們圍繞核武器所構建的國際治理體系是有效的。當然也存在問題。現在是 2018 年，現在我們離核毀滅結局的末日時鐘僅有兩分鐘了，這是很長時間以來最接近毀滅的時間。但不管怎樣，我們仍在堅持。

所以，不，我並不認為這過於樂觀。我確實認為這有些樂觀，尤其是某個來自英國的人想成為領導者，而這個國家正在脫離歐洲，因此也將脫離一個有力量的區域。我也確實相信我們能看到各個國家合作構建各種 AI 標準。而且我還相信你肯定會看到圍繞 AI 的國際社區開發出相應的規範，約束其在軍事上的應用。

除了少量惡人之外，現在我們已很少看到人們使用化學武器和集束炸彈這樣的武器，這都多虧了國際規範的建立。是的，確實存在例外，但我們知道我們能做成這件事，只是極其地困難。但困難並不意味著我們應該迴避這個問題。

Craig：是的。但我想人工智慧終究不同於集束炸彈，在使用時被檢測到的難度要大得多。對於 Theresa May 宣稱英國將成為 AI 領域領導者的言論，就我看來，因為我的工作很多都在中國，我覺得中國才是顯而易見的領導者。原因很簡單，因為他們有一個由中央掌控的經濟模式，得益於此，他們有大量不在乎成本的國有企業和機構。他們擁有最多的人口，並且正在培養最多的工程師。

你認為英國這樣的國家有機會成為領導者嗎？另外，對於這種西方國家想要控制的框架，中國這樣的國家會參與進來嗎？

Jack：

這個問題真的非常複雜。我會將其分成幾個小問題來說。英國這樣的國家有機會嗎？我表示懷疑。因為我們知道 AI 需要從國家層面佔領科學和技術發展的制高點。儘管英國有一些 AI 優勢，但我認為很大一部分優勢都源自 Facebook、谷歌和微軟等美國公司對英國的投資。英國的創業生態環境也在某種程度上取決於此。

May 首相讓人覺得這完全是國內發展起來的，但如果你看看是什麼因素帶來了這樣的發展，你會看到實際上來自別處，那裡有多得多的資金，而且有更廣泛的科學和技術文化。

接下來的問題是，我覺得美國、中國、印度或俄羅斯等更大的國家，甚至通過其特定的投資，能夠成為國際 AI 發展的領軍者嗎？是的，很有可能。我認為我們將看到力量核心的興起。

現在回到關於規範的問題，這些不同的力量核心會尊重大多數人試圖設立的這些規範嗎？基本上不會。基本上而言，人們會繼續做他們一直都在做的事情，也就是發展自己的經濟，在地緣政治邊緣政策的國際博弈中互相競爭。但是，仍會有不同之處，你之前也提到過，AI 有可能造成很大的傷害，所以這會激勵人們圍繞特定的規範進行合作，這就涉及到了人們開發和使用 AI 的方式。即使你對自己如何參與國際舞台上的競爭有自己的看法，你也會希望能夠對你的競爭者或對手以及他們使用這項強大技術的方式具有一定的信心。

所以，我確實認為你提到的中國這樣的國家有動力去遵守一些規範。但我也確實認為他們會遵守的規範的數量會相對少一些。

Craig：是的，我們之前談過這個，問題是中國是否會公布他們所做的一切。我想你肯定也同意，中國在做的很多事情沒人能看到。這肯定會引起某些擔憂。

你在本周的訂閱消息中還寫到了另一件事，佛羅里達州的一個學生使用計算機視覺和深度學習創建了一個對流行的多玩家網路視頻遊戲《英雄聯盟》的實時概覽。讓我驚訝的是這相當簡單而且成本低，不管是資金成本還是計算時間。這個傢伙成功提供了一個解決方案。

這也凸顯出其實存在很多可以使用的數據——如果你知道如何使用的話，因為他的這個項目其實就只使用了遊戲視頻。除此之外，我不確定我明白他所做的工作在遊戲世界之外的應用。讓我驚訝的人這個佛羅里達的學生僅用少量資金和公開可用的數據集就提出了一個解決方案。我想將會有越來越多這樣的事情出現。

Jack

：

是，我認為你談到了一個真的非常讓人感興趣的觀點。為什麼有趣呢？嗯，並不是因為他們有能力為電子競技創建炫酷的小道具，或者說為你和大部分人都沒聽說過的計算機遊戲。

真正炫酷的是這個小道具讓他們可以獲取有關遊戲的信息——遊戲公司可以通過提供給開發者的遊戲應用程序介面來提供，但卻沒有選擇這麼做。所以，從某種程度上講，這個項目的重要意義在於他們只是證明可以使用這種強大的技術來處理從遊戲中收集到的數據。這麼做本質上是讓深度學習演算法臨時創造了公司不希望人們訪問的底層 API。

所以，當我們思考這個項目的意義時，這真的會勾起我們對專有軟體的工作方式的疑問。因為專有軟體的假設是我能向你出售某個軟體，因為你能從這個軟體獲得價值，你不能就通過觀察這個系統的輸入和輸出就克隆出這個軟體。

而我們現在可以感受到，使用很多 AI 技術，我只需要輸入和輸出就能構建出其它部分。這不禁會讓我們思考這個時代的 IP 保護方式和基於 IP 的商業業務。

Craig：確實，佛羅里達的這個學生只用開源軟體和公開可用的數據就創造了這個出色又有趣的方案。這樣的工具現在有很多，比如 Facebook 就公開提供了 Detectron。你覺得，從重金支持的實驗室到車庫就能生產的東西，這種 AI 的民主化快要來臨了嗎？我的意思是人們能在家中自己動手就做出重大的成果嗎？

Jack：

不行，很遺憾。我可以解釋原因，我不知道我的回答是否會讓你感到失望，以至於你不想繼續談。你想要我解釋我認為這做不到的原因嗎？

Craig：我很樂意聽，請解釋。

Jack：

你看到的那些公開項目都源自大公司的計算紅利。他們投入了大量電費來開發某些性能卓越的系統。這裡說的是一個能讓我為世界繪上邊界框的研究平台。這代表了技術研發的基本商業化效應。這意味著世界各自在自家車庫中創造的人現在都可以獲得這種基本能力了。

以同樣的方式，可以讓網路相機觀察世界，然後提供其圖像中最可能存在的事物的標籤。現在已有這樣的商品了。你還可以將你的相機對準某個特定的物體，就能得到有關它的大量信息。或者你可以指向特定的區域，就能讓它為你提供一些有用的信息。

但這些都代表不了技術前沿。技術前沿會存在於大得多的計算機上，比任何創業公司所希望的或個人在車庫中所用的計算機大很多。這會需要一些尚未出現在研究論文中的研究技術。在能力的差別將具有重大的影響。

AI 世界目前每隔六個月就會大變樣。過去這個時間段是好幾年。更早之前甚至要每隔十年才有大變化。這項技術正在倍速發展，變革周期也在縮短。所以，Facebook 等巨頭的競爭優勢將會隨時間越來越大，因為他們有能力研發越來越龐大的模型。我可以舉一個非常形象的例子。

如果我有一家創業公司，我可以使用 Detectron，我也可以使用殘差網路、highway 網路或其它的先進深度神經網路系統。我甚至能獲得數據。但如果要做出一些有用的東西，我仍然需要使用自己的數據來訓練一個模型，這需要一定的時間。訓練時間的長短取決於我能夠使用的計算機。我不知道你的車庫有多大，但我敢說肯定不會有足球場那麼大。然而，Facebook 的計算機能擺滿足球場。這意味著當 Facebook 想要做點研發時，開發速度會超過任何在車庫中搞開發的人。

所以，如果 Facebook 的實驗能力和發現新 AI 技術的能力與其所能使用的計算機數量成比例，那麼這個世界上就很難有創業公司能輕鬆與這些 AI 巨頭競爭，因為他們根本沒有足夠大的計算機來幫助他們足夠快地完成實驗。就算創業公司能從這些公司取得一些計算紅利，也難以與之抗衡。

Craig：也許這些計算紅利能夠產生回報，比如做巨頭沒有興趣或不願花時間的更小型的應用。

你還寫到了 DroNet，這是一個瑞士和西班牙的大學之間的一個聯合項目，目的是訓練能在城市街道上飛行的無人機。他們使用了來自自動駕駛汽車的公開可用數據並且使用了自行車創建了自己的數據集。我覺得這也是個不錯的項目，同樣沒有用到巨額投資，同樣基於開源技術。我想他們用的是 Parrot 無人機，一種較便宜的消費級無人機。這些應用中的計算紅利是否會開始在更局部的層面上發生？

Jack：

是的，在某種程度上，你會看到在這些邊緣位置的一些創新。這當然是肯定的。他們訓練無人機所用的數據集包含兩部分。

一是自行車。他們沒有優良的撞車數據集。所以他們給一輛自行車綁上了一個 GoPro 或類似設備，然後故意讓它撞到障礙物來模擬撞車情形。我很高興能在他們的論文讀到這一點，因為他們並不是簡單地直接生成數以萬計的撞車事件。對於不得不去做這件事的研究者，我表示同情。

他們實際上做的是先加速沖向障礙物，然後故意減速，並將障礙物標記成無人機應該避開的東西。所以當然他們生成了一些自己的數據，但你也會注意到實際上至關重要的數據是真實的汽車駕駛數據，這些數據能告訴無人機如何轉向、如何按道路行駛。這些數據來自 Udacity。是 Udacity 為自動駕駛汽車在線教育課程所生成的數據集。

Udacity 自動駕駛汽車在線教育課程由 Sebastian Thrun 主持，他曾幫助設計了谷歌的自動駕駛汽車。Udacity 本身得到了風險資本的數千萬美元投資。而且在谷歌的自動駕駛汽車項目上秘密工作了四五年後，Sebastian Thrun 也知道如何創建這樣的數據集。但這些都不能讓我信服地表明谷歌失去了任何一點領先優勢。

事實上，剛好相反，我們現在看到的都已經是後期的研究項目，是那些公司很多年前的投資所產生的成果。這些公司的項目對我們而言都有一定程度上的不透明，能力如何也並不非常明顯。是的，DroNet 確實有些值得關注的能力，比如能做些有用事情的無人機。但想像一下，如果用谷歌那巨大的內部自動駕駛汽車數據集來訓練無人機，無人機的性能會好多少？

我覺得現在你已經明白，Waymo 知道自己立馬就能訓練出一個比那篇論文好很多的無人機導航模型，因為他們擁有的圖像遠不止 70000 張，而是 7 億張。

我還想強調一下這個觀點。AI 生態系統中很難再具有有效的競爭。還沒有任何證據能讓我相信創業公司能輕鬆地活下去。事實上，我看到的所有證據都指向了反面。

證據表明，創業公司要麼使用大公司的計算紅利，要麼就抓住大公司投資滯後的間隙，否則他們就要在大公司具備天然優勢的領域與之競爭——大公司只要利用一下這個優勢，就能輕鬆碾壓創業公司。

Craig：這是否說明聰明的年輕工程師基本最終都會為谷歌、Facebook、Uber 或亞馬遜等巨頭工作？

Jack：

是的，在我看來是這樣。這向我們表明使用開放的工具開發 AI 並做出貢獻是很容易的，而很多工具都是由這些大公司提供的。我還沒看到任何一家新興的創業公司具備真正超越頂級學術研究機構的能力，更別說超過那些大公司了。

在我看來，AI 將會挑戰我們的很多反壟斷觀念以及很多有關技術競爭方式的觀念。因為就算大公司開源了大量資源或通過研究論文公開了研究成果，技術實力的差距還是會越來越大。這是非常矛盾的，這意味著監管者看到的現象都表明這個市場是健康的，因為有創業公司，也有大量開放的創新，還存在很多共享。

但如果究其根本，看一看資金的來源，誰有能力支撐數據或計算業務的戰略資本，誰擁有人才，你就會發現正是那些大公司像頑疾一樣掌控了競爭的基礎。

Craig：是的。承受壓力的是公司，不是國家。

Jack：

我們不能從國家方面來看待這個問題，因為目前還沒有國家表現出連貫一致的科研議程。

對於中國這樣的國家中的組織機構而言，你會看到在政府、私營企業和公共部門之間存在非常緊密的聯繫。但其中沒有任何一個能說是中國的研究。更像是在追趕谷歌、微軟和亞馬遜等公司時所不得不做事——必須打出手中的每張牌。

對於中國的情況，他們有大量數據，有大量內部商業，就像你的公司一樣，另外政府還有能力和資金讓事情發展更快並且實現加速。但我要說沒有任何論文是中國特色的，我也不會說「哦，這篇論文是比利時風味的，或者說那是一篇德國的論文。」

我認為我們還沒到這些力量核心能夠體現出來的時候，但從國家 AI 研究計劃的實現角度看，它們將會得到體現。實際上中國是唯一一個在國家層面上推動 AI 研究的國家，而且它才剛剛開始。所以，我們還需要等上三四年時間才能看到這些初期投資的成果以及他們所選道路的目的。

Craig：這讓我想起了 PsychLab，我覺得這個項目很激動人心。我想這應該是心理計量學（psychometrics）方面對比人類智能測試 AI 的開始。你能談談這方面嗎？

Jack：

PsychLab 是一個來自 DeepMind 的深度學習和強化學習測試套件。PsychLab 不僅能讓我們測試和評估強化學習演算法的性能，還能讓我們了解它們在人類心理學測試上的表現。這意味著現在你可以基於認知科學測試 AI 演算法，你還可以讓人類來進行同樣的測試，然後比較他們的結果。

在我看來，最有意思的是 PsychLab 能讓 DeepMind 的科學家知曉某些與他們的演算法的相對表現和缺陷相關的非常有價值的數據點。在一個案例中，他們執行了一項測試——詢問他們所測試的來自一個名叫 Unreal 的系統的強化演算法，哪個系統是表現最好的以及得到了最好調節的。

他們讓它執行了一個認知科學中非常基礎的測試，即查看不同集合的同心圓。這被稱為碎玻璃問題（shattered glass problem）。目標是確定哪一組具有最大的同心度。他們發現，相比於人類，Unreal 智能體的表現非常差。他們給出了假設，也許其表現差的原因是這些 Unreal 智能體的注視和視覺系統的工作方式與人類視覺的工作方式存在非常大的差異。

所以，最後他們實現了一個嚴重依賴於所謂的中央凹視覺（foveal vision）的視覺系統，即你的眼球中央所具有的感受器多於周邊時的視覺。這能讓你重點關注近處的物體，並且你視覺中心的事物在你眼中的解析度也更高。

使用傳統的卷積神經網路，感受野會在所有位置均勻分布。他們所做的是將神經網路的感受野進行聚焦，正如你的眼球所實現的中央凹視覺一樣。他們發現，他們不僅能創造出能以接近人類的水平通過這些測試的智能體，而且還能將完全一樣的智能體放入被稱為激游標簽（laser tag）的強化學習環境中，這沒有在這個測試套件的任何地方測試過，實際上更像是你與朋友玩的虛擬彩彈遊戲。他們發現突然之間他們就創造出了擅長應對這一環境的 Unreal 智能體，並且達到了他們之前從未達到過的水平。

這說明，通過在他們的智能體上執行這樣的心理學或認知神經科學測試，他們實際上找到了一個缺陷，並且修復了這個缺陷並使之通過了測試。然後他們將這個智能體用在了 PsychLab 的標準測試方案之外，也仍然表現優良。在某些案例中，其在之前從未見過的全新任務上也取得了突出的表現。

我覺得這振奮人心，因為這為我們提供了一種全新的思考方式——我們可以如何對這些演算法進行壓力測試，科學家可以如何將額外的工具用在他們的實驗套件中以幫助他們進行診斷。

Craig：這種中央凹視覺修復確實讓人著迷。另一件事我覺得也很有意思，即 Unreal 智能體與人類在玻璃圖案測試（glass pattern test）中所表現出的差異。其中一個點是白色，另一個點是黑色，人類和 AI 智能體都不能有效地識別這種圖案。我覺得這個問題很讓人著迷。所以，在認知處理中，存在某些讓人類和人工智慧體都束手無策的東西。

另一個讓我印象深刻的是其分析思路。在他們的論文中，他們談到了卷積神經網路在 GPU 上並行處理特徵的方式。但人類對視覺數據的處理方式主要是串列處理。他們提出了一個問題：為什麼進化沒有為人類提供這種看起來更具優勢的能力呢？

但然後他們就注意到，串列處理的主觀體驗非常類似於思維的本質。因為我們是按序列串流的方式思考的，我覺得這個問題很迷人，讓人開始明白人類心智過程並不同於人工智慧體的處理過程，這也許能夠為我們的主觀體驗提供某些解釋。我不知道你是否認同這一點，但我覺得這很有吸引力。

Jack：

我認為如果 AI 繼續發展，我們將會了解到有關我們自身偏見和偏好的非常讓人驚訝的事情。因為我們能夠創造一個能反映我們自身的認知系統，就像一面鏡子。

當你在早上或夜晚窺鏡自視時，你能看到自己，但你實際上並不能從鏡子中看到你的大腦認為你應該在這個世界中如何行事。因為並不存在能夠模擬另一個人的鏡子。我們看待他人時，只是將我們的模型套在他們身上。

這些 AI 系統和 PsychLab 向我們表明，隨著我們的智能體越來越有創造力和先進，也許我們可以創造出類似認知之鏡的東西，我們可以從其中看到處理同一任務時不同的思維和處理方式，這樣我們也能更理解我們自己。我覺得這很激動人心。