當前位置:
首頁 > 最新 > Hofstadter在集智俱樂部的講話

Hofstadter在集智俱樂部的講話

4月18日下午,侯世達參與的由騰訊研究院、集智俱樂部、湛廬文化、葦草智酷聯合舉辦的 AI&Society 第五期活動,發表主題演講並參與圓桌論壇,探討人的創造力和人工智慧。筆者全程觀看了直播,現在將其整理記錄,以便日後查閱。感謝這次活動的主辦者!

記錄分成Hofstadter的講話和觀眾嘉賓提問兩個部分。

GIF

Hofstadter的講話

1、Machine Translation

在討論MT之前,我們先來講講語言和概念。

年輕的時候我讀了《Crime and Punishment》(《罪與罰》)這本書,這本書是俄語所寫,我讀的是英語的譯本,那麼我看它的譯本算不算看過這本書呢?Parthenon(帕特農神廟)位於希臘雅典,可我只去過Tennessee(田納西州)的Parthenon,那麼我算不算去過呢?

我們再來看一首中國著名的古詩,王維的《鹿柴》:「空山不見人,但聞人語響。返景入深林,復照青苔上。」這首古詩有無數譯者嘗試將它翻譯成英文,我們之後會提到。

現在我們再看MT,它從1947年就開始興起。1959年Yehoshua Bar-Hillel發表了一篇著名的論文《 fully automatic high-quality machine translation》(簡寫FAHQMT),他在這篇文章中就提出MT的不可行性。現在我們來對世界上一些大企業的翻譯工具進行測試吧。(以下的翻譯於2018年3月16日在谷歌翻譯進行。)

讓我們看第一句:「Little John was looking for this toy box. Finally he found it. The box was in pen. John was very happy.」因為pen這個詞有著兩個含義:圓珠筆和牢(畫地為牢的牢),在將其轉換成中文和法文的過程中發現結果都失敗了,在這個點上谷歌翻譯的結果都是「盒子在筆中」,而讓人翻譯就不會出現這種問題。這是因為我們知道筆和牢的大小,我們有著足夠的背景知識來應對這一切。而拓展到不同領域不同語境下,成功的翻譯意味著機器需要具有百科全書的知識,這一切我們就不深入討論了。不過我們可以看到現在的一些技術,DL基於多層的ANN以及大數據擁有的雙語海量資料庫並沒有體現機器對世界的理解,它們只是在上下文的背景進行翻譯,而不是在世界背景下。

(接著侯道仁教授又舉了shingles這種具有多義詞語的例子,有趣的是谷歌翻譯在此時有提示是不是句子次序輸入亂了,但總的來講都是不成含義的。)

人工智慧的概念是上個世紀40年代英美髮明的,當時主要是研究哲學和思維的問題,是來探究機器的意識。1950年Alan Turing提出了著名的「The Turing Test」,1965年Joseph Weizenbaum提出了著名的概念「The Eliza Effect」,他指出機器儘管什麼都不會,可是它的一些輸出的引導,會讓人覺得機器都理解了,人以為機器的理解和人的理解是一回事,或者說人們高估了機器的理解能力,人看到機器的輸出就會將它想成人的思維方式展開聯想產生「它是智能的」的錯覺。

在當時我寫《GEB》這本書的時候,對人工智慧的研究主要是在大學,當時主要是用來研究哲學問題,這是十分有趣的。可隨著時代的發展,人工智慧的研究陣地慢慢轉向了大企業,它的目的也主要和商業開始掛鉤。同時,媒體對AI方面技術的炒作(Floods of 「hyperboler」),比如對DL等的誇大,這都使對該領域不甚了解的群眾開始困惑。

儘管AI在一些領域有所成就,比如:

Chess

Speech Recognition

Self-driving cars

Music composition?

Joke creation??

MT???

按這個順序從上到下,這些領域能獲得成就的可能性在不斷降低。

(可能出於對中國文化的喜愛,侯道仁教授又舉了楊絳《我們仨》中的「南書房行走」的例子,這句話要追溯到當時的歷史背景,所以MT的結果更是糟糕。)

2、關於GEB的翻譯

嚴復提出了翻譯的三要素:Fidelity、Intelligibility、Polished style(信達雅)。在翻譯《GEB》的時候發現很多例子按字面意思翻譯了還要加許多註解,一本《GEB》下來可能要上千個註解,這實在是我不想看到的,所以我派了我的學生David Moser(莫大偉)去了中國協助翻譯,他後來也喜歡中國文化留了下來,之後又派過一名博士前往。在馬希文、吳允曾等人的領導下花了八年時間終於成書。翻譯其實也是再創造的過程,我很希望翻譯成哪國語言就應該接地氣,結合當地的文化。比如在書中英語兒歌「Three Blind MIce」就被換成了中文的保衛黃河,因為這兩首歌都是三段式。此外他們也給我取了名「侯世達」,我也表示接受(現在還是叫侯道仁)。在我的新書《表象與本質》里,劉健等人也將裡面的一些意象做了類比:紅酒專家變成了品茶專家,義大利面大廚變成了豆腐大師,同時用了大量的成語。這是我非常滿意的地方。這本書除了英文版中文版還有法文版,我可以說三版各自獨立,各自基於自身文化。我常這樣鼓勵他們:「The more unfaithful you are to us on the surface level,

The more faithful to us you will be on the essence level!」

記住,analogy(類比)是很重要的!

3、回到MT和AI

現在我們回過頭來看下開頭說的《鹿柴》這首詩,我嘗試地翻了一下,發現有點瑕疵,仔細更改了之後覺得要與詩句這種格式相對應,所以進行了這樣的排版,最後我發現中文是方塊字,我的字體也需要改變,最終形成了這一版本。

所以對於MT,我是這麼看的:

二、觀眾的提問

GIF

1

石雪松:

AI在一些領域的進步有目共睹,比如CV、 Chess、NN,能不能請您分享一下AI的進展?我們能否再進一步?

侯道仁:

NYT這樣的一些雜誌鼓吹DL的革命性變化是很荒謬的,我是人類思維的堅定捍衛者,對MT能超越人類深表懷疑。翻譯是非常具有藝術的事情,要基於整個世界的背景,而現在無論是情感還是辭彙MT都不成文。現在AI的一些成果,比如圍棋是因為其對世界的了解不需要那麼多,更多是一些數學問題,而在CV領域計算機也經常會被玩弄。我其實並不期待計算機達到人類的水平,我認為這是很危險的事情,我也不知道我們的方向,但發展AI是大的潮流,在40年前我可能理解一些人為什麼對AI的發展那麼樂觀。這是因為大家都在思考哲學問題,可是現在大家都不再關注哲學,企業界急功近利,這一趨勢已經無法逆轉。至於AI的成果,你說到現在這些成果是質變還是量變?機器的認知不會無緣無故突然達到人類的水平。《GEB》這本書的觀點不會修改,只是擴展,它的精神永遠不會過時。AI的突破看起來很積極,可是我不想看到有革命,我會很傷心的,可這是一個很長的故事了。

2

王 培:您說analogy是可以幫助人們理解智能的本質,那麼這種機制離我們多遠呢?

侯道仁:這個問題很好,情感是人類的重要維度,沒人能否認思維與情感的聯繫。而類比很多就涉及情感,昨天我已經舉了很多例子了,就不再列舉了,只能說感情對思維很關鍵,這也是它的一部分。

3

某學生:您說類比就像思維的燃料,可是對於科學的研究,邏輯思維、演繹推理已經是科研的範式了,那麼這種類比的意識對我們科研有哪些發展呢,我們這些範式會不會也會有所變化呢?

侯道仁:其實你只要熟悉科學史,就知道世界上那些深刻的見解並不是演繹推理得到的,都是通過類比實現,比如波爾、普朗克、愛因斯坦、玻爾,我不知道科學家們為什麼對類比的貢獻默不作聲,他們應當揭示而不是隱藏,弄得不清楚的人都以為科學界的那些重大發現都是推演得到的。每個人自發的就會類比,我們平時接觸的那些不同領域的知識可能埋在潛意識裡面「慢慢忘記」,我們必須記住類比是所有概念的根源。現在人們研究AI不再是為了好奇而是為了賺錢了。1975年我寫完《GEB》的時候絕不會這樣想:AI將在人性的領域挑戰人類。事實證明當時我錯了,我感到震驚和擔憂。我們可能需要一些能思考的實體來代替人類,但不是將情感什麼的代替掉。

4

張 江:(張江是主持人,集智俱樂部創始人)

當年我在看完《Complexity》(《複雜》)之後就有想投身這個領域的想法,在看到《GEB》之後,我感覺被擊中了,決定畢其一生為此奉獻,所以才有了這些網站論壇。我想給您展示下我們的一些小發現,就是用攝像機、電視和兩面鏡子構成的視覺反饋迴路是一道長廊,可是在我按了zoom in按鈕之後,突然就產生了非線性的複雜結構,宛如星系爆炸宇宙誕生,我一下就著迷了。另外送您這本我們集智俱樂部共同編寫的《科學的集智》,裡面寫了對您《GEB》的讀書感悟,希望您能過目,謝謝。也想請您講講《GEB》,不用說裡面的內容,說說讀者反饋呀什麼都可以。

(接著侯道仁教授應邀講了講他年輕的時候著迷於哥德爾的理論,突然間想到自指的概念,所以就有想法,然後與兩個朋友莫大偉、丹伯格的相識的故事,都源於《GEB》,有趣的是莫大偉和丹伯格都是音樂系出身的科學家。)

5

段永朝:(葦草智庫創始人)我是您的粉絲,粉了您三十多年了。侯道仁教授並不是不想AI

發展,而是他有一種悲鳴情懷,他並不反感AI攻城掠地,可卻並不期待這個目標實現,因為這個目標一旦實現,那麼這個世界對我們人類而言將會索然無味。您強調不同語種跨語境的對話,機器在不斷突破去榨取意義,可仍然無法創造意境。而意境只有人類能夠理解,這種體會在道教叫做只可意會不可言傳。佛教則稱:妙不可言。

候道仁:我很慚愧我學了十幾年中文,可是語速快還是聽不懂,聽力始終有困難。我的處境很微妙,在中間位置。我為我聽力感到悲哀,但還是理解了你說的內容。其實總的來講我還是有點悲觀的。我不喜歡無人車的想法,開車是個樂事。其實早在80年代的一些研究,他們的機器有的是理解了文字的,但當時因為資金不夠種種原因終止失敗了。可是現在所有翻譯方式忽視了意義,只有再往後發展,意義的重要性才將再次出現。我不喜歡MT能成功,可這是一個浪潮,必須等待到來。

6

賢度大師:(龍泉寺人工智慧與信息技術中心主任)

您的書讓我獲益匪淺,我發現一些想法與佛教一些理念很像,比如我們在自己創造的世界如何理解自己?或者說我們在夢裡能不能知道我們正在做夢?在佛教我們稱這個叫「業」,業是自己創造的,卻又決定了我們的命運。我想問的是,我們的世界時時處於無窮的自指,不會crash, 而計算機在做無窮遞歸這種類型的計算就會出現物理內存不夠而出現crash的現象,而我們的世界就不存在,想問下我們能否創造這樣一條不會crash的計算機?

侯道仁:我不知道能否回答,因為人也會死機,人會瘋會自殺。《GEB》寫的時候想解釋自我如何跳出怪圈,就像哥德爾,然後我還找到其他類似事情,比如遞歸函數,集合了很多主題於一身。但其實我的核心是那個大寫的「我」。比如我之前的書《我是一個怪圈 》就在強調我的那個主題。我們可以類比一下,假如中國這個整體自己寫個自傳,它可能先提其他的國家歷史,講講韓國日本,但我們講中國歷史,會講人。所以我們就會疑惑中國自傳為什麼沒人,中國會表示自己不知道這些人,中國解釋說我知道山脈、戰爭、文化可是沒聽過組成我的那個人。就好像我們現在知道自己大腦是腦細胞組成的,可是兩百年前的人都不知道啊,作為人發明了概念想法,可我們不認識腦細胞。我們知道笑話,卻不知道牽涉的神經元,不會分析硬體,其實我們根本不了解自己。但我們在人的整體上去描寫,忽略微觀。我們創建了一個簡化的模型,僅此而已,因為這樣更高效。更高的層面對我們而言是真相,而微觀的是未知的。後來我們開始試著了解自我。所以我們作為人,我們也同樣如此思考問題。比如自動駕駛汽車只了解目的是為了繞開障礙物,可它並不了解自身計算機組成的部分。我也聽過德國科學家想創建自指的機器,哥德爾機,但他根本不可能成功。

7

王小川:(搜狗CEO)

我看《GEB》比較晚,和張江一樣也是看了《Complexity》,就覺得很有意思,後來看到《GEB》就感覺開了很多腦洞。比如以前只理解線性系統可預測,非線性不可預測。後來發現生命完全超越了複雜性,還具有秩序。我在之後的工作研究中也經常類比低層生命、高層生命。(侯道仁把複雜性聽成了flashing哈哈)我發現您說的自指真實存在,不止計算機,比如您提到的DNA和對它翻譯轉錄的細胞質本身也有DNA,這讓我重新思考我們和世界的關係。以及您說的把文字發射到外星,我們搜狗就是做信息的,所以我思索信息的意義,還是外在的解讀,這讓我腦洞大開,重新審視了信息文化的關係。另外讓我很開心的是,對我們計算機出身的人而言,哥德爾是我們熟悉領域,埃舍爾和巴赫卻是藝術,而您將藝術與計算機連接讓我更開了眼界。前幾天我還在波士頓的研究院,我發現波士頓很多人讀過《GEB》,正好在arts有埃舍爾的展覽,我就去買了幾個印有埃舍爾的領帶。

想到大學學群論,老師讓我們對加號重新定義,從底層開始,我們到大學才開始審視小學學的那些簡單符號。我們搜狗的目標就是:讓表達和獲取很簡單。通過您的表述,我更加意識到語言是知識和思考的載體,我們的輸入法、翻譯都是和語言打交道,所以我們也更加難一點。我知道在發展以語言為核心的人工智慧nlp 並不是 nature language understanding,比如看到和領導人問答的機器人我就認為肯定是假的,後面肯定有個人。我們國家推崇很多這種無良公司,有的甚至炒作說能夠批改高考試卷。機器學習對知識語言沒有理解,就讓機器評判,這不是毀人類嗎?在AI語言的三個方面:問答、對話、翻譯我們都有所嘗試,雖然遠遠沒能達到智能。我門發現垂直領域很強,可是在通用領域卻一塌糊塗。比如春節期間那個搶答,我們就做了一個問答機器,語音識別2秒鐘就能回答出來,比人類的正確率高很多。後來逼著今日頭條改題目,弄了一些技巧比如否定句呀之類的,可這也是我們的強項。

其實歷史上有很多這樣的描寫,比如巴別塔語言不通就構造不出。到了8-10世紀,阿拉伯帝國,統治羅馬埃及希臘印度,他們為了了解他們的文化將它們的著作統統翻譯過來,產生了前後500年文化盛世。能溝通就有意義,可現代溝通的權力還是在少數人手裡,我們需要更多管道。我們國家歷史也有三次這種溝通的突破,第一次玄奘西行,幾十年翻譯了157本佛經中的75本;第二次是明末清初翻譯出《天演論》這樣的一些著作;最後是鴉片戰爭,翻譯的《共產黨宣言》。

現在計算機還是集中在垂直領域,經常有人拿這些和人比,可是它更多是一個工具啊,不要和人比,和人比有什麼意義。

最後我的問題是您認為我們是生活在真實還是虛擬世界中?

侯道仁:真實的。

8

程明霞 :(騰訊研究院助理院長)其實我們翻譯君現在比較成熟了,博鰲是那個人自己讀錯了,所以翻譯的結果也不對了。昨天pony在國家行政學院講話也很緊張,叮囑我們再測試看看防止有紕漏。

侯道仁:我們不能說它們是智能的,只是他們快速切偶爾能成功,但是不代表他有智能。我總是強調:智能就是能夠應對情境,並且能快速捕捉到內涵。機器翻譯肯定做不到這點。你覺得他們是工具還是朋友?就像前面解說螃蟹卡農的那個音樂朋友,機器只是輔助人類作曲家而不是取代。你開發他來協助,可是如果以後他們變得聰明了我們就會淪為助手,最後成為寵物,而我們沒有控制權。問題是他們比我們聰明,我們如何把他們壓制在我們之下,防止他們失控。40年前我還喜歡AI的前景,是因為當時AI在人之下,當時幽默和有挑戰。可是現在很嚴肅,再過幾十年誰是誰的助手呢?以後我們可能是更高物種的後代,這我不會喜歡,以後「我們」可能變成另外的東西,不是現在的人了,可是我肯定活不到那個時候了

9

遠程提問:您一直在批判MT,那麼作為MT的學生我們以後的方向怎麼辦呢?

侯道仁:一開始別考慮翻譯那麼大的事情。先想翻譯是什麼。我建議先創建一個微小的事件,在這裡面測試翻譯的準確性。我不會針對整個翻譯,任何兩種語言翻譯是商業性的東西,這都是賺錢,而不是翻譯的思索思考。還是那句話,以現有技術解決大數據只是商業而不是哲學,我對賺錢無所謂,我只是想了解世界的本質。

10

張 江:John Holland,基因演算法之父也是您的好朋友,您能評價一下他嗎。

侯道仁:John是聖塔菲研究院的專家,人性化溫暖慷慨,因為他我才去了密歇根大學。我們會有一些朋友,每次花幾個小時討論彼此的工作,雖然不是彼此領域的專家但可以了解基本概念。他的研究給世界上的物去分類,設計細胞器官革命,以及適者生存生物規則應用。

2000年有一種悲觀的想法,有人預測計算機將會超過人佔領世界,傳言奇點的快速到來讓我們很警示,所以我邀請了8位世界級專家去斯坦福,我將它稱為:精神性機器人研討會。因為這並沒有發生,只是我們的臆想。John Holland和他的學生兩個都在,那次會議唯一讓我感到驚訝的是他們兩個人說這個不可能發生,因為John不僅僅是人工智慧的先鋒,還是只能生活的先鋒。雖然他幾年前已經過世了不知道他如今怎麼看了,可當時我還挺高興,希望他是對的。我不是未來學家。能不能看到替代品我不知道,可能「我們」就是一個錯誤的詞,可能機器人未來就是我們的一員。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Cassandra 的精彩文章:

TAG:Cassandra |