當前位置:
首頁 > 新聞 > 都有一個貝葉斯大腦?預測編碼理論可啟發 AI 構建和人類似的意識

都有一個貝葉斯大腦?預測編碼理論可啟發 AI 構建和人類似的意識

目前,在認知學領域一個有爭議的理論認為,感知、運動控制、記憶等大腦功能,都依賴於大腦對現有經驗和未來期望的比較,即預測編碼理論。而該理論啟發了 AI 領域,正在幫助他們建立出更智能的模型。

一些神經科學家認同大腦工作的預測編碼理論,在這個理論中,「思維」實際上是一種「受控制的幻想」。該理論認為,大腦更重視對現實的預期,而不是感覺器官傳入的實際信息。

上月,DeepMind 公司推出一種新型軟體,可以根據包含幾個物體的單幅照片,在沒有人類干預的情況下,推測出從另一個視角看這些物體是什麼樣子。如果再多給幾張圖片,那麼這個軟體可以使用生成查詢網路(Generative Query Network,GQN)生成一個簡單的模型。

神經科學家也對生成查詢網路產生了興趣,尤其是對其訓練演算法。項目負責人阿里·伊斯拉米(Ali Eslami)表示,根據輸入圖片,生成查詢網路對於圖中物體做出推斷——位置,陰影,哪些部位可見而哪些不可見——並利用預測和輸入圖片之間的差異來提高精確度。

某些神經科學家一直以來認為,大腦的工作方式很像生成查詢網路——實際上,DeepMind 公司正是受到這種理論的啟發,才構建了生成查詢網路技術。根據這種「預測編碼」理論,在認知過程的每個層次,大腦產生模型或者說「信念」,也就是對下層傳入的信息形成一個預期。這種信念會轉化為對特定環境下最可能有什麼體驗的預測。大腦將該預測和下層感官傳入的實際信息進行對比,解釋預測誤差。比如,我們知道桌子應該有 4 條腿。但是桌子的一部分被擋住了,我們仍有很大可能做出正確判斷。

圖 | 左圖是一副 2D 圖像。生成查詢網路據此可以推斷出右圖中的三維模型。該演算法的部分核心思想來源於神經科學的預測編碼理論。(圖片來源:DeepMind)

當然,如果預測誤差無法得到合理解釋,那麼會被反饋到高層。高層將其作為有價值的信息進行處理,調整模型以降低預測誤差。倫敦大學學院的神經科學家和預測編碼理論的先驅卡爾·福利斯通(Karl Friston)認為,這就是大腦的工作原理。

過去幾十年,神經科學家,哲學家和心理學家對預測編碼理論進行了研究,並將其擴展到對整個大腦運行機理的解釋上。不過只有在最近,實驗技術的進步才允許科學家直接檢驗該理論,而過去 2 年發表的論文支持了預測編碼假說。不過,該假說仍然面臨很多爭議——有些專家質疑一些重要成果到底是否可重複。

咖啡,奶沫和狗

「我在咖啡里放了奶沫和( )」,很多人毫不猶豫地會填上「糖」。加州大學聖迭戈分校的神經科學家馬塔·庫塔思(Marta Kutas)和斯蒂文·席亞德(Steven Hillyard)在 1980 年做了一系列實驗,讓志願者盯著屏幕,1 次顯示 1 個詞,並記錄他們的大腦活動。在顯示這個句子的時候,科學家改動了一下,屏幕上出現的是:「我在咖啡里放了奶沫和狗。」

他們發現,看到「狗」的人,大腦電波活動比沒有看到這個不合常理的詞的志願者強得多。反常活動的峰值在「狗」出現在屏幕上的約 400 毫秒後。但是這是為什麼?

2005 年,庫塔思團隊在《Nature Neuroscience》上發表了另一篇論文。志願者要求閱讀屏幕上的這個句子:「今天風和日麗,因此孩子出門去放( )。」這裡最符合常理的是「風箏」。英語中,「風箏」搭配的不定冠詞是「a」。然而,當屏幕上展示的是「an」而不是「a」的時候,反常神經活動再次出現。不定冠詞不是名詞,並不指向任何真實物體,因此反常的神經活動,只能解釋為:「an」不符合大腦的預期。

這個實驗看上去是預測編碼理論的有力證明。然而,今年 4 月,一篇發表在 eLife 上的論文表示,多個實驗室均未能重複這個實驗。不過,這個實驗結果能被重複出來,只是需要關注一些原作者在最初論文中沒有寫出的操作細節。

在預測編碼理論的發展中,這種波折不是第一次。庫塔思博士的實驗結果也不止有預測編碼一種解釋,而且該實驗結果也不是對預測編碼理論的決定性證明,因為它並沒有解釋大腦神經活動的內在機理。為了提高預測編碼理論的可信度,支持者決定做更多實驗,涉及人類大腦的更多思維活動。

大腦的貝葉斯推斷和有效計算

20 世紀的大多數時候,神經科學家認為,大腦的功能僅僅是接收感官傳輸的信息,進行處理,然後做出反應,大腦的任何活動都來自於真實物理世界的刺激,比如一些神經細胞處理物體的邊緣,另外一些處理物體的指向,色彩和陰影。他們並不認為大腦在時時刻刻做出預測。

但是實驗證明,大腦思維過程沒有這麼簡單。比如,在沒有任何外界物理刺激的時候,大腦神經元仍然在很長一段時間內維持活躍。此外,大腦的前饋和反饋迴路傳輸的信息量之大,很難用簡單的「刺激-反應」模型來解釋。

科學家隨後提出「貝葉斯大腦」的理論,該理論的基礎框架可以追溯到 1860 年。貝葉斯大腦理論認為,大腦根據輸入信息和模型,對於世界作出概率推斷,並計算可能性最大的情況。因此,大腦不是在被動等待外界輸入信息,而是在主動地構建關於這個世界的假設,並用假設來解釋世界。因此,有些專家認為,人類的思考是一種「受控的幻想」。

根據貝葉斯大腦理論,人類視覺的工作原理可以如下解釋。假定屏幕上有 2 個快速交替閃動的點,看上去像是同 1 個點前後移動。大腦下意識地將這 2 個點看成 1 個點。對物體運動規律的解釋屬於高層知識,但是這種知識影響了我們對世界的認知。大腦用推測來補充缺失的信息——在這個例子中,缺失的是運動信息(因為人類認為它是 1 個運動物體)——然後生成對世界的認知,儘管可能不太準確。

圖 | 左圖和右圖中,陰影下的棋盤看上去灰度不一。但是他們的灰度實際上相等。這種現象的原因是:大腦用陰影區域的近鄰區域的顏色來推斷陰影區域的顏色,因此導致了認知差異。(圖源:Edward H. Adelson/Adrian Pingstone)

儘管貝葉斯理論聽上去有道理,但是科學家始終沒有搞清神經迴路尺度上,大腦是如何進行模型構建和推斷的。愛丁堡大學思維哲學教授馬克·斯普瓦克(Mark Sprevak)表示,缺乏神經生物學層面的運作機理是貝葉斯大腦理論的最大問題。

為了解釋大腦如何進行貝葉斯推斷,科學家提出了預測編碼理論。該理論受到了通信編碼技術的啟發:由於圖像包含大量冗餘,因此對每幅圖像的每個像素進行編碼來壓縮圖像是效率很低的做法。更好的做法是:對兩幅相鄰圖像之間的差異進行編碼。

1982 年,科學家發現人類大腦的視覺部分竟然也按照類似的方式進行運作。後來發現,大腦的獎勵系統工作原理也是如此:多巴胺神經元對期望回報和真實回報的差異進行編碼,而預測誤差幫助動物更新對未來的期望,並做出決策。

大多數科學家此時仍然認為,預測編碼不過是大腦某些特定區域的工作原理。不過功能性核磁共振成像技術的發展提供了新的證據。

無處不在的預測機制

預測編碼理論能解釋很多實驗現象,這使其在認知領域產生巨大的影響。愛丁堡大學邏輯學教授,預測編碼理論專家安迪·克拉克(Andy Clark)就持有此觀點。

該理論對大腦的感知和運動控制行為給出了統一解釋。大腦用不同的方式,在這兩種思維過程中實現預測誤差最小化。在感知過程中,思維模型被調整;在運動控制中,外部世界被調整。比如,你想把手中的水杯放到桌上,你的大腦預期位置是桌面,而水杯的真實位置和預期位置存在偏差。大腦分析這種偏差,並向運動系統給出減小偏差的指令。

對感知和運動控制進行的實驗,提供了對預測編碼理論最有利的支持。上個月《Journal of Neuroscience》發布的一篇論文中,志願者閱讀屏幕上的詞「kick」,同時耳邊播放著嚴重扭曲的「pick」這個詞的錄音。很多人把「pick」聽成了「kick」。同時,功能核磁共振也發現,兩個單詞只有首字母不同,而大腦對於首字母的誤差反應很強烈。如果大腦僅僅對實際經驗做出被動應答,那麼大腦的最強反應應該是對應於「ick」,因為這 3 個字母同時出現在屏幕和耳機中。

克拉克表示,更多的實驗證明,大腦的其他區域的活動規律也服從預測編碼理論——預測編碼是大腦運作的核心。

福利斯通和其他專家表示,其他高等大腦活動,如注意和決策等,也服從預測編碼理論。近期的研究工作證明,人類記憶和目標導向的行為也符合預測編碼理論的預期。一些科學家甚至認為,情緒也是按照預測編碼理論的預期來運作的:當大腦對諸如體溫、心率或血壓等人體內部信號的預測和實際不符時,人類就會產生情緒,以最小化這種預測誤差。比如,如果大腦發現這些指標都在上升,那麼大腦就會產生憤怒的情緒。也許自私的心理也是如此產生的。

圖 | 卡爾·福利斯通,倫敦大學學院的神經科學家,幾十年來致力於發展預測編碼理論。他認為該理論不僅可以解釋感知等低層次神經活動,還可以解釋高級神經活動。

目前,大多數工作聚焦於預測編碼如何解釋人格和心理發展異常。如果大腦是一台統計推測機器,那麼它有可能做出一些和統計員類似的錯誤,即對於預測誤差給予太多或者太少的關注。

比如自閉症,可能是因為患者無法忽略與感覺器官相連的低級神經活動的預測誤差。因此,自閉症患者總是要求可重複和可預測的環境,且對特定的幻覺非常敏感。而精神分裂症剛好相反:大腦過分關注自己做出的預測,而無視那些與預測背離的感官信息。當然,專家承認,自閉症和精神分裂症的機理遠遠不止這麼簡單。

不過,即使如此,耶魯大學醫學院臨床心理學家菲利普·科勒特(Philip Corlett)認為,這也足以說明人類的精神活動有多麼容易變化。科勒特的實驗室中,志願者接納新刺激,從而形成了新的信念。科學家通過實驗已經發現,新的信念可以被教會,且會隨著你的三觀改變而改變。

但是,預測編碼理論尚未成為學術界的共識。

深入探尋機制

實驗結果通常能提供符合預測編碼理論的結果,但是預測編碼通常不是解釋實驗結果的最佳理論。比如,在認知科學領域,預測編碼得到廣泛接受。但是在系統神經科學領域,接受度要低得多。

圖 | 喬治·凱勒(Georg Keller),弗雷德里希·米切爾研究所生物醫學方向的神經科學家,致力於預測編碼理論的研究。(圖源:Roland T?nnler)

去年在《Neuron》上發表的一篇論文中,凱勒和同事觀察了老鼠視覺系統的神經活動隨著時間推移的變化情況。他們在訓練老鼠玩遊戲的時候,本來定義:按左邊按鈕後,屏幕上物體往右移動。但是有人後來把程序改成按左邊按鈕,屏幕上物體往左移動。這時,科學家發現,老鼠的大腦電波信號模式逐漸發生改變,且大腦做出了「屏幕上物體向左移動」的預測。

顯然,如果大腦只是對外界刺激做出被動反應,那麼當遊戲規則改變之後,大腦電波信號模式應該立即發生改變。而緩慢改變的事實充分證明,大腦的運作機理符合預測編碼理論的預測。

克拉克表示,這個實驗提供了較之之前實驗更強的說服力。

此外,對大腦人臉識別功能的研究也發現了類似的現象。之前的工作發現,大腦人臉識別的低層活動主要對於人臉的細節作出反應,而在高層,對信息的處理更加抽象,主要負責辨別物體的類型,而不是位置。在歐洲神經研究所卡斯帕·斯佩德尼克(Caspar Schwiedrzik)為第一作者的一篇論文中,科學家訓練猴子,向其展示 2 張人臉圖片,其中第 1 張圖片對於第 2 張圖片高度類似。然後,科學家打亂這個預期——第 2 張圖要麼是角度不同,要麼就是另外一個人的。大腦活動顯示,預測誤差是關於人臉的類別,而不是關於人臉的朝向的。這說明,預測誤差產生於人類的高層神經系統,而低層系統則將輸入信號和高層神經系統傳來的預測進行比較。

馬克斯·普朗克經驗美學研究所(Max Planck Institute for Empirical Aesthetics)的露西亞·美路尼(Lucia Melloni)也表示,其團隊在人類的大腦活動數據中,也發現了符合預測編碼理論的現象。

發現更多的證據

值得強調的是,不是所有專家都認可預測編碼理論。一些科學家承認該理論能解釋特定的大腦功能,但是不是全部。有些專家更保守。紐約大學心理學教授戴維·黑格(David Heeger)認為,必須嚴格區分「預測編碼」和「預測處理」,前者是讓信息傳輸更有效,而後者是做出決策。此外,他認為,其他貝葉斯模型能更好地解釋某些大腦活動。

當然,福利斯頓等專家認為,預測編碼的研究可以為機器學習提供啟發。目前,大多數人工智慧研究並未包括預測編碼,而加入預測編碼的深度學習演算法可以提高其智能程度。

DeepMind 的生成查詢網路在這方面邁出了第一步。去年,蘇塞克斯大學的專家使用包含預測編碼的虛擬現實和人工智慧技術創造了「幻想機器」,可以產生之前只有嗑藥才能產生的幻象。

反過來,機器學習的進步也可以為神經科學研究提供新思路——一個更加智慧的機器是如何工作的?大腦的工作機制與此類似嗎?

科學家接下來的工作是,進一步搞清預測編碼機制的細節,並設計更有說服力的實驗,來說明人類的高級神經活動也服從預測編碼機制。

格拉斯額大學神經生理學家拉絲·馬克里(Lars Muckli)甚至認為,預測編碼理論對於神經科學的重要性堪比進化論對生物學的重要性。當然,還需要更多的研究來進一步完善這一理論。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

育碧海盜題材遊戲《碧海黑帆》豐富海戰玩法系統詳情
「大齡運動員」現象越來越普遍,賽場將不再由年輕人主宰

TAG:DeepTech深科技 |