如果不能理解人腦運作的機制，計算機模擬人腦又有什麼用？

知識 07-04

為什麼與眾不同的事物更吸引我們的目光？為什麼對人腦來說輕而易舉的圖像識別，對計算機如此難？《環球科學》專訪英國倫敦大學學院計算神經科學家李兆平，或許能夠告訴我們答案。

撰文《環球科學》記者廖紅艷

半個世紀前，美國麻省理工學院的一位計算機系教授，給自己的學生布置了一個暑期項目，編寫一個程序，讓計算機能夠識別出圖片上的簡單物體——將圖片信息輸入計算機，由計算機輸出圖片上物體的名稱。結果出乎這位教授的意料，這個看似簡單的項目，最終花了科學家幾十年的時間。直到最近幾年，由於計算速度的提高，以及大數據、深度學習演算法的出現，計算機的識圖能力才有了較大提升。

相比而言，人類大腦在圖像識別方面的能力，則令人驚嘆。我們可以在半秒內準確分辨出貓和狗；在瞬間認出隱藏在一群鳥中的河馬；過馬路時及時發現一輛正向我們衝來的汽車；或是在安靜聽課時，用眼睛瞬間「抓」住一隻突然出現的蝴蝶。這些由大腦視覺系統下意識做出的簡單行為，其實並不簡單。正常情況下，人的眼睛每秒可以接收幾十兆信息，信息量相當於幾十張圖片或是幾十部長篇小說。但實際上，能被我們注意到的信息量上限，只相當於兩三句話。也就是說，我們在過馬路時及時發現一輛闖紅燈汽車，這個動作，相當於視覺系統在1秒內就從幾十本長篇小說中，找到了最重要的兩三句話。

在完全無意識的狀態下，視覺系統就將我們的視覺注意力引導到了最特別、最重要的位置。億萬年前，我們的遠古祖先正是憑藉這個超級本領，才在危機四伏的環境中生存下來，並繁衍至今。但其中的生物機制是什麼，科學家一直無法解釋。直到1999年，當時任職於英國倫敦大學學院的李兆平才提出了一個全新的解釋，她認為，在視覺中樞的V1區（視覺初皮層，是第一個接受視網膜信息的大腦腦區），形成了一個視覺顯著圖，就像地圖一樣，視覺顯著圖會告訴我們哪個位置重要，吸引我們的注意力，並引導眼球自動往那個方向看。這個解釋也被稱為「V1顯著圖理論」（V1 saliency hypothesis）。

新理論剛提出時，質疑聲很多。因為傳統觀點認為，建立顯著圖的應該是與智力緊密相關的前額葉或類似的腦區。而早前的兩項研究，讓科學家相信，V1是低級腦區，完成不了這麼高級的任務。一個是1953年美國神經生物學家史蒂夫·庫夫勒（Steve Kuffler）發現，視網膜神經元只能對圖像上很小一塊區域（即該神經元對應的感受野）有反應，並且只有當區域內有自己「喜歡」的點時，這個神經元才會有所反應。另一個是10年後，庫夫勒的學生戴維·胡貝爾（David Hubel）和托爾斯登·魏塞爾（Torsten Wiesel）發現（因這一發現，兩人獲得了1980年諾貝爾生理或醫學獎），V1區單個神經元的感受野比視網膜的稍大，這裡的神經元開始能提取圖像上的「小線段」，並且不同神經元會偏愛不同屬性的線段，比如某一顏色、某一朝向、是否運動。

按照這個規律，科學家樂觀地推測，隨著視覺信息的深入，比V1高級的視覺腦區（V2、V3、V4、V5等）的神經元能夠認出的圖像會越來越複雜，並最終在前額葉之類的腦區形成一個視覺顯著圖，引導注意力的方向。這個假設似乎也有道理，然而幾十年過去了，科學家照著這個思路開展研究，研究進展卻遠不像當年在視網膜和V1區那麼順利。而李兆平的理論指出，V1區其實並不只是在提取圖像里的小線段，還能造出顯著圖來引導注意力。這個理論引起大家反思：注意力的介入意味著部分視覺信息在大腦里被選擇或丟失，傳統思路沒有考慮這些因素，這很可能是高級視覺皮層難以理解的原因。

「V1顯著圖理論」可以解釋很多我們司空見慣的現象。比如，當你面對「萬綠叢中一點紅」的場景時，為什麼我們的眼睛會在第一時間看向「一點紅」。「V1顯著圖理論」認為，V1區有一個內部神經網路，網路中的神經元會相互作用——喜好相同的神經元相互抑制，即同性相斥。另外，注意力分配時遵循的是「競價原則」。可以想像成在V1的一個輸出區——上丘腦——有一個專門負責拍賣注意力的拍賣店，它不問其他，只看神經元的出價（發放脈衝的頻率），哪個神經元的出價高（脈衝頻率的高低），就會把注意力賣給誰，然後指揮眼睛往這個神經元對應的感受野看。

舉個例子，當視覺輸入的是一張滿是綠棒僅有一根紅棒的圖片時，V1區有很多神經元，有的喜歡綠棒，有的喜歡紅棒，因為綠棒很多，喜歡綠棒的神經元會相互抑制；而喜歡紅棒的神經元，因為紅棒只有一根，不會被抑制，結果發放頻率最高，最後贏得了注意。這也可以解釋，為什麼我們總是會被最特別的事物吸引。此外，V1區生成的視覺顯著圖，可以直接輸入上丘腦——視網膜負責輸入信息、V1區負責生成視覺顯著圖、上丘腦負責輸出結果，一個完美的模型誕生了。

近年來，「V1顯著圖理論」引起了學術界的極大注意，獲得了越來越多實驗的支持。這些實驗包括生理學、心理學和腦成像的觀察，包括李兆平和北京同事的合作項目。2014年牛津大學出版社出版了她著的《理解視覺：理論、模型與數據》（Understanding vision: theory, models, and data），這也是計算視覺領域的第一本教科書。最近，現為倫敦大學學院計算神經科學教授、北京師範大學認知神經科學與學習國家重點實驗室訪問教授的李兆平接受「未來論壇」邀請，在中國科學技術館做了一場名為《用人腦研究腦，是探索更是挑戰》的「理解未來」講座，向在場觀眾介紹了自己在探索視覺這個心靈的窗戶過程中的一些感想。講座結束後，《環球科學》對李兆平教授進行了專訪。

《環球科學》：你最早是在加州理工學院學習物理，為什麼會轉到計算神經科學領域？

李兆平：上大學的時候，我喜歡物理，也喜歡思考與大腦有關的各種問題。比如男人和女人的大腦有什麼不同，為什麼有人會認為女人不適合學習物理？小孩子的大腦為什麼可塑性那麼強，可以學會那麼多東西？不過，我真正進入神經相關領域，是緣於聽了當時加州理工學院物理系約翰·霍普菲爾德教授（John Hopfield，1982年提出了著名的Hopfield神經網路）的一場講座，霍普菲爾德教授後來成了我的博士導師。我的博士論文名是《嗅球模型及延伸》（A Model of the Olfactory Bulb and Beyond），當時的加州理工學院非常開明，雖然我的論文看起來與物理專業不太相符，但還是給我頒發了物理學博士學位。

《環球科學》：有人說，人工智慧「深度學習」中的「深」指包含了很多層虛擬神經元，靈感就來自於人腦視覺皮層的層狀結構。你認為這個說法準確嗎？為什麼？

李兆平：上世紀80年代我參與過人工神經網路的教學和研究，不過當時計算機太慢，只能實現淺度學習，比如實現二三層演算法，而現在已經能做到上百層了。上世紀80年代，研究機器學習和計算神經的其實是同一批人，每年在這個領域會召開名為「神經信息處理系統」（Neural Information Progressing Systems）的研討會。不過到了90年代，研究人員開始向兩個方向分化，一個是偏工程方向，也就是機器學習；另一個是生物方向，就是計算神經科學。

至於深度學習是否借鑒了人腦視覺皮層層狀結構這個問題，我覺得只能算是形式上的借鑒。現在人工智慧中用到的虛擬神經元和人工神經網路，工作原理與我們大腦中的神經元和神經網路很不相同。大腦的大部分機理，科學家都還沒有搞清楚，而且，即使機理搞清楚了，應用到計算機上，也還需要做大量的工作。比如，現在的計算機遠不能像人腦一樣，懂得引導視覺注意力方向。

《環球科學》：有人說，如果類比物理學的發展史，神經科學目前還處於牛頓力學之前的階段，你怎麼看這種觀點？

李兆平：從牛頓力學開始，物理學家幾乎可以在原理上去解釋很多自然現象。相比之下，在神經科學領域，還沒有出現像物理學中的牛頓力學那樣的、可以照亮一大片領域的理論，所以我覺得這種說法有一定道理。

但也可能在攻克大腦的這場戰役中，不存在一個大戰場，只存在許多小戰場，各個小戰場雖然不是互通的，但10個小戰場打勝後，也許能取得大戰場的勝利。目前，我們已經在許多小塊的領域做得非常漂亮，在許多小戰場上取得了勝利，比如大腦獎賞機制、大腦定位系統，等等。我還是非常樂觀，希望在有生之年，可以循著V1、V2、V3、V4深入地研究下去，搞清楚視覺系統。甚至更樂觀一些，既然猴子大腦里有50%腦區是專管視覺，也許通過視覺系統這個「心靈的窗戶」，我們可以獲得突破，窺見整個大腦的奧秘。

《環球科學》：你覺得計算機最終能夠模擬人腦嗎？

李兆平：只是模擬不去理解是沒有用的。試想一下，如果不能理解大腦運作的機制，擁有一個模擬的大腦又有什麼用？反過來，如果能真正理解原理，就不需要拘泥於形式生硬地模仿，比如，鳥與飛機的關係。人類雖然從飛鳥靈感，但最終並沒有模仿鳥的形態，製造出所謂的機器鳥，當科學家搞清楚了流體動力學，他們就可以用鋼筋鐵骨製造出跟鳥完全不像的飛機。

《環球科學》：你提出的「V1顯著圖理論」非常漂亮，但正如你所說，這是一個小戰場的勝利，你的下一個戰場是什麼？

李兆平：V1區還有許多奧秘值得我們探索。最近我和北京師範大學認知神經科學與學習國家重點實驗室的李武老師合作，首次發現在V1區，注意力的吸引使神經元的靈敏度得到提高（神經元因視覺輸入而發放的電脈衝越強，靈敏度越高）。而過去認為，只有在高級腦區，神經元才會發生因為獲得注意力，靈敏度提高的情況。最近還研究了V2是否也參與了建立視覺顯著圖。雖然目前在V2方面還沒有太大進展，但我比較樂觀，希望能用我的一生，破解視覺的奧秘，甚至大腦的奧秘。

《環球科學》：1999年，「V1顯著圖理論」剛提出時，受到了許多質疑，一些科學家甚至認為是天方夜譚，但漸漸地科學界開始接受這個理論，特別是最近幾年，越來越受重視，為什麼學界的態度會發生轉變？

李兆平：一個理論從提出到被大多數人接受，要經歷一段時間。偉大的麥克斯韋的電磁學理論也花了很多年才被接受。當然，我的理論不像他的理論那麼偉大，所以等更多年才被接受也很可能。在2008年，我用行為實驗驗證了「V1顯著圖理論」的一個預測。這可能是促使學界態度轉變的一個比較重要的因素。「V1顯著圖理論」雖然可以解釋，為什麼與眾不同的事物會吸引我們的注意力。但所有理論都應該能用來推測未知現象，否則都只能算是「馬後炮」。

所以，我設計了一個行為實驗來驗證自己的理論的一個預測。首先，請自願者通過立體眼鏡，左右眼分別看兩幅不同的圖——左眼看到的圖上，幾乎所有的棒都向左傾，只有一根棒向右傾，右眼看到的是一張空白圖，要求自願者儘快找到唯一的右傾棒。然後，通過眼動跟蹤，記錄自願者看向右傾棒的時間。接下來，研究人員移動左圖上的一個左傾棒，到右圖的相應位置，得到兩張新圖。再請自願者戴上立體眼鏡，左右眼分別看兩張新圖，找出朝向不同的棒。結果發現，儘管兩種情況下，眼睛最終看到的圖像是一樣的，但相比第一種情況，第二情況下，自願者需要花費更多時間，才能找到那根右傾棒。通過眼動跟蹤，我們發現，即使明確要求自願者儘快找到不同朝向的棒，自願者還是會不由自主地看向跟任務無關的、只有右眼可見的那根唯一的棒。

按照我們的理論，在第一種情況下，右傾棒是唯一的顯著點，但第二種情況，會出現兩個視覺顯著點——一個是唯一的右傾棒，另一個是右眼畫面中唯一的那根棒。這也解釋了，為什麼自願者的眼動軌跡經常會先看唯一的右眼棒，後看唯一的右傾棒。而且，在所有視覺皮層中，只有V1區的神經元存在左右眼輸入偏好，有些細胞喜歡左眼輸入的信號，有些細胞喜歡右眼輸入的信號。這說明生成視覺顯著點的腦區，就在V1區。這個實驗還告訴我們，其實「看」和「見」是分開的。

《環球科學》：「V1顯著圖理論」的提出對神經科學領域意味著什麼？它對普通大眾的生活會產生影響嗎？

李兆平：長期以來，科學家對V2區的研究沒有進展，可能就在於對V1區了解還不足。我們現在知道，視覺信息在V1區受到了過濾，有些信息被收錄，有些信息被刪除。在大量信息被篩除的情況下，我們還按照傳統的方法，去測量V2區的感覺野，總是碰壁也就不足為奇了。接下來，「V1顯著圖理論」也許可以指導對V2及以上視覺皮層的研究。

視覺注意力分配，可以用到很多生活場合，比如，在廣告和電影畫面中，如何引導注意力。注意力分兩種，一種自上而下，叫有意識注意；另一處自下而上，叫無意識注意，我們的理論主要可以解釋無意識注意。在傳統電影中，導演一般利用攝影機視角、燈光、選擇性聚焦乃至音效等諸多手段，來引導觀眾的注意力。但如果電影工作者借鑒我們的理論，通過設計一些唯一的特徵——這些唯一的特徵在VR（虛擬）環境下還有更多的設計途徑，引導觀眾的無意識注意，或許可以不露痕迹地讓觀眾的眼睛向某一方向看。

轉載請先聯繫newmedia@huanqiukexue.com。

請您繼續閱讀更多來自 環球科學 的精彩文章:

清華大學合成鏡像生物分子系統，離鏡像生命更進一步？

大自然的抽象畫師，一種逆天卻又低調的生物

火星去了，冥王星也去了，你們考慮過金星的感受嗎？

中國首先攻克了DNA測序，現在又想統治精準醫療

Nature專家評論:東方並非蠻野無序

TAG:環球科學 |

您可能感興趣

※任務有愛！任務機制能算是成功的設計嗎？
※企業沒預算機制，就沒有利潤保障！
※任務有愛！任務機制能否算是爐石中成功的設計呢？
※人腦具有處理「敘事」的共同機制
※好男人都是被「調教」出來的！你需要靈活運用激勵機制
※什麼是機制幣你了解嗎？
※生物鐘的分子運作機制是什麼？
※沒有人員優化機制時，如何盤活企業潛在人力資源？
※股權激勵的退出機制如何設計？
※受精卵著床的過程與機制，會有什麼樣的感覺
※蝴蝶的鎖定機制，你了解多少？
※人類有「整體逼真度感知」視覺機制：逼真與否瞬間能判斷
※奇葩公司設立懲罰機制！員工沒有完成任務，竟然要被罰做這件事！
※人類有「整體逼真度感知」視覺機制：真假瞬間能判斷
※人們確實會無意間抄襲別人，背後究竟是怎樣的機制？
※付費購買的知識能退貨嗎？知乎夠狠做了這個機制
※女人變心又怎樣？「心理誘發機制」讓她和情夫反目成仇！
※腎上腺素的作用機制
※物理學是不是可以解釋所有化學現象？如果是，那物理如何去解釋生物機制？