當前位置:
首頁 > 新聞 > 腦機介面的科幻表象與科學真相

腦機介面的科幻表象與科學真相

腦機介面最近很火。這要拜科技狂人馬斯克入局所賜,當然 Facebook 的加入也讓這把火越燒越旺。

學術界有不少進展。《自然-通訊》在 7 月 30 日發表了來自加州大學舊金山分校神經外科教授 Edward Chang 的研究成果,他們實現了實時地解碼大腦信號,將「聽到」和「說出」的對話轉變成語言文字,並且準確率可達 76% 和 61%

相比馬斯克的高調,Edward Chang 這個研究是能夠落地的。他們的策略是,當受試者執行「聽到」和「說出」任務時,研究人員通過從高密度皮層腦電圖陣列記錄神經活動(覆蓋聽覺和感覺運動皮質區域),然後解碼這些大腦信號的內容

至此想必很多人會有疑問:大腦語言信號解碼研究的現實意義有多大?語言信號解碼能實現到什麼程度?腦機革命要來了嗎?科幻片里的意識交流會實現嗎?本文希望探討這些問題。

語言解碼的一大步

圖 | 大腦的語言功能區、嘴唇運動控制區和聽覺皮層是 Edward Chang 研究的重點。Broca 失語症患者會產生語言表達缺陷,但其理解能力相對正常,而 Wernicke 失語症患者語言表達很流暢但理解卻很差,他會表達出清晰的言辭但卻無意義。Broca 失語症的腦損傷部位是額葉運動聯合皮層,而 Wernicke 失語症的腦損傷部位在顳葉後部。有看法稱,Broca 區就在控制嘴巴、唇運動的皮層附近。(來源:神經科學——探索腦,高等教育出版社,2004)

Edward Chang 這項研究有一些不得不說的細節。在今年 4 月 Edward Chang 發表的《自然》研究中,利用神經信號與人聲道咬合部位運動的映射關係進行解碼,也就是利用控制嘴唇、舌頭、喉部和下頜運動的神經信號來合成語音,這是一個比較獨特的解碼途徑。

這似乎可以類比以視覺信號代替聽覺信號的讀唇術。不過多位學者認為,如果用人工智慧來訓練讀唇術的話,其準確率比解碼腦電信號要準確得多,畢竟前者是確定的視覺信號,而人在說話時的腦電信號有太多未知和不確定,畢竟人工智慧更擅長以確定的數據來計算出結果。

對於聽覺腦電信號的解碼,Edward Chang 則是利用植入於大腦皮層的電極實時獲取大腦皮層活動信號,這已經與聲道部位的咬合無關,而是直接解碼人聽到語言後產生的腦電信號。

這本來是無比複雜的研究,Edward Chang 將這個研究簡化了許多。他只是對涉及4組簡單問答的腦電信號進行了解碼。受試者得到的信號都是相對簡單的,比如問「你最喜歡哪種樂器」「你最不喜歡哪種樂器」「從 0 到 10,你的幸福指數有多少」「你希望我多久來看你」等。正是這些簡單問題的訓練,讓研究者得到了相對容易判斷的信號。

這仍是一項了不起的進步。華南師範大學腦科學與康復醫學研究院教授翁旭初評價說,這項語音解碼研究在神經科學上的突破並不大,但在臨床上的意義更大。由於使用了更多數目的侵入式電極,能夠實時解碼相對準確的語言信號,而此前的語言解碼研究更多是對於書面文字或圖片的腦電信號解碼,是非侵入式的,解碼速度不夠快。

疑問仍存。比如,為何目前只能實現百分之六七十的準確率,有哪些影響語言解碼準確率的因素?美國西北大學費恩柏格醫學院 Marc W. Slutzky 博士對 DeepTech 解釋說,儘管這項研究用了 256 個電極,但檢測的腦電信號可能還是太少,因為皮層下區域也可能涉及語言功能。另外,這個研究是針對極少樣本得出的結果,已經是相對不錯的了,要知道,蘋果公司的 Siri 經過數百萬小時的訓練仍然會犯錯誤。

挑戰在後面

人的語言是一個極具創造性的系統,其使用在語法規則外沒有任何限制。也就是說,進化數百萬年來,我們現實中的對話已經是一個集合了聲音、符號、手勢、表情在內的成熟的交流體系,並且這個體系仍然在日新月異的不斷完善中,而僅僅依賴腦電波信號一種維度來解碼這個複雜體系,其難度可想而知。

圖 | 感知和言語的正電子發射計算機斷層掃描成像(PET)。顏色表示相對腦血流量。紅色表示血流量最大,橘黃、黃、綠和藍色分別表示血流量從大到小依次遞減。(來源:神經科學——探索腦,高等教育出版社,2004)

人腦是一個一直在運行的器官,其腦電信號是持續不止的,尤其是在現實中,人腦常常是在執行聽說功能的同時,還在進行觸覺、視覺、味覺、嗅覺以及運動等多種功能的運行,我們並不清楚不同功能腦區相互干擾的情況是怎樣的。在這個腦電信號巨大噪音背景下,Edward Chang 們每個微小的進步都是不容易的。

那麼問題來了,我們需要多麼精確地了解這些功能的腦電信號才能真正實現複雜的語言解碼?

到目前為止,我們僅僅知道人的語言功能與大腦分區有關,並不知道數百億神經元中的映射詳情。

一種可能的研究策略是,通過對大腦神經活動的空間和時間信號進行高解析度的數據採集,並配合人工智慧的機器學習演算法(如深度神經網路),將各種感知覺、運動、語言等高級認知功能所對應的神經信號互相分離出來。這樣做還具有重要的臨床價值。例如,在腦損傷植物人的群體中,有一部分患者會出現運動功能和高級認知功能的分離。換句話說,這些患者雖然不具備任何行為上的交流能力,但卻保留著高級的思維能力(如運動和空間想像)。在藥物誘導的麻醉狀態,也存在類似的現象。密西根大學醫學院麻醉系的黃梓芮博士就在嘗試讓受試者進入麻醉狀態進行腦活動解碼。但是,由於人類思維和意識內容的豐富性,準確探測大腦高級認知功能、解碼甚至還原相對抽象的語言內容,仍然面臨巨大的挑戰。

語言解碼還有很多挑戰。語言的解碼不僅限於聽說帶來的聲波信號,每個辭彙和句子還會給人一種語義,而這個語義就會對每個人的反饋不一樣。比如全世界有上萬種語言和方言,那麼對於同一個語義,不同語言和方言對應腦電信號都可能有差異,甚至對於不同環境成長的同一語言人群以及同一個人在不同年齡段和不同情緒狀態下的腦電信號都可能不同。還有,對於同一時間的同一個人,同一個辭彙可能都會引起不同刺激程度的腦電信號。

所以多位業內人士的看法是,受試者的背景越接近,這種語言解碼的普適性才會更高。當然,嚴格說來,即使對於同一個人做上無數次解碼訓練,都可能做不到 100% 的解碼準確,因為他的語言思維體系一直在更新。

圖 | 一個語言加工模型,標註了書面和口語單詞複述任務的各個處理階段。每個階段下面表明了由PET成像所觀察到的與上述任務特異性相關的皮層區域。(來源:神經科學——探索腦,高等教育出版社,2004)

另外,文字閱讀也是一種語言有關的腦電活動,這顯然與口語引發的腦電活動不同。不同語言的文字引發的腦電信號也會不一樣,象形文字如漢字引發的腦電信號與拉丁字母引發的腦電信號顯然會不同,讀手語與讀唇語顯然也會引發不同的腦電信號。以漢語為例,包括翁旭初在內的認知心理學專家認為,漢字是一種二維文字,相對於拼音文字,漢字閱讀加工的腦區分布就有自身特點。

也有相對樂觀的看法。這類看法認為,如果數據運算足夠先進,加上科學分類以及對不確定性因素的控制,是有可能得到相對普適性的腦電解碼結果的。

意識對話?

事實上,真正的腦機介面挑戰在於意識。在 4 月份 Edward Chang 的《自然》論文發表時,同期雜誌引述華盛頓大學 Amy Orsborn 博士看法稱,當一個人沒有動嘴時,它能否理解其想說的話呢?

這是一個好問題。「想要說話」的腦電信號是否能被解碼,也就是人的意識能否解碼的問題。畢竟說出來的語言和聽到的語言有聲波的物理性質,這些物理信號是確定的刺激信號,而意識則擁有較大的模糊不確定性。Edward Chang 沒有接這個球,他對媒體回應稱,解碼某人公開試圖說的話足夠困難,並且提取他們內心的想法幾乎是不可能的。「我沒有興趣開發一種技術來發現人們在想什麼,即使它是可能的」。

不過,這並非完全不能實現。曾在美國多年從事康復研究的林方博士認為,如果給受試者一個預告,那麼是有可能檢測到相應的腦電信號的。比如當警告受試者可能有重物落下的時候,受試者會馬上做出預防重物落下的應激反應,這時候的腦電信號就有可能被檢測到並分辨出來。德國科學家在今年 4 月《神經科學》(Journal of Neuroscience)發表了一項對大鼠的研究,他們解碼了大鼠頭部預期運動的信號。

其實 Amy Orsborn 這個問題的進一步延伸就是,人們之間能不能實現無語言的意識對話,或者說是靈魂對話。這已經接近科幻了,就像奇幻電影里的 X 教授,戴上一個頭盔就可以進入其他人的意識世界。

但是,如果不是應激衝動的反應,那麼就不容易解碼。比如每個人在欣賞《蒙娜麗莎》畫作時的感受不同,那麼如何讓一個沒有藝術鑒賞能力的中國山村娃娃與一個義大利畫家對這幅畫作進行意識對話?現實中,這都要跨越語言、藝術、生活閱歷的鴻溝,在這種「意識對話」中,我們的計算機需要多麼強大才能解碼跨越了這麼多鴻溝的意識交流呢?

當然,這概率雖然足夠小,但也不是等於零。清華大學生物醫學工程系腦機介面研究組高小榕教授認為,前述山村娃娃和義大利畫家相當於一個地球人和外星人的對話,只要有足夠多的訓練,也未嘗不可能實現。

我們再把這個思維延伸一下,如果腦電解碼能力足夠強大,是否意味著人類意識能夠像電腦數據一樣儲存在硬碟上呢?

對於這個科幻式的問題,很多學術界人士給出的答案是讓人失望的。那些解碼數據僅僅是物理信號,並非人腦意識的腦電活動,它難以產生新的信息,也不能進行思維加工。

腦機介面的現實

今天的神經科學並沒有日新月異的突飛猛進,而是人工智慧的飛速發展給腦機介面帶來了空前的機遇。儘管如此,麻省理工學院大腦與認知科學系講席教授馮國平認為,腦機介面現實的考量是在物理性或確定性更強的功能上實現,但難以碰觸深一層的意識。

相對成熟的腦機介面研究是關於人體運動機能。猶他大學生物醫學工程團隊研發了一款高科技假肢,可以實現意識控制有觸覺,能夠執行輕鬆摘葡萄等動作。這個系統由 100 個微電極和導線組成,這個假肢手臂接入了佩戴者的神經系統,實現大腦向機械手臂發送動作信號。在機械手臂上安裝了向神經發送信號的感測器,以模仿手抓東西時的感覺。

林方對這類康復設備很看好。她認為,腦機介面的現實意義在於作為輔助工具,幫助那些有語言障礙或者運動障礙的人實現正常的器官功能。比如,一個運動障礙患者本身只有 40% 的某器官運動功能,如果這個腦機介面設備能夠幫助患者把功能提高到 80%,那麼這不僅是患者的福音,醫療保險公司也會對此樂見其成,因為這會減少醫療資源的投入。

但腦機介面研究需要落地才行。儘管馬斯克 Neuralink 的腦機介面項目最為高調,但除了他的設備能夠實現電極數目更多、電極更柔軟以及設備微型化,但並沒有本質上對腦電信號解碼的突破。《麻省理工科技評論》引述 Google DeepMind 神經科學理論學家 Adam Marblestone 的看法,將 Neuralink 比作裝備精良的登山隊,但那座大山仍在那裡,「真正需要的應該是一架直升機」。

多數業內人士看法是,如馬斯克這類侵入式的腦機介面只能用於病情嚴重的植物人或中風患者身上,而不能用於普通人,畢竟侵入的設備存在容易帶來感染、電池等材料更換等問題,畢竟大腦對自我保護的要求很高。

而對於 Facebook 利用近紅外光的可穿戴設備來解碼腦電信號的做法,多數人也不認可。因為非侵入式設備的精確性有限,難以實現複雜腦電信號的解碼

現實的做法如 Edward Chang,他們只針對癱瘓而失語的患者,這樣能夠採用開顱手術後用侵入式設備來解碼有限辭彙。因為在很多情況下,這些患者的大腦中仍然存在著產生流利語言所需的信息,而現在需要通過新的技術讓他們表達出來,那麼即使是少數辭彙的表達,對於他們的生活質量都是巨大的改善。

Marc W. Slutzky 也持這類看法,對於肌萎縮側索硬化(ALS)患者或中風患者,如果能實現 200 個辭彙信息的接受和表達,只要能達到像 Siri 這類語音識別系統接近 90% 準確率的話,就已經是巨大進步。

-End-

本文的撰寫還得到了以下人士的幫助,特此致謝:華南理工大學腦機介面與腦信息處理研究中心主任李遠清教授,上海交通大學智能計算與智能系統重點實驗室張麗清教授,華中師範大學生理學和神經生物學陳其才教授,解放軍總醫院第七醫學中心附屬八一腦科醫院功能神經外科何江弘主任,福建醫科大學附屬泉州第一醫院神經外科副主任醫師何雪陽。

參考:

https://www.jneurosci.org/content/39/15/2847.abstract

關注 DeepTech

發現改變世界的新興科技

(微信號:deeptechchina)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

特朗普可能封禁比特幣嗎?
新興科技帶路,探索新經濟的商業智慧!《麻省理工科技評論》全球聰明公司峰會 2019 為你揭曉答案

TAG:DeepTech深科技 |