當前位置:
首頁 > 新聞 > 讓 AI 理解人類的「看走眼」:新研究解釋人眼錯覺並優化機器視覺

讓 AI 理解人類的「看走眼」:新研究解釋人眼錯覺並優化機器視覺

相信大家都體驗過光學錯覺圖片「亂花漸欲迷人眼」,但是研究人類大腦如何出現感知錯覺的現象仍是科學研究的一個活躍領域。

光學錯覺中有一類被稱為「環境現象」,眼見不一定為實,而是依賴圖片的「環境」。當一種顏色被另一種不同的顏色包圍時,它顯示的顏色會受到所處環境的影響。有時被包圍的圖形會顯示出相近的顏色,如下圖 (f),藍色細環被深綠色的環包圍,細環顯出淡綠色;但有時顏色會完全被「改變」,如下圖 (b),粉色大環讓灰色小圓看起來像綠色的。

圖 | 造成視覺錯誤的圖片(來源:布朗大學)

最近,美國布朗大學一個計算機視覺專家小組建立了能像人眼那樣產生光學錯覺的神經網路模型,提高了對人類視覺系統的認識,也將改善機器視覺。他們從最原始的正方形出發,研究「環境現象」的視覺神經機制,他們的研究成果於 9 月 20 號在 Psychological Review 雜誌上發表。

布朗大學認知、語言和心理科學副教授 Thomas Serre 是論文的通訊作者。「我們的視覺在日常生活和識別物體方面是如此強大,錯覺現象可能代表了我們視覺系統的邊緣情況。」這項研究由布朗大學卡尼腦科學研究所由 Serre 領導的小組發起,他們建立的模型考慮了視覺皮層解剖學和神經生理學的數據。該模型旨在捕捉相鄰皮層神經元如何相互發送信息,並在呈現複雜刺激(如環境現象錯覺)時如何調整彼此的反應。研究的一個創新點是假設了神經元間產生反饋連接的特定模式。根據視覺環境,這些反饋連接能夠增加或減少,也就是刺激或抑制中樞神經元的反應。

建立合適的神經網路模型則是一項難題。如今流行的深度學習是一種強大的人工智慧,它能夠學習數據中的複雜模式,例如識別圖像和解析正常語音,並且依賴於多層人工神經網路協同工作。但大多數深度學習演算法只包括層之間的前饋連接,無法詮釋 Serre 開創的層內神經元之間的反饋連接。

模型構建完成後團隊開始了對環境錯覺的測試。通過調節刺激或抑制連接的強度,神經元以與靈長類動物視覺皮層神經生理學一致的方式作出反應。研究小組在各種情境下測試模型,發現模型能像人類一樣感知幻覺。為了測試模型,他們有選擇地去除了一些可能太複雜的不必要連接,發現當模型缺少一些連接時,數據與人類的感知不匹配。

Serre 說:「我們的模型是最簡單的,足以解釋視覺皮層在環境現象錯覺方面的行為。這真是一本教科書式的計算神經科學論文——我們以一個模型來解釋神經生理學數據,並以人類心理物理學數據的預測結束。」

除了為人類眼中的環境現象錯覺提供統一的解釋之外,Serre 還希望藉此模型提高機器視覺。他指出,目前最先進的機器視覺演算法,例如或識別人臉或停車標誌的演算法,在觀察整體環境方面尚有一定困難。比如,如果在停車標誌上貼上另一種圖案時, 機器視覺可能會誤認為是一個限速標誌,這是有安全隱患的。也許考慮到環境現象的機器視覺深度學習程序能夠解決這樣的弱點,在辨識過程中更不易受影響。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

英偉達推出最快的GPU產品Tesla T4,語言推理速度較上代快3.6倍
話宇專欄 天使墮落為魔鬼?SpaceX答應為美軍發射殺傷性太空武器

TAG:DeepTech深科技 |