當前位置:
首頁 > 知識 > 人類本身識別面部用的是什麼「演算法」?

人類本身識別面部用的是什麼「演算法」?

感謝@劉柯邀請。


這是一個相當好的問題,我最近一直在思考一些新的論文,強調了面孔各個特徵之間的相互關係與鏈接。尤其是反思Calder & Young (2005)的精彩綜述之後特意查閱了相關論文, 深感面孔處理的精妙,以及深藏的處理 『演算法』 之巧妙。盡讓我斗膽在此大致介紹下自己的理解,望批評指正。


(最近我有個Live,在周六,也是說關於面孔識別。有興趣可以來看看華沙的 Live—— 看臉的科學第二集 - 看臉的世界 - 知乎專欄)

按照David Marr等視覺研究大神的精彩觀點,我們任何的視覺處理都是信息處理(而非簡單地、粗暴地處理看到東西本身);很顯然面孔,這一種最為重要的、與社會生活息息相關的視覺信息不能免俗,也是一種信息處理過程。所以題主提到能不能用計算機模擬其實是個非常好的問題,馮諾依曼機作為以人類為原本的計算機,完全應該有人類的能力。不過,很抱歉,我們目前都沒有完全理解視覺過程,而目前計算機的很多CV研究並不完全按照人類的識別方法進行(老實說,可能計算機視覺和人類視覺的交際也就到70年代Hubel & Wiseal的論文為止了吧)。所以我的觀點其實很簡單,計算機目前基於更強的計算能力,完全可以利用已知的一些大腦處理面孔方式對於面孔進行分析,但是效率和準確度和人類不好比(嚴格說是效率);當我們更加理解了大腦的原理之後,相信不在不遠的將來,計算機完全可以做到更好。


那麼人類本身用什麼演算法呢?


很簡單,整體識別


我先說下,面孔識別的相關大腦結構。按照經典的面孔識別模型(Bruce & Young, 1986; Haxby, Hoffman, & Gobbinni, 2000),我們大腦利用FFA(梭狀回面孔區;Kanwisher, McDermott, & Chun, 1997),pSTS(後顳上溝皮層; Hoffman & Haxby, 2000),OFA(枕葉面孔區; 如 Yovel, Kanwisher, 2005)這三個核心面孔處理區域以及 『借用』 其餘的視覺和高級處理皮層達到面孔的識別。這幾個腦區有多重要呢,我舉個不恰當的例子,人類的好朋友狗狗們,就是因為有類似人一樣的面孔識別區域(也在下顳葉,和人類位置很接近;Dilks et al., 2015),才能記住主人的面孔。

就如同Mishkin與Ungerleider教授(1982)的精彩研究結論一樣,我們處理面孔的時候也把信息分為了兩束進行分析。第一束往下顳葉走更加依賴於FFA,往往是處理面孔上不變的信息,比如身份(是誰);而另一束往頂葉走,依賴於pSTS,處理面孔上動態的信息,比如表情,面孔方向等。這就是面孔處理的一個基本演算法。也就是依賴核心腦區(佐以其餘神經系統幫助),把面孔信息進行粗略劃分之後進行分析。當然杏仁核等邊緣系統可以從上丘直接獲得輸出(此處不展開,可以看看我專欄提到的),但是大致途徑類似。總體而言,面孔上的信息會在FFA進行匯總(Yovel, Kanwisher, 2006),然後往更高級視覺皮層傳遞。那麼這部分信息到底是什麼呢?這就是整體識別的關鍵信息。


可能和大家想像的不一樣,我們識別面孔的時候其實並不是只依賴一些局部的信息,比如眼睛、嘴巴。而是把面孔上的信息匯總在一起,成為一個整體來進行分析(如Yin,1969發現的面孔倒置效應就是整體識別的一個好佐證)。這樣的分析高效快捷。那麼整體是怎麼分析的呢?這就得說道一個筆者特別喜歡的觀點:面孔模板假說。


我們對於面孔的理解和分析都基於我們所看到的面孔(Webster & MacLeod, 2011)。倘若我們把所有面孔都假設存放與一張平面上,那就是一張面孔的地圖(Valentine, 1991)。這一章地圖就是反映我們識別面孔的方法:我們的演算法就是通過上述大腦區域的群體編碼,根據不同神經細胞的活動程度,我們可以在腦海中形成一個 『矩陣』,這個矩陣編碼了看到的圖片在某個判斷維度上(如表情)與模板(如表情模板)的距離;通過這個距離,我們可以清楚明白這張面孔傳遞的信息。因為通過模板,信息得到簡化,可以更高效分析。甚至可以說面孔的處理基本都是以這個方法進行,所以說面孔處理可以說在演算法層面互有重疊(Calder & Young,2005)。


再具體一點,整體識別中的信息就是面孔上的二階關係信息(second-order rational information)比如說五官之間的距離,嘴角的彎曲程度之類的(Maurer, 2002)。這部分信息與模板的對比就是筆者所提到的 『矩陣』 (用矩陣更方便理解)。基於篇幅原因不展開討論。


簡而言之,大腦處理面孔信息的時候,往往提取出面孔上信息的相互關係,以與模板距離的方法整體識別面孔。這就是大腦處理面孔信息 『演算法』 的一個簡單介紹。

參考文獻


Bruce, V., & Young, A. (1986). Understanding face recognition.British journal of psychology,77(3), 305-327.


Burton, N., Jeffery, L., Calder, A. J., & Rhodes, G. (2015). How is facial expression coded?.Journal of vision,15(1), 1-1.


Calder, A. J., & Young, A. W. (2005). Understanding the recognition of facial identity and facial expression.Nature Reviews Neuroscience,6(8), 641-651.


Dilks, D. D., Cook, P., Weiller, S. K., Berns, H. P., Spivak, M., & Berns, G. S. (2015). Awake fMRI reveals a specialized region in dog temporal cortex for face processing.PeerJ,3, e1115.

Haxby, J. V., Hoffman, E. A., & Gobbini, M. I. (2000). The distributed human neural system for face perception.Trends in cognitive sciences,4(6), 223-233.


Hoffman, E. A., & Haxby, J. V. (2000). Distinct representations of eye gaze and identity in the distributed human neural system for face perception.Nature neuroscience,3(1), 80-84.


Kanwisher, N., & Yovel, G. (2006). The fusiform face area: a cortical region specialized for the perception of faces.Philosophical Transactions of the Royal Society of London B: Biological Sciences,361(1476), 2109-2128.


Kanwisher, N., McDermott, J., & Chun, M. M. (1997). The fusiform face area: a module in human extrastriate cortex specialized for face perception.The Journal of neuroscience,17(11), 4302-4311.

Valentine T. (1991). A unified account of the effects of distinctiveness, inversion, and race in face recognition.Quarterly Journal of Experimental Psychology,43A,161–240.


Webster, M. A., & MacLeod, D. I. (2011). Visual adaptation and face perception.Philosophical Transactions of the Royal Society B: Biological Sciences,366(1571), 1702-1725.


Yin, R. K. (1969). Looking at upside-down faces.Journal of experimental psychology,81(1), 141.


Yovel, G., & Kanwisher, N. (2005). The neural basis of the behavioral face-inversion effect.Current Biology,15(24), 2256-2262.


請您繼續閱讀更多來自 知乎 的精彩文章:

布拉格是個怎樣的地方?
如今有哪些對洪水的調控手段能最大限度減小洪災?
如何讓普通人理解物理學中「場」的本質?
世界知名的芭蕾舞團各是如何運作的?
人類對地球內部的探索能達到什麼程度?鑽深井研究地球內部有沒有意義?

TAG:知乎 |

您可能感興趣

人臉識別是什麼技術 人臉識別概念股有哪些
蘋果什麼破人臉識別功能?根本沒用!
蘋果面部識別的好與壞 專家們是怎麼說的
面部識別的好與壞,專家們是怎麼說的
指紋識別難道不好用?面部識別要成潮流!
靈長類動物臉部識別演算法被破譯,大腦黑箱或根本不存在
「重磅」靈長類動物臉部識別演算法被破譯,大腦黑箱或根本不存在
人臉識別+社保,你猜可以做什麼?
從「反人臉識別」技術看「人臉識別」有哪些潛在的風險?
攻破人臉識別應用難題?這家美國AI安防公司是這麼做的
手機面部識別,是「雞肋」還是被低估的黑科技?
怎麼用怎麼爽!正面指紋識別手機推薦
指紋識別和人臉識別哪個將會成為主流?
為什麼領導會用能人,卻識別不了小人?
別磨嘰,學完這篇你也是圖像識別專家了
隱私權倡導者用有圖案的衣服「戲耍」臉部識別技術
為什麼說面部識別功能將帶來一場隱私災難?
心靈閱讀演算法識別面孔
要怎樣改造自己的臉,才能騙過人臉識別?