視錯覺，神經網路的盲點

新聞 10-16

人類視覺是一種非凡能力。雖然已經在特定環境中演化了數百萬年，但它能完成早期視覺系統從未體驗過的任務。閱讀就是個很好的例子，比如識別汽車、飛機、路標等人工物品

但視覺系統也有一系列顯著缺陷，即我們感受到的視錯覺。實際上，研究人員已經發現有很多方法可以導致人們對顏色、尺寸、相對位置和動作產生誤差。

錯覺本身很有趣，因為它們可以讓人深入理解視覺和感知的本質。所以，通過發現新錯覺的方法來探索這些邊界會大有裨益。

圖 | 同心圓？（來源：麻省理工科技評論）

這正是深度學習的用武之地。近年來，計算機已經學會識別圖像中的物體和人臉，並能自己創建類似的圖像。所以，很容易想像到機器視覺系統應該能夠學會識別視錯覺並且自己創建錯覺圖像。

讓我們加入肯塔基州路易斯維爾大學的羅伯特·威廉姆斯和羅曼·亞姆波爾斯基的研究。這些人嘗試過這一壯舉，但發現事情並不簡單。目前的機器學習系統自己無法產生視錯覺——至少現在不能。這是為什麼呢？

首先看一些背景。深度學習的最新進展基於兩項技術的進步。第一是強大神經網路的有效性，一兩項編程技巧就能使它們很善於學習。

第二個是大型注釋資料庫的建立，計算機可以利用它學習。比如培訓計算機識別人臉，它需要成千上萬清晰標記的包含人臉的圖片。利用那些信息，一個神經網路就能學會識別面部特徵——比如兩隻眼睛，一個鼻子，一張嘴。更引人注目的是，兩個神經網路——生成對抗網路——可以相互指導來創建逼真但又屬於完全合成的人臉圖像。

威廉姆斯和亞姆波爾斯基用同樣的方法著手指導一個神經網路去鑒別視錯覺。計算能力很容易獲得，但缺少必要的資料庫。所以研究人員的首要任務是創建一個用於培訓的視錯覺資料庫。

事實證明這很困難。「靜態視錯覺的圖像的數量只有數千種，而且錯覺圖像的獨特種類的數量肯定非常低，或許只有數十種，」他們說。

這對當前機器學習系統來說是一項挑戰。「從如此之小而又有限的資料庫創建一個模型，意味著在模型生成和對人類視覺的理解上的巨大飛躍，」他們說。

所以威廉姆斯和亞姆波爾斯基編輯了有 6000 多個視錯覺圖像的資料庫，隨後培訓神經網路來識別它們。然後他們創建了生成對抗網路讓神經網路自己產生視錯覺。

結果令人失望。「對英偉達 Tesla K80 顯卡培訓 7 小時之後，並沒有生成有價值的圖像，」研究人員說，他們還將自己的資料庫供他人使用。

然而，這是一項有趣的結果。「人類已知的唯一視錯覺是由進化（比如蝴蝶翅膀上的眼睛圖案）或者人類藝術家所造就的，」他們指出。

這兩種情況中，人類因提供重要反饋而扮演重要角色——人類能看到錯覺。?但機器視覺系統不能。「無法理解這些錯覺背後的原理，生成對抗網路似乎不能學會如何欺騙人類視覺，」威廉姆斯和亞姆波爾斯基說。

這並不容易，因為機器視覺系統和人類視覺系統間存在重大差異。很多研究人員正在開發更接近人類視覺系統的神經網路。或許，它們能否看到錯覺是一項有趣的測試。

與此同時，威廉姆斯和亞姆波爾斯基並不樂觀。「似乎一個錯覺圖像數據集可能並不足以產生新錯覺，」他們說。因此，視錯覺是目前機器尚未攻破的人類經驗的一個堡壘。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 DeepTech深科技 的精彩文章: