機器學習理解上最新案例：「以貌取物」與「以貌取書」

知識 11-17

1新智元編譯

來源：MITtechnologyreview

譯者：劉小芹

【新智元導讀】本文介紹 MIT Technology Review 最近報道了關於機器學習的兩項研究成果：讓機器學會對人產生「第一印象」、能憑藉書的封面判斷內容。這兩項研究對於增強機器「智能」有很大啟示。

機器學習理解上最新案例：「以貌取物」與「以貌取書」點擊播放 GIF/58K

機器視覺演算法學會「以貌取人」

社會心理學家很早就發現，人們能在一瞬間對一個人作出評價，所依據的僅僅是對方的外表，特別是面容。我們使用這些評價來判定初次見面的人是否值得信任，是否聰明，是支配型還是社交型，是否幽默等等。

這些判斷可能正確，也可能不正確，而且一點也不客觀，但它們具有一致性。在同一情形下讓不同的人評價同一張臉，人們往往會給出一致的評價。

這就引出了一種有趣的可能性。機器視覺和人臉識別的快速進步已經讓計算機能夠識別各種各樣的人臉表情，甚至能夠評價臉的迷人程度。那麼是否也能讓機器看一張臉，然後像人類那樣得出對臉的第一印象呢？

對這個問題，美國聖母大學的研究者 Mel McCurrie 等人最近得出了肯定的答案。他們訓練的機器學習演算法讓機器能夠像人類一樣「以貌取人」，判斷一張臉是否值得信任，是否強勢，等等。

他們的方法相當直截了當。對任何機器學習過程來說第一步都是創建訓練演算法的數據集。在這裡數據集是一系列已被標註人們的主觀評價的人臉照片——值得信任、支配型、聰明，等等。McCurrie 等人利用一個叫 TestMyBrain.org 的網站來建數據集，這是一個很受歡迎的心理測試網站，擁有超過160萬參與者。

該團隊讓參與者對6300張人臉的黑白照片進行評判，每張臉都由32個人評判其可信任性和支配性，另外15人評判其智商和年齡。

有意思的是，這些評價都沒有客觀答案——這個測試僅僅代表評價者的主觀印象。當然，我們可以知道準確的年齡，也可以測試IQ，從而得出人們的主觀印象是否準確。但 McCurrie 等人對此不感興趣。他們想知道的是人對照片里的臉的第一印象，然後訓練機器重現相同的結果。

收集到數據後，團隊用6000張照片來訓練他們的機器視覺演算法，用另外200張照片來做機器視覺參數的微調。所有這些訓練都是為了讓機器學會用與人類一樣的方式來評價臉。

MaCurre 等人用剩下的100張照片來測試機器視覺演算法，也就是說，測試機器能否和人類作出同樣的評價。

結果相當有趣。機器再現了它從人類那裡學到的行為。當呈現給它一張臉的照片時，機器對其的評判幾乎與人類一樣——一樣的可信任性、支配性、年齡和IQ。

該研究還發現了機器是如何評判人的，譬如，機器針對人臉的哪個部位來做評價。這是通過在讓機器做評價時蓋住照片中臉的某些部位做到的。如果蓋住後的評價結果與沒有蓋住的結果非常不同，就可認為這個部分非常重要。這樣，研究者可以知道機器在評價時依據的是臉的哪些部分。

有意思的是，這也與人類評價時依據的部位相似。社會心理學家發現人們在評估另一個人是否可信任時傾向於看嘴，而眉頭低垂通常表示支配性強。而這些也正是機器視覺演算法從訓練數據中學到的。

機器學習理解上最新案例：「以貌取物」與「以貌取書」

這些引出了一系列有趣的應用。研究者首先把它應用於演藝界，他們讓機器先根據愛德華·斯諾登和朱利安·阿桑奇兩人的照片來評價，然後再讓機器評價在電影中分別飾演他們的兩位演員。結果顯示機器對兩位演員和兩位本人的評價很相似，可信任性都很低，這表明了電影選角準確，演員與他們飾演的角色有一致的特性。

研究團隊還將該演算法應用到電影的各個場景，了解機器對角色的評價如何隨著時間改變，這也為了解人們的感覺變化提供了一種衡量方法。這樣的觀察方式也可應用於研究、市場營銷、政治活動等等。

這一研究有助於理解人們對他人產生先入之見的原因，以前這種了解都依賴於微妙的社會線索。另外，讓機器人預測和複製這種人類對他人形成第一印象的行為也成為可能。這項研究一個有趣的推論在於，它將如何影響人類行為？如果某人知道他們的某個臉部特徵被視為不可信任，他可能通過改變面部表情等辦法儘力去改變這種印象。

深度神經網路學會看「以貌取書」

書的封面對判斷一本書的內容或主題非常重要，讀者常常根據一本書的封面決定是否要拿起它閱讀。而且，人們在根據封面來判斷內容方面往往天賦驚人，即使不看標題只看封面通常就能判斷一本書是旅行書、美食書還是人物傳記。我們已經報道機器學習演算法能夠以貌取人，那麼，機器能不能「以貌取書」呢？答案是肯定的。

日本九州大學的研究者通過訓練深度神經網路，讓機器能根據一本書的封面判斷其類型。他們的方法也相當直截了當。他們從亞馬遜網店下載了137788本書的封面，並根據亞馬遜對該書的分類標註，如果網店中該書被分到多個類別，只取第一個。然後，他們用80%的封面作為訓練數據集來訓練神經網路通過封面識別流派。該神經網路有四層，每層有512個神經元。他們接著用另外10%的封面驗證模型，最後用剩下的10%封面做測試。

機器學習理解上最新案例：「以貌取物」與「以貌取書」

結果顯示，有40%的幾率模型能夠將正確的類型列在前三個選項，20%的時候模型能識別出完全正確的書籍類型。這個結果顯然比隨機估計的準確率高。其中某些類型的書籍更容易識別，例如旅行書、美食書和計算機技術類書籍。尤其當美食書使用食物做封面時識別正確率很高，但當美食書使用廚師的照片做封面，模型就常常辨認錯誤。模型也對傳記和回憶錄類的書籍很棘手，常常把它們識別為歷史類書籍。

該研究的短板之一是沒有把人類的識別能力和演算法做比較。我們現在尚不知道機器在這項任務上是否比人類更好，但可以確定的是，不管人類看封面識書的能力多厲害，機器趕超人類只是時間的問題。這項研究對書籍封面設計者來說也相當有趣，讓他們能夠參考演算法的判斷改善封面設計。待模型準確率更高，訓練機器來設計封面也是不錯的想法。

TAG:新智元 |

您可能感興趣

※案例來源於《形意心理學與恩威並施綜合療法》著作中：對一例精神分裂症患者的諮詢過程
※案例討論：智能手機應用相關研究的倫理評審考量
※不講禮貌會被滅國的典型案例
※畫面解讀法以及案例分析
※分享：機器視覺實際應用案例
※手機鋼化膜和白邊填充液真的能起到美觀作用嗎？實際案例揭曉答案
※環境空氣質量監測PPP模式依效付費機制案例解析
※如何繞開心理防禦，了解來訪者真實的想法？（附攻擊性兒童案例分析）
※原創作品：品牌案例整理
※以-胡蘿蔔素為「典型案例」，證實營養補充劑並不「一勞永逸」
※正印在各柱之意義案例詳解可以借鑒！
※以β-胡蘿蔔素為「典型案例」，證實營養補充劑並不「一勞永逸」
※新手必看，案例講解MACD買賣技巧
※戲劇製作人、管理者必讀書目文化藝術演出市場的經典案例
※「投資者保護?明規則、識風險」案例——花言巧語不可一概而信理性分析方能去偽存真
※案例發聲：逆轉腫瘤基因突變，精準生命系統管理可以做到！
※活字格案例｜綜合報表信息管理系統搭建
※解鎖心靈密碼，開啟暢意MBA生涯＆案例分析的方法與技巧
※案例 l 3D列印技術在醫療植入物研發與製造中的應用價值