麥克阿瑟天才獎得主解碼計算機視覺「原罪」：AI 如何認識人類世界

新聞 10-25

【AI WORLD 2017世界人工智慧大會倒計時17天】

「AI達摩」齊聚世界人工智慧大會，AI WORLD 2017議程嘉賓重磅發布

大會早鳥票已經售罄，現正式進入全額票階段。還記得去年一票難求的AI WORLD 2016盛況嗎？今年，即將於2017年11月8日在北京國家會議中心舉辦的AI World 2017世界人工智慧大會上，我們請到CMU教授、冷撲大師發明人Tuomas Sandholm、百度副總裁王海峰、微軟全球資深副總裁王永東、亞馬遜AWS機器學習總監Alex Smola 、科大訊飛執行總裁胡郁，華為消費者事業群總裁邵洋、騰訊優圖實驗室傑出科學家賈佳亞等國內外人工智慧領袖參會並演講，一起探討中國與世界AI的最新趨勢。

點擊文末閱讀原文，馬上參會！

搶票鏈接：http://www.huodongxing.com/event/2405852054900?td=4231978320026

大會官網：http://www.aiworld2017.com

新智元編譯

來源：QZ 作者：Caitlin Hu

編譯：文強，弗格森，劉小芹

【新智元導讀】麥克阿瑟「天才獎」獲得者Trevor Paglen訓練AI演算法，他的展覽項目「看不見的圖像的研究」（A Study of Invisible Images），反向展示AI如何認識世界。在此過程中，他注意到一些問題，比如作為業界標準的ImageNet數據集中，有很多圖像帶有奇怪的標籤，如今計算機視覺界中使用最多的一張女性圖像來自《花花公子》，類似這樣的數據問題以不顯眼但深刻的方式影響著AI研究、應用和AI元素越來越多的整個社會。

日前，一系列令人著迷的圖像顯示了計算機在被輸入西方文學、哲學和歷史作品中的圖像和符號後，能夠「看到」的東西，這些內容簡直太令人熟悉——原來，人工智慧里有卡拉瓦喬，有維米爾、有弗朗西斯·培根、達利……如果你努力，甚至還能看到愛德華·霍普。

雖然看上去與古典大師作品十分類似，但這些奇怪而生動的場景並非出自人類大師之手。它們是我們未來的主人——人工智慧演算法的產物。而這些AI演算法則出自藝術家Trevor Paglen之手，他上周剛剛獲得了50萬美元的麥克阿瑟「天才」獎。

計算機視覺中使用最廣泛的一張女性圖像，是《花花公子》的「11月小姐」

現年43歲Paglen認為，他的使命是聚焦我們周圍的數據交換、監控和自動化數據結構。他最近嘗試將相機對準世界的觀察者——各種監控攝像頭，Paglen深入了自動化系統的大腦，揭示了AI系統「眼中所見的事物」。

Paglen在紐約市Metro Pictures畫廊的新展覽，揭示了「雲的內部是什麼樣的？」「人工智慧系統實際看到的世界是什麼樣的？」

「彗星」（由AI創作，它被訓練來識別與歷史上的預示、徵兆有關的事物，例如彗星、日食、彩虹、黑貓、人臉形狀的雲）(Courtesy of Trevor Paglen and Metro Pictures, New York)

他的展覽項目，稱為「看不見的圖像的研究」（A Study of Invisible Images），顯示了研究人員用來訓練演算法進行標註、分類的圖像，展現了AI是如何處理風景、臉部或手勢的，以及AI生成的巴洛克風格的藝術。

Paglen將AI訓練圖像集稱為計算機視覺的「亞當和夏娃」。這些圖像中包括了美軍在上世紀90年代開始收集整理的，面部識別技術（FERET）計劃中的肖像，這是美軍用於教授計算機識別人臉的圖像，並成為此後計算機視覺研發的基礎。

美軍在上世紀90年代開始收集整理的，面部識別技術（FERET）計劃中的肖像，最初是一個軍事計劃，後來成為計算機視覺研究的基礎。

計算機視覺已經廣泛應用於人們的生產和生活中，從在機場登記到監控工場生產管理。所有的這一切都始於像FERET這樣的訓練資料庫，而這裡庫里的圖像標籤可能帶有少數研究人員無意識的偏見，還由可能來自於未經訓練的Mechanical Turk外包人員，以及實習生的偏見。

在去年發表在 New Inquiry上的一篇文章中，Paglen描述了CNN的識別誤差：

將印象派與寫實派大師馬奈的作品「Olympia」餵給在ImageNet訓練的CNN，這個CNN將這幅畫分類成立「卷餅」（burrito）。

馬奈的作品「Olympia」

或許，值得一提的還有計算機視覺中最著名的「夏娃」：Lenna，一名瑞典女性，其形象被《花花公子》雜誌撕毀，並於1972年被南加州大學的工程師掃描復原。後來《花花公子》雜誌授權，Lenna的形象獲得許可，出現在了世界各地的研究中，成為圖像處理測試的行業標準。自此，《花花公子》一張「11月小姐」的圖片已經成為計算機視覺研究中使用最廣泛的女性圖像之一。這也正是Paglen希望提醒公眾注意的「研究者選擇偏見」。

萊娜圖（局部）：萊娜圖（Lenna）是指刊於1972年11月號《花花公子》上的一張裸體插圖照片的一部分，是一張大小為512x512像素的標準測試圖。該圖在數字視頻處理學習與研究中頗為知名，常被用作數字視頻處理各種實驗（例如數據壓縮和降噪）及科學出版物的例圖。來源：維基百科

《IEEE圖像處理彙刊》（IEEE Transactions on Image Processing）的主編戴維·蒙森（David C. Munson），在1996年1月引用了兩個原因來說明萊娜圖在科研領域的流行：

「首先，該圖片很好的包含了平坦區域、陰影和紋理等細節，這些都有益於測試各種不同的圖像處理演算法。它是一幅很好的測試照片！其次，由於這是一個非常有魅力女人的照片。因此，多數由男性組成圖像處理研究行業傾向於使用他們認為很有吸引力的圖片，也並不令人驚奇。

人臉檢測可能是計算機視覺中最令人擔憂的應用。今天，在廣泛使用的圖像處理資料庫ImageNet中，一些隨機的個人照片仍然被標記為「jezebel（譯註：耶洗別，《舊約聖經》中的負面人物，以色列王國國王亞哈的王后，個性冷酷）」和「犯罪」，不知道在多少的時間裡默默地影響著分類和識別的結果。

「這到底是什麼？」Paglen說：「誰在發明這些類別，為什麼有這些類別，而沒有那些？是誰決定這些東西看起來是什麼樣的？

偏見是一種特徵，不是bug

Paglen 的工作室有一個全職的程序員，以及其他工作人員。使用定製的平台「Chair」，工作室可以運行自己的計算機視覺測試，在新的數據集上訓練AI，並生成顯示出AI所學習的東西的圖像。Chair 應用了不同的機器視覺演算法，包括 Caffe, Tensor Flow, Dlib, Eigenface, Deep Visualization Toolbox 和 Open CV。

在一個例子中，Paglen 對他的同事 Hito Steyerl 進行了面部分析。數百張快照拍下了她的各種表情，包括做鬼臉、大笑、打哈欠、叫喊、憤怒、微笑等等。每一張照片都帶有 AI 對 Steyerl 的年齡、性別和情緒狀態的猜測。在一張照片中，她被評估為74%的可能是女性。

提出這樣一個複雜的問題可能是荒謬但卻簡單的：計算機是否應該嘗試測量存在不可分割的特徵，例如性別、社會屬性、性格等——在沒有詢問它們的主題的情況下？（其次，100%的女性應該是什麼樣子的？）

圖：機器可讀的 Hito, 2017. 來源：Trevor Paglen, 「A Study of Invisible Images.」

AI視覺及其應用的這些盲區能被糾正嗎？

Paglen堅持認為，基於外表進行分類是一種根本上的危險行為。他說：「我認為，種族主義是機器學習的一個特徵（feature）——而不是一個bug。」「這就是你想要做的事情：你試圖根據元數據標籤來區分不同的人，而種族就是一個最大的元數據標籤，你不會想要把它從系統中拿出來的。」

即使可以消除機器視覺在訓練過程中的偏見，你仍然會擔心計算機視覺在影響現實世界的過程中的不透明性。計算機已經越來越多地為你做決定，基於大量的訓練數據和圖像庫，而這些數據和圖像對於那些對機器視覺研究不了解的人來說基本上是不可得的。這可能很快就會使傳統的問責制度變得更加複雜：未來，在企業或執法機構中使用計算機視覺技術的人可能無法追溯AI是如何做出決定的，更不可能讓這一過程對消費者和公民透明。

Paglen 想警醒我們的正是這種看不見的過程，他寫了一些書，包括《盲點》（Blank Spots on the Map: The Dark Geography of the Pentagon』s Secret World）和《視而不見：分類中看不見的運算》（Invisible: Covert Operations and Classified Landscapes）。

AI 如何將人類概念繪製成圖：超現實主義審美，揭露你或許不曾留意的本質

在某種程度上，Paglen 當前的展覽中，AI生成的藝術部分還是相當「黑暗」的。

為了創建它，藝術家的團隊訓練AI來識別資料庫中的圖像。這些圖像主要是視覺隱喻或符號，代表了哲學，當代文化，文學和精神分析等主題。例如，用於訓練人工智慧識別「吉兆」或「凶兆」的資料庫，包括彩虹和黑貓的圖像，而「美國的捕食者」資料庫包括北美當地的食肉動物和植物的圖像以及美國的圖像無人機，隱形轟炸機和Facebook創始人馬克·扎克伯格。

然後，AI被要求生成對這些概念進行描繪的草稿。Paglen說：「我們可以讓它畫出數以萬計的圖片，然後從中挑選出一些能引起我的共鳴的照片」，為機器人畫家扮演策展人角色的Paglen說。

最終的選擇是夢幻般的，總是有一點點融化的物體和朦朧的風景。Paglen說，美學並不是偶然的。「有這樣一種哥特式，甚至是超現實主義的審美觀念。這實際上是非常有意思的，就像任何一個藝術家想要了解一些關於我們現在所處的當下和政治的時刻的東西。

「死亡之路」（由AI創作，用第一次海灣戰爭後的照片訓練）

「一個男人」（由AI創作，訓練來識別人類和姿勢）

一個人工智慧繪製的章魚看起來像介於一個石筍和失控的鰻魚之間的東西，漂浮在黑暗的水中。一張關於一個男人的照片，沒有臉，但是看起來卻很熟悉，說是弗朗西斯·培根的肖像也不為過。一個灰色的風景，名為「死亡高速公路」堪稱完美，「色情」的照片似乎捕捉了人類形體的一些本質。

我周圍的遊客開始將他們所看到的東西聯想到人類所創造的名畫。「卡拉瓦喬，」有人低聲說。Paglen 鼓勵他們。「這看起來很像維米爾，」他建議，指向一個名為Venus Flytrap的發光靜物。

「捕蠅草」（由AI創作，訓練來識別「美國掠食者」，包括食肉植物和動物，無人機，隱形轟炸機和馬克·扎克伯格）

Paglen選擇像呈現繪畫一樣呈現這些圖像，掛在深灰色的牆壁上，讓人想起著名藝術博物館的畫廊。Paglen說：「我正在思考圖像，視覺和人類看東西的歷史。」

「通過給它一點點的歷史審美，我可以更加堅定地找到它。在將後台和圖像組合在一起方面，我非常清楚，這應該是一個混亂的Tate Britain的版本。

它很混亂。但是看起來還是令人驚訝。最後，結果與其他任何好的藝術對觀眾的影響是不一樣的：你以一種新的方式來看待圖像，並且欣賞它們可以為你做些什麼。

原文鏈接：https://qz.com/1103545/macarthur-genius-trevor-paglen-reveals-what-ai-sees-in-the-human-world/

深入了解AI 技術最新進展和產業情況，點擊「閱讀原文」，參加新智元世界人工智慧大會，馬上搶票……

【AI WORLD 2017世界人工智慧大會倒計時 16 天】點擊圖片查看嘉賓與日程。

大會門票銷售火熱，搶票鏈接：http://www.huodongxing.com/event/2405852054900?td=4231978320026

【掃一掃或點擊閱讀原文搶購大會門票】

AI WORLD 2017 世界人工智慧大會購票二維碼：

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※谷歌發布電影動作數據集AVA，57600精準標註視頻教AI識別人類行為
※美媒：現在是投資AI股票的最佳時機
※「吳恩達推薦」40歲開始學習，4周編寫第一個AI演算法的經驗談

TAG:新智元 |