爬取30億人臉被600家執法機構使用，這家公司揭美國數據隱私老底

科技 01-22

機器之心報道

機器之心編輯部

你在臉書、推特等所有社交網路上使用的圖片，都已被這家創業公司收集成數據集，而這家公司的客戶里包括 600 多家美國執法機構。

在本周紐約時報刊登的一篇報道中，一家名為 Clearview AI 的創業公司，因其「數十億張圖像」組成的面部識別系統，一舉成為社會熱議的焦點。

如果任何一個陌生人在街上拍下你的照片，手機 app 很快就能搜到你的姓名、住址和其他詳細信息，這個世界會變成什麼樣子？

Clearview 已經很大程度上讓這個想法成為了可能，這家公司設計了一款人臉識別程序，比如說你給某個人拍張照片，把照片傳到程序上面，就可以查看這個人的所有公開照片，包括這些照片的地址鏈接。

這個程序的的背後是一個超過三十億張圖像的資料庫，Clearview 宣稱這些圖像是在 Facebook,、YouTube,、Venmo 等社交媒體上抓取的，這個量級遠遠超出了美國聯邦政府或者任何一家矽谷巨頭的的資料庫體量：FBI 自己的資料庫收集了全美公民的護照和駕照照片，其中「僅」包含 6.41 億張照片。

僅靠一張臉，即可檢索出全網所有相關圖片。

聽起來有點科幻？想來想去，《黑鏡》裡面確實有一集是講這樣的故事的。

看到任何陌生人都能很快得到他/她的信息，現實與科幻就差個打分系統了。

據報道，從去年開始，美國有 600 多家執法機構都藉助這款程序來協助偵查犯罪案件，諸如入店行竊、信用卡詐騙、謀殺及性犯罪事件等等。不過大部分執法者對其背後的原理知之甚少，尤其是人臉圖像採集過程中所涉及的隱私問題。

目前，Clearview 的數據集還沒有向公眾開放。公司的官網上顯示，其產品僅向執法部門開放。但如果它一旦公開，那麼對於普通人來說，通過一張臉去扒出一個人的資料，會變得如同在谷歌搜索一個人的名字那樣簡單。

更進一步來說，該程序還能用來做很多事情：比如識別抗議活動中激進分子的身份，不僅能搜出他們的名字，甚至還能知道他的住所、工作單位和社交關係網路；如果在地鐵上遇到一個感興趣的人，也可以這樣做。

如上所述，Clearview 的系統是構建在包含 30 多億張爬取自網路（如 Facebook、YouTube 和 Venmo 等）的圖像資料庫上，爬取數據的過程可能違反了網站服務條款。執法機構可以根據具體情況上傳相關人員的照片，然後 Clearview 系統會返回相匹配的圖像以及圖像鏈接、社交資料等。

這家公司創立於 2016 年，兩位聯合創始人中，一位是來自澳大利亞的越南裔人 Hoan Ton-That，他在十三年前輟學並移民美國，在嘗試成為職業模特以後，突然投身科技圈，每天與人工智慧、機器學習、圖像識別的知識為伴。

Clearview AI 創始人 Hoan Ton-That。圖源：紐約時報。

另一位是 Richard Schwartz，目前已經 60 多歲，此前是報社的社論編輯，後來擔任過紐約市長 Rudy Giuliani 的助手。這兩個人就是在 2016 年的一次讀書交流活動上相識的，之後共同創辦了公司。值得一提的是，這家公司在初創過程中還獲得了來自 Peter Thiel 的投資，後者是著名的 PayPal 創始人，也是 Facebook 的天使輪投資人。

該公司的官網頁面過分簡潔：主要是一些業務的介紹，而對於創始團隊、辦公地點、發展歷程等方面則沒有細寫。

肆無忌憚的網路數據爬取引發擔憂

儘管此類系統可以為警方的辦案過程提供便利，但不可避免的是，警方在使用人臉識別演算法的過程中伴隨著風險。假陽性識別會導致罪行誤判，隱私擁護者擔心人臉識別的過度使用導致人們時刻處於警方的監控之下。

包括此前一直飽受爭議的人臉識別偏見問題，這是個由來已久的問題，在中日韓等亞洲國家開發的演算法，識別東亞人的臉比白種人更準確；在歐洲國家開發的演算法，在識別白種人的面部特徵方面更加擅長。

而且使用這套系統的前提，是要把自己的照片上傳到 Clearview AI 的伺服器上，目前還不確定這是否安全——儘管 Clearview 表示其員工不會泄露你的照片。在該公司展示其技術的過程中，紐約時報記者 Kashmir Hill 竟發現公司可以在警方的系統中追蹤她：

雖然 Clearview 公司正在避免隱私泄露的嫌疑，但人工智慧系統確實是在進行不間斷地監視。當一些警官應要求通過 Clearview app 搜索 Hill 的圖片，很快 Clearview 公司的代表就打來電話，詢問他們是否在和媒體進行採訪——這很可能說明這家公司有能力得知執法部門正在搜索什麼。

比起數十億張照片被做成數據集更重要的是，Clearview 已經與超過 600 家美國執法部門達成了合作。儘管還沒有對人臉識別系統的準確性進行實驗性驗證，但這家公司提供的技術已經可以做到遮住下半張臉，依然可以識別出你的身份，而且可以列出很多連你自己都不知道的照片。

Clearview 公司產品的曝光引發了各路媒體對於人工智慧隱私的探討，紐約時報援引一名專家的話說，這些人臉識別系統中的商業資本成分，必須在被濫用之前全面禁止。「一直以來，我們都在依靠行業自律來避免技術被應用到危險的方向上。但現在因為盈利的誘惑，一切都被打破了，」美國東北大學計算機科學教授 Woodrow Hartzog 說道。「如果人臉識別的技術不受控制，顯然弊大於利，現在唯一能做的就是禁止它。」

大規模的數據，高性能的演算法吸引了大量執法部門的注意，不過能讓 Clearview 獲得 600 多家部門青睞的主要原因肯定是價格。據報道，公司向執法部門推銷的價格僅為 2000 美元。

Clearview 程序中的底層代碼還顯示該軟體具備與 AR 技術配合使用的能力，這意味著佩戴 AR 眼鏡的人可能會使用 Clearview AI 來立即確定任何人的細節信息。

在被媒體報道之後，Facebook 正準備調查 Clearview 搜集數據的行為。在一份聲明中，Facebook 發言人表示：「我們的政策禁止其他機構爬取 Facebook 上的信息，或將信息加入索引。因此我們正在審查有關這家公司的聲明，如發現違反規則的情況，我們將採取適當行動。」

參考內容：

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！