當前位置:
首頁 > 新聞 > 大型資料庫支持面部識別抓取,隱私何處安放?

大型資料庫支持面部識別抓取,隱私何處安放?

人臉識別技術日漸強大,這要感謝科技,更要感謝你的「臉」。

在美國,很多公司和研究人員基於眾多「人臉識別資料庫」進行編譯和分析,這些圖片在全球被廣泛流傳,而這些操作都是在人們不知情的情況下進行的。

根據《紐約時報》報道,「人臉識別資料庫」抓取從社交網站、圖片網站、像 OkCupid 這樣的約會網站,以及在餐廳和大學校園架設的攝像機得來的圖片。雖然目前的數據尚不精確,隱私維權者還是指出,微軟建立的資料庫有超過一億張圖片,斯坦福大學有超過兩億張。

圖 | MS Celeb 資料庫中 2000 個人像信息可視化圖(來源:Megapixels)

這樣大規模的面部收集是為了能快人一步創造出領先的人臉識別技術。這項技術需要儘可能多地運用「神經網路」分析數字圖片,從而鑒別人類。而所謂的「神經網路」是一個複雜的演算法系統,它建立在大批量的數據所建立的認知模型上。

收集面部圖像的過程已經進行了十多年,但建立面部識別技術需要包括資料庫在內的更多條件,涉及到生物學、生理學、心理學、認知學、圖像圖形學、模式識別等領域,資料庫只是其中一個層面。人們往往不知道他們的圖片已經在數據集中。儘管照片上沒有名字,但是每個人都可以被認出來,因為每張臉都是獨一無二的。

根據研究報告顯示,像 Facebook 和 Google 這樣的科技巨頭聚集了大量的人臉識別數據,這些數據是不會被散播的。但根據一些學者、相關人士和公開論文顯示,一些公司和大學與澳大利亞、中國、印度、新加坡和瑞士的研究人員、政府和私人企業廣泛分享了他們的圖像數據。

數據集所帶來的問題正在凸顯,因為目前所啟用的技術正在以潛在的入侵方式被使用。近日公布的文件顯示,美國移民和海關執法局用這一技術掃描司機照片以識別非法移民。根據美國政府問責局上個月的一份報告,美國聯邦調查局在過去十年里使用這一技術將駕照和簽證照片與犯罪嫌疑人的臉進行對比。7 月 10 日,美國國會聽證會就該技術的使用問題進行了討論。

由於缺少對數據集的監管,人們的肖像可能被用在有道德問題的科技上,甚至這些照片會被濫用,維權者對這其中的可能性表示憤怒。

過去幾周,出於隱私考慮,微軟和斯坦福大學這類的公司和大學已經從互聯網上抹掉了它們的人臉識別數據。但研究人員和維權者認為,鑒於這些圖像早已被廣泛散播出去,它們仍將在美國和其他地方被使用。

圖 | 「洗腦」數據已從斯坦福大學文獻庫刪除(來源:斯坦福大學文獻庫)

斯坦福大學在 2014 年建立的人臉識別資料庫被稱為「洗腦」(Brainwash),在三天時間裡,研究人員用相機拍攝超過 10000 張圖像並存入資料庫,這些數據被用來與其他人分享。但當時咖啡廳的顧客並不知道自己被拍照且照片被用來做技術研究。

杜克大學的研究人員也在 2014 年用八台攝像機建立了一個人臉識別資料庫,這些攝像機架設在校園裡,這些攝像頭上標有號碼和電子郵件,不想被拍攝的人可以跟他聯繫。根據報道,杜克大學的研究人員最終收集到了 200 多萬幀視頻,其中包含 2700 多人的圖像。但這些圖像可能因為角度和採光原因不能被採用。

微軟聲稱他們建立了最大的面部數據集之一。這個名為 MS Celeb 的數據集包括超過 10 萬人的 1000 萬張照片。MS Celeb 表面上是一個名人資料庫,因為數據都來自公眾人物,這些圖片也被認為是公平的。但這仍然招來維權人士的不滿。這一資料庫曾在國際間傳播,但在今年春天被維權者發現之後便被撤下。

對此,民間成立了一個名為「監視技術監督項目」的民權和隱私組織,該組織建立了一個工具,可以讓人們檢查他們的肖像是否被收集在公開分享的人臉資料庫中。

-End-

坐標:北京·國貿

請隨簡歷附上3篇往期作品(實習生除外)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

PNAS:揪住最致命 RNA 病毒的「小尾巴」
安全漏洞頻現?用機器黑客保障網路安全,實現機器的自我突破

TAG:DeepTech深科技 |