當監控攝像頭有了AI大腦，是福還是禍？

科技 02-03

編譯 | 堆堆

編輯 | 麻粒兒

微信 | ai_xingqiu

網址 | 51aistar.com

我們通常會把監控攝像頭想作是電子眼。對此，不同的人看法也大相徑庭，有人認為電子眼是在監控我們，有人認為它在幫助我們密切注意環境。

但實際上，它們更像是舷窗：當有人通過舷窗看時，它們才有用武之地。有時候這意味著人們會從磁碟錄像中查看現場畫面。

但是大多數監控攝像頭都是被動觀察者。它們只是用作震懾，或是在出現問題時提供線索。你的汽車被偷了？那就去查看閉路電視監控吧。

不過這一情況正在發生改變——且以一種很快的速度。人工智慧為監控攝像頭配備了數字大腦來匹配「眼鏡」，並讓其無需人力參與就可自行分析現場視頻。

這對公共安全來說也許是好消息，它可以幫助警察以及第一目擊者更容易得發現犯罪或事故。此外，它還可以廣泛應用於科學和工業。但是這卻會嚴重侵犯未來的隱私並對社會公平帶來新的風險。

如果政府通過閉路電視能夠追蹤到大量人群，那會發生什麼情況呢？如果警察在資料庫中僅僅通過上傳側面照片，就能以這種「電子」方式在城市裡跟蹤你呢？如果在當地購物中心，攝像頭運行的是一個具有偏見的演算法，它會因為不喜歡某一類型的年輕人就去通知警察嗎？

這些情況也許距離我們還很遙遠，但當下我們已經發現人工智慧結合監控會帶來什麼樣的後果了。IC Realtime就是一個例子。去年十二月發布的旗艦產品被稱作是閉路電視界的Google。

有一個叫做Ella的應用及網頁平台就是利用人工智慧分析視頻中發生的事情並且使其提供及時搜索。

Ella可以識別成千上萬種自然語言查詢，用戶可以搜索鏡頭從而找到呈現特定動物、穿著某種顏色衣物或是單個車型的片段。

在網頁演示中，IC Realtime的首席執行官Matt Sailor向我們展現了Ella與大約40個攝像頭連接起來對一個公園實施監控。他輸入了各式各樣的搜索內容——「紅衣服的男士」、「UPS火車」、「警車」——幾秒鐘時間內，所有關鍵詞都得到了相關的影像片段。

之後，通過限定時間和地理位置，他將搜索結果的範圍縮小了並展示了用戶可以如何表達贊成或是反對從而優化結果——就像Netflix一樣。

「舉個例子，某地發生了一起搶劫，但你不知道實際情況到底如何。」Sailor說道，「但搶劫發生之後，有一輛Jeep牧馬人向東加速駛去。所以我們就輸入『Jeep牧馬人』，然後我們就可以獲得影像片段了。」屏幕上開始出現片段，顯示出鏡頭前滑過的多輛Jeep牧馬人。

Sailor表示這是人工智慧和閉路電視結合的第一大優勢：更容易去找到你要尋找的內容。「沒有這項技術，除了攝像頭，你什麼都不知道。你需要連續數小時觀看影像從而進行篩選。」他解釋道。

Ella在Google Cloud上運行，它可以從幾乎任何一個閉路電視視頻系統中搜索鏡頭。Sailor表示：「從單攝像頭系統——例如保姆攝像頭或寵物攝像頭——到擁有成千上萬攝像頭的企業系統，Ella都能適用。」用戶每月支付費用，起價為大約7美元，總價會根據攝像頭數量的增加而增長。

IC Realtime的目標受眾是各種規模的企業，但它也認為這一技術能夠吸引個人消費者。新興市場上，亞馬遜、Logitech、Netgear以及谷歌旗下的Nest智能家居已經讓這些顧客開始廣泛使用安防攝像頭。

但是Sailor表示這一技術要比IC Realtime簡陋得多。這些攝像頭連接到家庭WiFi上，通過應用程序提供實時視頻流。當它們發現有東西在移動的時候，它們就會自動記錄影像。

但是Sailor表示它們無法區分闖入者和鳥類的區別，這就會導致很多誤報。「這是非常基礎的技術，已經存在很多年時間了。」他說道，「這不含人工智慧，也不包括深度學習。」

這種情況不會持續太長時間了。雖然IC Realtime提供的雲分析工具可以升級現有傻瓜式的攝像頭，其他公司則是直接將人工智慧嵌入在硬體里。

Boulder AI就是這樣一家初創企業，公司利用自己獨立的人工智慧攝像頭推出「視覺即服務」。在設備中結合人工智慧帶來的優勢在於，它們無需互聯網連接就能工作。Boulder AI向各行各業出售產品，為每位客戶量身定製機器視覺系統。

「這些應用已經遍布各行各業了。」創始人Darren Odom在採訪中這樣說道，「我們的平台出售給了銀行業、能源業的公司。我們甚至有一個應用是去觀察披薩，決定它們的形狀和大小是否合適。」

Odom還舉了一個在愛達荷州建造水壩的客戶例子。為了符合環保規定，他們正在監控設施頂部的魚類數量。Odom表示：「他們過去是安排了一個人坐在窗口看著魚梯，數有多少條鮭魚游過。（顧名思義，魚梯就是一條階梯式的航道，魚類可以藉此向上游。）之後，他們轉而使用視頻技術，有人（遠程）進行監控。」

最終，他們聯繫到了Boulder公司，後者為其打造了一個定製化的人工智慧閉路電視系統，從而識別通過魚梯向上游的魚的種類。「我們真的可以通過計算機視覺來識別魚的種類。我們現在能夠100%的識別愛達荷州的鮭魚。」odom驕傲地說道。

如果IC Realtime代表的是市場的通用端，那麼Boulder則呈現了精品承包商可以在這個市場上做些什麼。這兩種情況下，這些公司現在提供的服務不過也只是冰山一角。

就像機器學習在識別物體能力方面取得迅速進步一樣，它分析場景、活動和動作的能力也有望快速提升。一切準備工作都已經完成，包括基礎研究、計算能力和訓練數據集——這是創建出色人工智慧的關鍵要素。

視頻分析的兩個最大數據集來自YouTube和Facebook，兩家公司都希望人工智慧幫助它們控制平台上的內容（不過兩家公司也都承認現在還沒有做好準備）。

例如說，YouTube的數據集包含超過45萬小時帶標籤的視頻，公司希望這能夠激發「視頻理解的創新和進步」。參與構建此類數據集的機構有很多，這也讓我們對該領域的重要性有了一些了解。谷歌、麻省理工學院（MIT）、IBM和DeepMind都參與進來並創建了類似的項目。

IC Realtime已經在致力於開發面部識別等高級工具了。之後，它想要分析屏幕上發生的情況。Sailor表示他已經和教育行業的未來顧客進行過交談，對方希望當學生在學校遇到麻煩的時候，監控能夠識別出來。

「比如說，他們對於發生打架的預先通知這一功能很感興趣。」他說道。所有的系統都需要注意聚集在一起的學生，之後提醒某個人，他就可以查看視頻內容來看看發生了什麼或是親自去調查。

Boulder也在探索這類高級分析。公司正在開發的一個原型系統就是分析銀行內人們的行為。「我們專門尋找壞人，並且區分正常人的行為和越界者行為之間的區別。」Odom說道。

為了做到這一點，他們使用舊的安全攝像頭拍攝的影像來訓練系統來發現異常行為。但是這種視頻大多低質，因此他們也會找一些演員來拍攝訓練視頻片段。

Odom沒有講述具體細節，但表示這個系統會尋找特定的面部表情和行為。「我們的演員會做一些類似蹲伏、推擠以及回頭撇的動作。」他說道。

對於監控和人工智慧的專家來說，這些功能的引入也面臨潛在的困難（技術層面和道德層面都有）。和人工智慧通常遇到的問題一樣，這兩個類別的問題也是緊密相連。

這是一個技術難題，畢竟機器始終無法像人類一樣理解這個世界。但如果我們假設它們能夠做到這一點並讓它們為我們做決定時，這又成為了一個道德難題。

卡內基.梅隆大學的教授Alex Hauptmann專門從事這類計算機分析。他表示儘管人工智慧在近些年推動了這一領域的快速發展，但讓計算機理解視頻，這依然存在根本性的難題。其中最大的一個問題就是我們通常不會考慮到的：攝像頭的解析度。

舉個例子，一個神經網路經過訓練可以分析視頻內人們的行為。這是通過細分人類身體——胳膊、腿、肩膀、頭部等，之後觀察這些畫中小人在視頻中從一幀到另一幀的變化。

據此，人工智慧可以告知你是否有人在跑步或是梳頭髮。「但是這取決於你的視頻解析度。」Hauptmann在採訪中說道，「假設我看的是停車場盡頭的攝像頭，如果我能分辨出有人是否打開車門，那真是萬幸了。如果你就站在攝像頭前面彈吉他，那它可以追蹤你的每一根手指。」

對閉路電視監控來說，這也是一個大問題。攝像頭往往會有顆粒感，角度通常也非常奇怪。Hauptmann舉了一個便利店內要對準收銀台的攝像頭為例，它也可以俯瞰到面向街道的窗戶。

如果外面發生了搶劫，那麼攝像鏡頭就會被部分擋住，之後人工智慧就會卡住。「但是我們作為人類，可以想像到正在發生的情況並將信息拼湊在一起。計算機就做不到這一點。」他說道。

與之類似，儘管人工智慧能夠出色識別視頻中發生的事情（比如說有人在刷牙、看手機或是踢足球），但它尚不能提取重要背景。拿可以分析人類動作的神經網路為例。它也許能夠在看到鏡頭時表示出「這個人在跑步」，但它不能識別這個人是否是因為快要趕不上汽車或是偷了別人手機才要跑步。

這些準確率問題讓我們需要認真考量一下人工智慧初創企業的聲明。我們還遠遠達不到一種情況——即電腦能夠在看視頻時獲得和人類一樣的見解。（研究人員會告訴你這非常困難，相當於是「解決」智能難題。）但事情的發展速度非常快。

Hauptmann表示車牌跟蹤功能已經被採用，而受控設置下的面部識別也同樣如此。（使用低質閉路電視影像進行面部識別是另一碼事。）識別像汽車、衣物這類的東西非常靠譜，系統也能自動追蹤多個攝像頭內的同一個人，但這也要取決於實際情況。

「在一個不擁擠的環境中追蹤一個人還是非常靠譜的，但在擁擠的環境中就別想了。」Hauptmann說道。他表示如果一個人穿的是不太顯眼的衣服，那麼追蹤起來也非常困難。

但是，即便是這些非常基礎的工具也會帶來很大的影響。中國就發生了這樣一個情況。在新疆，傳統的監控和民事控制會結合面部識別、車牌掃描儀、虹膜掃描儀以及普遍的閉路電視監控來創造出一個「全面監控的狀態」。

在莫斯科，類似的基礎設施也正在組建，面部識別軟體會被嵌入在一個集成式系統中，該系統配備了超過10萬台高解析度的攝像頭，覆蓋了整個城市90%以上的公寓入口。

在這些情況下，可能會出現一個良性循環。隨著軟體變得愈加完善，系統就可以收集到更多的數據，相應地這也會幫助軟體變得更加出色。「我想這一切都會進步。這一情況也正在發生。」Hauptmann說道。

如果這些系統已經在工作了，那麼我們就會碰到類似演算法偏見的問題。這並不是一個假設性的挑戰。研究表明機器學習系統吸收了為其編寫程序的社會中存在的種族和性別偏見——從總是將女性放置在廚房裡的圖像識別軟體到總是宣傳黑人更可能再次犯罪的司法系統。

如果我們使用舊的影像片段去訓練人工智慧監控系統，比如說閉路電視或是警察佩戴的攝像頭，那麼這些存在於社會之中的偏見就很有可能會滲透進演算法內。

紐約大學專攻道德「AI Now」研究所的聯席主任Meredith Whittaker表示執法過程中已經出現這一情況了，這也將延伸至私有行業。Whittaker拿Axon（之前被稱為Taser）為例。

該公司收購了幾家人工智慧企業來將視頻分析嵌入到其產品中。「他們得到的數據來源於警察佩戴的攝像頭，這些數據闡明了單個警察會關注哪些人的情況，但它並沒有告訴我們全部的情況。」Whittaker說道，「這就會帶來真正的危險，我們正在普及帶有偏見的罪犯圖片。」

ACLU高級政策分析師Jay Stanley表示即便我們可以解決自動系統中存在的偏見問題，這也不能使得它們就變成良性的。他表示將閉路電視監控從消極的觀察者轉變為主動觀察者，這給公民社會會帶來巨大的負面影響。

「我們希望人們不僅僅是獲得自由，還能感受到自由。這意味著它們不需要擔心一個未知、看不見的觀眾會如何解釋或曲解他們的每一個動作和話語。」Stanley說道，「要擔心的問題是，人們會開始不斷自我監控，擔心自己做的所有事情都會被曲解，從而給他們的生活帶來負面影響。」

Stanley也表示不準確的人工智慧監控引發的誤報會導致執法部門以及公眾之間發生更危險的對抗。想想Daniel Shaver的槍擊事件吧。Shaver被人看見拿著槍之後，有人打電話報警，警察來到旅店。當Shaver按照要求趴在地面上時，警長Charles Langley槍殺了他。而Shaver被發現持有的槍其實是他除蟲工作所需要的粒丸槍。

如果人類都可以犯下這樣的錯誤，那麼計算機呢？如果監控系統變成了半自動化的，那麼這樣的錯誤是會更頻繁還是更少見呢？「如果技術被採用了，那麼一定會有一些警察被迫需要照看這些情況。」Stanley說道。

Whittaker表示我們在這個領域看到的情況只是人工智慧大趨勢的一部分。我們使用這些相對粗糙的工具，試圖基於圖像來對人們進行分類。

她提到了去年發表的一項具有爭議的研究，該研究聲稱可以通過面部識別來確定性別。人工智慧結果的準確性值得質疑，但是評論家也指出它是否可行並不重要，重要的是人們是否相信它有用以及是否會用此數據進行判斷。

「有一點很困擾我，沒有任何民主程序讓我們質疑它的有效性或是通知大家將會部署系統，許多系統就已經被安裝在我們的核心基礎設施里。」Whittaker說道，「這不過是演算法系統的又一個例子——演算法系統是基於內在文化和歷史偏見的數據來識別特徵，據以分類並確定個體類型。」

當我們向IC Realtime詢問關於人工智慧監控可能會如何被濫用的問題時，他們給出了一個在科技行業常見的回答：這些技術是價值中立的，它們被誰如何使用決定了技術的好壞。「任何新技術落入不法分子之手都有可能帶來危險。」Sailor說道，「任何技術都是如此...我認為在這個問題上，利遠大於弊。」

如果你是

AI行業人士

如果你想了解最前沿的AI技術和場景應用

一網打盡AI界前瞻科技和深度報道

如果你想持續拉升逼格

歡迎關注AI星球，並轉發朋友圈為我們打Call哦~~

你們的支持才是我們創造優質內容的不竭動力~送你花花

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI星球 的精彩文章:

※復古黑科技，手電筒竟能成為AR介面
※「二李」達沃斯見聞錄，聊聊AI那點事兒

TAG:AI星球 |