14 段語錄,聽懂 「AI+安防」 的冰與火之歌
人工智慧在安防領域的規模化應用,再次引發了行業的業務重組與利益重構。
這期間,傳統廠商從容、科技新秀銳利、資本市場瘋狂。顯然,「變革」 已經成為安防行業的時代主題。
在此大環境下,眾多安防大會的演講內容依然陳舊且同質化嚴重,嘉賓往往只針對市場、業績、行業、趨勢等主題泛泛而談,為參會者創造的學習價值有限。
在這個節點,作為 「AI + 安防」 這一報道方向的領跑者,雷鋒網將於 3 月 31 日舉辦 「2018 中國人工智慧安防峰會」。屆時,一線企業領袖、學術大師、解決方案專家將聚首深圳,圍繞 「人工智慧 + 視頻監控」 的前沿技術研究與實戰技術落地展開演講與討論。(更多大會內容歡迎點擊:https://gair.leiphone.com/gair/sd2018)
過去變革的一年裡,雷鋒網共出品 100 篇以上的 「AI + 安防」 深度報道,逾 50 位業內頂級專家向雷鋒網深入講述了他們對智能安防技術與業務的理解與思考。
本文節選了其中 11 位重要受訪人的獨到見解,讓更多人了解行業引領者遇到的人工智慧安防難題與解決方法。
受訪人名單:中國工程院院士高文、海康威視總裁胡揚忠、大華股份董事長傅利泉、阿里巴巴副總裁兼 iDST 副院長華先勝、東方網力董事長劉光、英特爾物聯網事業部 CTO 張宇:宇視科技國際市場部總裁閆夏卿、蘇州科達總經理陳衛東、天地偉業總工程師楊清永、商湯科技 CEO 徐立、曠視科技副總裁陳雪松、格靈深瞳 CEO 趙勇。
他們看見的行業問題
中國工程程院院士高文:
現有視頻監控體系的弊病,使得很多複雜任務無法完成,即便是人工智慧大規模滲入後,需求方也往往為了一些特殊目的才加特定的智能攝像頭和處理系統。有些專用攝像頭只是用來識別車牌號,有些攝像頭只用來識別人臉,這種打補丁式的方法實際會帶來很多問題。
杭州市通過城市交通管理雲進行規劃,除了規劃信號燈本身外,架設的攝像頭每時每刻都在拍路面,並計算車的佔有率(即每百平方米路面中車的數量),基於此來判斷每條道路的飽和程度,然後對信號燈進行優化。把一個月全天 24 小時的數據輸進去後,重新進行計算。
但這些數據往往不一樣,因此需要有一個數據交換平台。如果信號進來,它在攝像頭上做編碼,傳到雲端做解碼,解碼後再去提取特徵、做分析等。
這是常規的流程,但這樣的系統是不是一個理想智慧城市系統?不是。
這種方式根據以往的數據來做調度規劃效果總體不錯,但對突發事件無法及時做出判斷。最理想的方式不僅可以通過以往的數據統計進行決策、進行查詢,而且也可對實時的數據進行處理、分析。
世界各地的緊急事件發生時,系統整體的響應速度實際都比較差。為什麼?主要因為現在整個視頻監控體系本身造成。
現在的視頻監控系統,從一開始就面臨數據量太大、存儲量太大,查找數據不易等一系列挑戰,這些挑戰可以歸納成三個問題:存儲成本高、檢索困難、對象再識別難。
我們不僅要把東西存儲起來,而且能夠實時對任何想識別、想搜索的信息進行實時操作。現在的系統主要是用攝像頭把視頻抓進來後壓縮,傳出去,然後存起來。
很多設有卡口的道路專門安裝了卡口伺服器,以此來識別車牌號。有些道路還專門安裝高清跟蹤攝像頭,用於蹤人和車。
上述情況往往是為了一些特殊目的才加的攝像頭和處理系統,這種打補丁式的方法實際會導致很多問題。
簡單來說就是你有 A 需求,便裝一個系統,你有 B 需求,於是再裝另外一個系統,然後把所有任務抓取的視頻都推到雲端,這就是現有系統通常採用的設計模式。因此,行業需要一套更加前沿的方案來解決這些問題。
大華股份董事長傅利泉:
要讓人工智慧在安防領域大規模應用,首先不得不面臨一個問題:貴。
其次,AI 近兩年才開始逐漸走向商用落地,面臨三項機遇與挑戰:
1、如何準確把握客戶對 AI 的需求,從而讓 AI 價值最大化,會變得愈發重要。
2、硬體、演算法的迭代速度飛快,使得 AI 正進入高速發展期,但仍有諸多不穩定因素,企業需跟得上技術的迭代;
3、AI 推廣受到成本的影響,期待在不久的將來能有接近傳統晶元價格來實現終端智能化,真正從模擬到網路到智能的轉變。
東方網力董事長劉光:
過去十年是安防 IT 化時代,未來十年將是安防人工智慧時代。
未來想讓城市變得更安全,必須將 Video、AI、IoT 三大技術與應用場景融合起來。但這並不是一項簡單的工作,兩道大山必須移平:
1、人才。目前全球都急需深度學習人才,如何吸引他們加入是個需要深思的問題。
2、AI 晶元的發展稍顯滯後。目前 AI 晶元的滯後束縛住了安防廠商的發展。未來一到兩年內,這個問題應該很快會被解決。屆時,幾家安防廠商將會開足馬力做產品、做方案、做場景。
在人才缺乏期內,行業里的創業公司通過單一演算法優勢獲取了機會 + 訂單,但本質上並未對傳統安防廠商產生大的影響。因為安防行業是一個需要深度了解客戶需求、了解整個銷售體系、產品體系、方案的行業。
隨著國內外學術界、產業界在深度學習領域的不斷研究與積累,人才瓶頸會得到解決,國內傳統安防公司的 AI 人才需求將更快得到滿足,利用 AI 切入安防的創業公司將面臨越來越大的挑戰。
在當今這個技術驅動的時代,想要創業也必須思考兩點。第一,自己是否掌握核心技術,人工智慧時代與移動互聯網時代迥然不同,這個時代最稀缺的就是人才及技術,商業化落地不必太早考慮。第二,自己是否掌握產業資源,如果缺乏技術及人才,也可以通過體外投資與孵化,做一些與預想產業相關的 AI 產品,機會也很大。
宇視科技國際市場部總裁閆夏卿:
人工智慧勢頭很足,但存在諸多阻礙:
1、不同的系統不能共享資源,不能交付和訪問,形成了資源孤島和信息孤島;
2、大數據業務有幾個要素:及時性、關聯性、時空的一致性,但這三點恰恰是大數據應用的三個硬傷。
在殘酷的商業環境中,能活到最後的企業一定是懂得 「有所不為」 的企業,企業在壯大的過程中一定要避開發展途中的 「大坑」,做不了的業務堅決不碰。
以大數據的某些應用為例,軟體行業有一個 「10% 規則」,利潤只有 5% 到 8%,任何一個項目,軟體定製低於 5% 就有利潤,有 10% 的修改就得賠錢,但是在大數據行業,遠不止 10% 的定製,大多都是 30% 到 70% 的定製。
再比如在智能化的部分場景中,再好的演算法、再高清的攝像頭,面對北京(超一線城市)任何一個地鐵站數秒內擁入的上百人群都無法做到精確感知、識別。
格靈深瞳 CEO 趙勇:
人臉識別解決公共安全問題仍然微不足道。
我們能夠意識到人臉識別儘管在過去幾年有著巨大進展,可以在金融領域做身份驗證,但它對解決公共安全問題來說是仍舊存在很多難題無法逾越。
這個事實說明人臉識別技術不夠好嗎?也不盡然。動態人臉識別的問題體現在,假如想像有一天在北京有 100 萬個動態人臉識別的攝像機,而北京有 3000 萬人口,在這種背景下,它每天產生的問題高達數以萬萬計。在這種情況下,發生錯誤的機率即使再低,但乘以這麼大的基數也會產生海量的誤報。所以這個問題的規模非常殘酷。
他們預見的趨勢與機遇
海康威視總裁胡揚忠:
將人工智慧算力注入到 「邊緣」 將是安防行業的大勢所趨。隨著各行各業的計算業務越來越複雜,對速度的要求越來越高,雲計算應運而生。但云計算的使用,要求將計算所需數據全部通過網路傳送至數據中心。
這種方式不僅會消耗大量的網路資源,傳輸過程也會耗費大量時間,高延遲、高能耗、網路擁塞、低可靠性等問題便會出現,因此,將一部分算力注入前端將有效解決這些問題。
未來,海康威視還會根據不同的場合不同的場景不同的方式向客戶提供針對性的、適合的、豐富的產品和解決方案,不排除未來將 AI 技術對外開放的可能性。
蘇州科達總經理陳衛東:
安防前幾年技術的驅動來自編解碼技術的進步、視頻解析度的提升以及傳輸方式的進步,編解碼技術從 MPEG-4 到 H.265、解析度從一百萬像素到 4K、傳輸方式從模擬到智能到 IP,從始至終,都是技術在驅動安防的發展。
而下一個重大技術方向就是 AI。未來,科達會在 AI+安防這條路上深耕:
第一、把 AI 賦能到所有的安防細分領域,進行水平拓展,AI 功能不僅體現在專業攝像機上,普通攝像機也要逐漸普及;
第二、深度方面,要做進一步發展,現在的 AI 的感知相對來說還是淺層感知,未來要做深層感知,識別目標要不斷深化、甚至到認知水平,像人一樣看懂情景。
第三、緊緊圍繞場景落地做針對性的優化和開發,使得 AI 不再是技術概念,而是安防領域各種典型場景、各種用戶需求,能夠適應各種場景下的深度應用。
天地偉業總工程師楊清永:
AI 在安防行業無論多熱,新的巨頭很難出現,老的巨頭也不會倒下。
AI 技術其實更類似於 H.264、H.265,這些技術更多的是起到錦上添花的作用,而並非雪中送炭,其不足以讓行業重新洗牌。AI 在安防行業的落地也只會是個 「小風暴」,不會帶來大的行業格局的改變。
未來五年之內,AI 在安防行業會一直談下去,而在這段時間內,雙方都應該做好各自分內之事,不應想著如何搶奪別人飯碗,沒有任何一家企業能夠 「吃掉」 整條產業鏈,有效的企業分工及協作格局才是立身之本。
AI 涉及的範圍很廣,安防行業的範圍更廣,一些 AI 初創公司羽翼未豐就想著做一整套解決方案是不合理的。
商湯科技 CEO 徐立:
人工智慧行業有點像是一個江湖,核心是練內功,即深度學習大腦,練好了,十八般兵器都能夠熟練使用(解決各種垂直應用的問題)。
堅持做原創的關鍵在於能不能帶來核心競爭力,成功了就會有馬太效應和聚集效應,能夠帶來越來越多的原創效益。
技術上的突破,創造的是藍海市場;技術上的領先,帶來的是產品的不同質化;目前 AI 領域,領先的演算法是打造產品差異化的關鍵點。對此,商湯通過核心技術來打通上游的合作夥伴,幫助他們拓寬下游市場,同時為下游合作夥伴提供全鏈條的一站式解決方案,最大化地發揮其在應用場景的價值。
商湯在做一個中國大部分企業不願意做的事情,就是做原創技術的開發,堅持原創,讓人工智慧引領人類進步。
他們手中的解決方法
中國工程院院士高文:
現有視頻監控體系的弊病,使得很多複雜任務無法完成。於是數字視網膜應運而出,承載數字視網膜的攝像頭需做兩件事:
首先做好編碼;
其次為後面的識別,提取出所需的信息。
數字視網膜與人的眼睛既具有影像重構(精細編碼視覺內容),又具備特徵提取(面向識別理解)的功能。整個數字視網膜實際上包含了三種核心技術:基於背景模型的場景視頻編碼、視頻特徵的緊湊表達、視頻編碼與特徵編碼的聯合優化。
整個數字視網膜實際上包含了四方面的核心技術:
1、基於背景模型的場景視頻編碼
2、視頻同步描述整個表達的記錄,同時可結合最近比較熱的深度學習
3、在保證性能的時候,用同一個碼流把兩個任務都傳出去,這需要靠視頻和特徵原有編碼技術的優化形式來解決
4、最後是雲端的檢索,對視頻進行更加合理的描述,以便用於搜索
而雲端系統三大構建模式為:直接基於特徵碼流、在特徵碼流上深度分析、前端簡單識別 + 雲端大數據搜索。
阿里巴巴 iDST 副院長華先勝:
哪些流程放在端上做會更合適?
我個人覺得質量增強和簡單的結構化可以放在端上,非常精細的分析放在前端會有一些局限,尤其是演算法更新速度極快的今天,如果很多智能功能要嵌入在攝像頭端,得把所有軟體刷新一遍,工作量巨大且不見得所有硬體會支持。
除此之外,攝像頭端也沒有能力把多方位的城市數據及時匯聚起來做決策。
計算是我們要解決的核心問題之一,怎樣才能擁有較高的計算效率,阿里在這上面投入了很大力氣。
第一要有計算平台的支持,該平台要讓項目做起來更加高效,要能容錯;其次是雲計算平台又需要大量的計算機器資源;最後是演算法本身。
過去處理一路視頻,需要一台電腦的二十四個核全部運行才能搞定,我當時的目標是看能不能降到十個核、八個核甚至一兩個核完成。截止到目前為止,我們利用演算法提升了 20 倍對計算的優化。
此外,改進深度學習的方法很多。首先可在機器指令集上進行優化工作,其次也可在 CPU 和 GPU 層面優化。演算法本身的優化,較為常見的是優化神經網路結構。由於神經網路中集成的計算量相當大,因此我們需要考量能不能把大模型在不損失性能的前提下壓縮為小模型,小模型能不能剪一剪。
格靈深瞳 CEO 趙勇:
當智能化產品進行推廣時,我相信這種方式很難快速進行。所以當下急需解決的事就是前端智能化。我發現有一些廠商試圖把識別和比對放在攝像頭裡去做,我認為這是有問題的,為什麼呢?你在攝像頭裡做識別,識別產生人臉特徵。由於每個公司各自的演算法不同,就要求客戶後台的比對系統只能對接這種特徵。這樣一來的話就給客戶帶來很大麻煩,假如我今年採購這個廠商的設備,那我的後台也需要依據這些設備來建設。
到了明年,我想採購不同廠商設備時,就會發現不兼容性。我認為圖片是最兼容的、供通行的數據,所以得從客戶的角度看待問題,識別演算法和比對不要放在攝像頭前端,回頭會給客戶帶來很多不靈活的負擔。
比對我覺得就更不應該放在前端,因為比對需要把客戶的核心資源對比庫放在攝像頭上,在很多公安應用裡面這些都是核心機密。你可以想像,如果有黑客攻擊了攝像頭就會從裡面獲取跟黑名單相關的核心信息。我認為核心信息應該永遠待在數據中心,待在客戶最核心的保密網路里,而非前端。
英特爾物聯網事業部 CTO 張宇:
未來的人工智慧安防系統一定是一個端到端的系統,邊緣計算在當中會發生非常重要的作用。隨著視頻技術在安防等領域的廣泛使用,在攝像頭端的視頻處理將成為人工智慧的一大應用。
對於深度學習和人工智慧在安防領域的應用,未來除了在終端側的部署之外,還將會呈現出三大趨勢:
1、增強學習正快速應用到安防領域;
2、通過網路壓縮來解決計算冗餘的問題;
3、未來 AI 演算法將會相對固化,專用的 AI 晶元和伺服器將得到廣泛應用。
曠視科技副總裁陳雪松:
目前人臉識別落地安防的確是趨勢所向,但人臉識別只是 AI 落地安防行業的一小部分,在很多實際場景中,人臉識別作用有限。
市面上絕大部分視頻監控只能看到俯視角度的 「腦袋」 以及非常渺小的人體,根本無法看清人臉。以北京海淀區為例,30 萬個監控攝像頭當中能準確看到人臉的不足 2000 個。
當監控攝像頭看不清楚人臉的時候,監控中的人走入另外一台攝像機的監控範圍,機器如何辨別 「誰」 是 「誰」?
人形追蹤技術(或者說行人再識別(ReID)技術)可以很好地解決這個問題,這也是曠視接下來重點深耕的方向。AI 通過機器學習輸出的結構化信息,其實本質上是建立了一個多維向量模型。這時候,機器可以給每一個模型一個編號,做跨攝像頭的人形追蹤。
裝載 「人形追蹤」 技術的監控攝像頭可以將一個人的行為軌跡還原;之後,只要出現在任何一台可以識別人臉的攝像頭中,就可以被輕易鎖定,不會出現 「斷片」 現象。和單點監控相比,ReID 方案通過多組攝像機的軌跡還原及人員比對讓安防工作變得更為立體,方便辦案民警對目標嫌疑人的行為軌跡、出行規律進行分析,進而為案情線索和實施靈活布控打擊提供依據。
現階段大家都在展示視頻結構化,其實更難的是基於跨攝像頭的人形追蹤。該技術的發展對於安防行業來說也具顛覆性作用。
他們關注的行業大會:2018 中國人工智慧安防峰會(http://suo.im/2izpzg )
2018 中國人工智慧安防峰會由雷鋒網主辦,是國內首個由科技媒體舉辦的重量級 「AI + 安防」 行業盛會,大會彙集全國範圍內最頂尖的企業領袖、學術大師、解決方案專家,共同探討 「人工智慧 + 視頻監控」 的實戰技術落地與產學研發展方向。
峰會嚴格控制演講主題和細節,全力打造一場為技術和解決方案人員量身定做的專業大會。摒棄無意義的社交,營造更加純粹的交流與探討環境。
大會圍繞」 動態人臉與車輛識別 「這一主題展開,嘉賓的演講報告從眾多應用場景出發,為行業呈現最前沿的技術與最落地的項目方案。
時間:2018 年 3 月 31 日(周六)9:00 — 18:00
議程:上午 6 場演講,下午 7 場演講 + 1 場圓桌
地點:深圳南山科興科學園國際會議中心
會議規模:500 人
在邀演講與圓桌嘉賓(多數已確認出席)
福利來了!
AI 研習社為大家準備了 3 張本次安防峰會的門票(價值 599 元),留言點贊數前 3 的用戶可以免!費!獲!得!活動截止時間為 3 月 12 日(周一) 中午 12 點,歡迎大家踴(花)躍(式)留言~獲獎結果將於 AI 研習社公眾號 3 月 13 日(周二)的頭條推送尾部公示,敬請關注。


※如何對非結構化文本數據進行特徵工程操作?這裡有妙招!
※普通程序員想投身 AI 行業?知乎大 V 阿薩姆分享開發者轉型的機遇與挑戰
TAG:AI研習社 |