當前位置:
首頁 > 最新 > 華先勝:無行業,不AI——阿里視覺智能的探索與實踐

華先勝:無行業,不AI——阿里視覺智能的探索與實踐

本文為將門線上技術社群直播兩周年&100期特別活動第一期、阿里巴巴集團副總裁、高級研究員華先勝老師強勢回歸的分享回顧。華老師結合阿里巴巴在電商、城市計算、工業、醫療和設計等領域的人工智慧技術和應用上的探索和實踐,通過每一個Case Study,和我們一起詳細探討了如何才能讓人工智慧成為實實在在創變未來的持續力量。

加入將門技術社群,請關注將門微信公眾號,並回復關鍵字「100期」。

以下內容根據華先勝博士4月12日在將門所做的線上直播內容整理而成,有刪減。

兩年前我在將門分享了當時在阿里做的圖像搜索的工作,今天我要分享的內容是最近這兩年做的一些新工作。

最近我正好看到一個文件,說美國綜合了很多調研報告,總結了20項在未來30年將會改變世界的技術,我自己看了一眼,發現前面10項基本上都跟人工智慧直接、或間接相關。

所以,看得出來人工智慧在將來的世界裡未來30年會扮演非常重要的角色,它將會影響各行各業。

那這些行業到底會發生什麼樣的變化,是被顛覆、會被改變、還是會對它整個布局、整個發展、整個狀態發生或大或小的變化,我們分享完以後可以回來再看一下。

前面是一個引子,接下來解釋一下今天的題目。無行業,不AI有兩種解釋方法。

第一,無行業不AI沒有一個行業沒有AI,也就是說所有行業都會有AI降臨(這個可能有些誇張,可以說是大部分行業吧),就是說AI將會滲透到各行各業里。

第二,無行業,不AI就是說不深入行業的話是沒有成功的AI的。我經常聽到的、也是經常講的一句話,也是在阿里里經常討論的一句話,就是說今天我們通用的計算是有的,但通用的AI是沒有的。所以,AI的技術要讓它真正的落地,一定是要深入一個行業,為什麼這麼說、為什麼這樣做才可以?後面我們會根據實例來一步步拆解。

第三,視覺智能因為我是做視覺的,所以重點從視覺智能案例一起來分析。視覺智能也是這次人工智慧的熱點,因為畢竟從應用的場景看,從今天技術成熟度來看,也是視覺方面做的更為靠前。人的信息獲取絕大部分都是視覺,有人是70%、有人是80%、有人是90%,但至少有70%以上是從視覺獲取的。所以,這一部分的信息也是最重要的。

第四,探索與實踐我今天講的例子還算相對比較成功的。其實背後還有很多辛酸、眼淚,今天就不見得給大家分享了,但中間一些坑我可能會提到。

今天的AI,我套用主席的一句詩叫「天生一個仙人洞,無限風光在險峰」。確實首先AI非常風光,AI行業的工資也非常高,現在AI的人才也比較難雇。不管是從工資也好、還是融資、估值等之類的角度看,都很風光,但這個風光確實有點像在險峰上。

所以我後面想接一句「卻是容易翻車處」。要保證不翻車的話,很重要的是要在商業上要有成功。商業上的成功很重要的一條是誰來買單。我們不希望只是VC買單,一個個往下接盤,看上去好像也有人買單似的,但這個肯定不是我們希望的,也是不能長久的。

在商業上的成功關鍵是什麼呢?刷榜、PR、融資還是估值?我想除了這些以外,還有一個就是我們今天的主題,即行業壁壘

我講行業壁壘的時候,並不是著重說我們需要跟這個行業誰誰誰有什麼關係,也不僅僅是行業的知識。

今天我講的行業壁壘是我們對行業深入的理解,對行業的數據、對行業的問題、對行業的用戶非常深入地理解它,為解決這個行業真正的問題,為這個行業的用戶、客戶帶來真正不可帶替代的價值。從這個角度來講,它會成為一個壁壘,而且這個壁壘我個人認為可能會是更重要的壁壘。

前面說了一些自己的觀點,後面我們還是從具體例子看一下。

視覺設計

這個其實做的人會比較少一點。曾經Google的DeepMind做過這個,今天我講的是更能夠商用的,更有商業價值的一種設計,而不是看著好玩的。

設計行業,我們這裡主要講二維設計平面設計,但實際上還有三維、還有動畫、視頻等。這個行業據說有4000萬從業人員,他有很多工具,離線工具、在線工具,還有很多模塊、很多素材,據說中國整個市場容量是3000億,其實還是蠻大的。

現在這個行業基本上都是人工來做,效率還是比較低的。有很多工作並不需要頂級設計師來完成,但又不是說隨便一個人就能設計出來的。我們看到這個情況以後,尤其在電商領域,阿里有這樣一個很大的應用場景,有大量的商品廣告(我們把它叫「Banner」),我們就開始思考這個問題的解決方案。

這個廣告在電商的網站上經常出現,每天的需求量也非常大,我們就以這個作為突破口開始去看,我們能不能依靠演算法能夠達到初級設計師的水平。

在AI行業,大部分人做的都是識別、理解、搜索。這個基本上是從視覺的信號里去獲取語義、或特徵,而設計其實是反過來的,是生成或融合視覺信號。

今天也有一些這個方向的學術工作,像Style Transfer,很早就有人做了,也不難實現。但說真正商用的東西,還不多見,今天我來介紹的就是一個這樣的例子。

整個2D設計,目標是可控視覺內容的設計與生成。給定一些要求、一些素材以後,要設計成一個稿子,每個人設計出來的都是不一樣的,不大可能有兩個互相不參考的人能夠設計出同樣一個東西來。我們也是這樣的。我們既要給他足夠大的自由度,但也有一定的可控性。所以我們這個系統做出來以後,其實每次同樣的輸入,每次輸出的數據結果都可以是不一樣的。

所以,我們的目標是:可控視覺內容設計與生成,讓AI做設計,使數據內容、製造變得高質、高效、普惠、低成本。願景是:「所想、即所見、即所得」。這個稍微誇張了一點,但實際上你還是要把一些素材,例如文字、圖片送到系統中去,後面出來的就是你想要的東西。

這裡基本的技術包括了圖像的理解,包括了增強、編輯、渲染、生成、評估等,因為我們必須知道我們做出來的東西是好還是壞,而且要自動做出評估。

下面這張圖是一個非常High level的系統構成,所想+雲上的視覺(智能生成引擎),我們即所見、即所得的是三類東西。

第一類的東西應該很快就會面世、發布,我們內部叫鹿班,也就是二維圖像的設計和生成。現在我們還在做的是三維的圖像生成。

這項技術在去年的雙11上得到了非常充分的運用。這項技術有了以後,對於每一個不同的產品會有不同的設計出來。我們做個性化推薦、搜索的時候是要千人千面,每個人的結果不一樣。有了這項技術之後,是千貨千面,合起來就是千人、千貨、千千面。

所以,每一個不同的人對同一件商品會得到不同的設計,因為系統會根據他的喜好會得到不同的設計,可以以他更喜歡的方式來展現這個商品。

在去年雙11的時候,有4.1億的設計是用演算法生成的。峰值的時候,每天可以生成5000萬個,生成完以後直接就上線了。

我們把這個系統成功做出來,其中一定要有設計師一起來深度參與的,因為畢竟我們是做技術的人,不熟悉設計的原理。

大家可以看到剛才這個技術實際上有點想革設計師的命,那設計師怎麼會跟你合作呢。我們在做很多行業的時候,比如像醫療,有時也會引起一些恐慌。其實我想這可能是還沒有真正理解AI到底能做什麼、到底什麼東西是不能做的。

我們在尋求設計師合作的時候一定要找頂級設計師來合作,然後才能做出來一個AI的設計師(大概是一個入門級水平的設計師)。

但現在我們的AI設計師也只能做到這種比較有模式的設計。如果要做的非常有創新,今天的演算法還是完成不了的。

所以,實際上設計師是不會失業的。但如果你只是一個二流、三流的平面設計師,可能會失業。這個其實也是在深入行業的時候碰到了一個很有意思的問題。有些行業我們雖然會顛覆它,但這個行業里的頂尖高手一定會有他們的未來,我想也會促使我們每個行業的從業者,從簡單、重複的腦力勞動中、或有複雜但有模式的腦力勞動中解放出來,這是第一個例子。

視頻廣告

我記得在很多年前,YouTube剛出來,以及在國內很多視頻網站還在為贏得用戶而戰鬥的時候,可能沒有多少人關注廣告,因為那時候要吸引用戶,後來慢慢地開始做廣告了。

今天廣告仍然是視頻網站很重要的收入來源,當然也還有會員費的收入。但這個視頻廣告的體驗到底好不好?我放一幅圖在這其實就是這個意思,今天我們看到視頻的廣告體驗有點像這個人拿著標槍就想把它砸掉,我不知道大家有沒有這個體驗。

那有沒有更好的方式來做視頻廣告。那我們先來看一下廣告的分類,大致可以分為三類。

一.Video-In。就是把廣告的內容插到視頻里去,其實in有不同的做法。第一種是直接把視頻的片段放進去,也有把廣告overlay疊加到視頻裡面去,還有把廣告信息作為三維的placement放到場景裡面去。

二.Video-Out。就是說從video已有的內容往外做,裡面有什麼商品、有什麼人物,然後給一個上下文相關的廣告。

三.廣告設計。這個跟剛才講到的內容是類似的,這裡就不再講了。

這裡我給大家講兩個例子。

案例一:場景關聯的廣告這個我們也是在優酷土豆上做過的技術,是基於對視頻的里的目標和場景進行分析來做上下文關聯廣告。今天的視頻識別技術遠遠比以前做得更精細,所以我們可以根據識別的目標和場景做內容更為相關的廣告。

這裡還有一些關於大場景判斷的問題,這種方式比那種直接放一個完全不相關的廣告,用戶的體驗會要好一些。

案例二:植入式的廣告廣告植入能不能做到更好?做到更好的話就是這種方式——我經常把它叫「優雅的廣告」,者叫「植入式的廣告」。比如說我們檢測到視頻里有一個平面,我們就把這個廣告貼進去,像這個東西本來就在真實場景里存在一樣。

這個技術當然也是要建立在識別的基礎上,一定要對這個場景有非常好的理解,這種理解就分兩類。

對語義的理解。

對三維結構的理解。

我們對它進行理解以後,就要找到合適的地方。剛才我們講的是平面上去替換了,其實在桌面上它還可以放一個東西,比如放一瓶酸奶,把礦泉水換成別的東西之類的。所以平面的檢測不管是水平還是豎直的,然後進行廣告位的篩選。

這個技術,包括還有光照分析、模糊分析、遮擋分析之類的,到廣告位的存儲,再到線上的實時渲染。聽起來有點像增強現實,其實這裡有很多是相通的技術,只不過在這裡它的要求不一樣,它的難度也不一樣。

從難度上來講,它容易的地方在於我們不需要做到實時,因為我們是離線尋找廣告位,然後在線把它放進去,所以大量的計算是離線完成。

它的難處是我們只有一個視頻,我沒有深度、沒有雙目、沒有設備、沒有相機的位置,什麼都不知道,完全根據視頻來做。所以,一般來說只有運動的視頻,我們才可以通過structure from motion或類似的技術去估計場景的三維信息。

從應用角度講,因為我們不需要實時,而且也不需要全程地去做渲染,我們可以選擇合適的位置來做,因為一個視頻你做廣告的時候也不可能全部都做,全部都做的話體驗也是非常差的。

我們可以選擇我們最有把握的地方去把廣告放進去,從而使得客戶最後渲染出來的結果比較真實、自然。

還有一種情況,像直播的場景,雖然網紅主播就可以掙到很多錢,但我們也不妨用一點點交互,使得它背後的背景牆也變成一個可以放廣告的地方。這種廣告的插入,需要有一點點交互,不然我們不知道三維的結構。

比如這個人晃動的時候遮住了後面背景上放廣告的話,應該會產生實際的遮擋關係,遮擋的效果,包括相機如果有輕微抖動的話,後牆上的廣告也會跟著一起來抖動。

視頻廣告其實一直是一個視頻網站又愛又恨的東西,因為這裡存在四方的關係。

視頻網站的服務商

視頻提供者

廣告

用戶

這四方的體驗都是很重要的,廣告做得太多,用戶的體驗就會比較差,廣告商其實也會不高興,因為看的人就會少,效果也不好。如果廣告太少,整個網站的收入就會比較少,用戶的體驗當然是好的,這裡有很多權衡在裡面。

包括今天的視頻網站,經常也不太敢去嘗試一些非常創新的變化。因為本身整個大的網站的成本也非常高,目前的模式對他們有一定的收入,但一旦做很大改變的時候,引起收入很大的變化,這個風險也是非常大的。

所以,在這方面有些創新非常難,因為它帶來的效果是立竿見影的,好的效果、壞的效果都是立竿見影的。

視覺診斷

如何診斷機器是今天我要講,還有一種是診斷人,診斷人就是醫療圖像處理,這部分我們今天就不涉及了。

這裡有一些跟一般視覺識別任務不一樣的地方。

它的發生概率比較低,數據量也比較少。它通常是一個小概率事件,而且小概率事件的差異性也比較大。所以我經常把它比喻成大海撈針,大海撈針非常不容易,但我能不能縮小範圍,變成桌面上去找針,在桌面上一看我就知道針在哪裡了。

我經常用一些數字來說明這個問題:比如說我們要在1萬個樣本里去找其中的10個有問題的樣本。如果不用技術手段的話,只能這1萬個樣本都看一遍了,那你的勞動量就是1萬。但我今天有個技術,雖然我不知道哪10個,但我一定知道在其中那100個裡面。我知道那100個,這10個一定在那100個裡,這就是從大海撈針到了桌面找針,這時候這100個需要人去看。

這時候我們看的樣本裡面只有10個是對的,準確率只有10%,到召回率在這個理想狀態是100%。這時候雖然準確率雖然只有10%,可我們省的人力是多少?大家可以算一下這個數字,省的人力是99%,就是你有99%的人力已經省掉了。這個意義是非常重大的!

這類問題實際當中有很多很多,這時候我們在做演算法的設計上要求是不一樣的,就是你的recall要非常高,你的精度是可以犧牲一些的。這個只適合於發生概率低的事情,帶來的效果一定是有它的價值,例如節省了人力、提升了質量、降低了成本,或者增強了安全性。有些情況下是不能用人去看的,人去檢查的話風險比較大,我們可以通過機器來做。

其中,節省人力是最直接的,比如像剛才講的99%的人力就已經節省掉了,哪怕我不是在那100個裡面去找,而是需要在1000個裡們去找,這時候準確率只有1%,但我已經省掉了90%的人力,已經相當了不起了。

接下來介紹一下行業視覺診斷,這裡說的主要是除了醫療之外的其它裡面視覺診斷,比如:太陽板瑕疵,太陽能電池板的瑕疵檢測,蟲板的密度估計,列車故障的檢測等。這裡的解決方法大家都可以比較容易想到的,深度學習、圖像處理,加上檢測識別,但這裡每一個問題都看起來容易,其實實際上並不太容易,而且各種情況都有,怎樣才能去避免每一個場景都重複去開發一套方法,這個也是我們需要去思考和解決的問題。

行業診斷的現狀基本上有三種方式。

第一種:全人工實現的,人力成本非常高。

第二種:有攝像頭,但靠人去觀察。這個對於人來說每天壓力很大,他沒有看出來後面出現問題了,他可能這個月就白乾了。實際上在我們真實場景中經常發現,人看漏的可能性是非常高的。人會有疲勞、會有情緒之類的,所以經常會漏掉。

第三種:簡單的分析功能,但現在遠遠沒有達到自動化的程度。

行業診斷哪些能做、哪些不能做?

第一類:基本上肉眼內容可分辨的其實是可以做的,所有需要人的肉眼去分辨的東西都可以考慮要不要用人工智慧來識別。

第二類:還有一些肉眼分辨比較困難,機器在有些方面能夠比人有更敏銳的洞察力,只要給一定量的數據,設計好演算法,有些情況下是可以做的。

第三類:肉眼無法分辨的,需要輔助措施。比如需要手捏一捏、估計一下重量,這個機器就沒有辦法了。像內胎壁厚薄的檢測、稻殼含水量的計算,估計應該過過稱才能知道了。

我突然想起來一個以前講聽過的笑話,說有個生產線上有肥皂裝到紙盒子里去,生產線上有時候出現有的盒子沒有裝肥皂,那怎樣把沒有裝肥皂的盒子找出來,當時這個公司花了很多錢,請他們的博士用了很多方法,各種感測器、各種智能的方法去分析,做出一套東西出來了。結果與此同時,有一個工人在旁邊放了一個電風扇,這個電風扇一開動,沒有裝肥皂的盒子就被吹走了,很簡單的方法就解決了這個問題。

這雖然是個笑話,其實我們在真實場景下也可能會發生類似的事情。也就是,我們要清楚到底我們能夠提供一些什麼樣的價值,哪些是適合我們技術來做的,有些東西可能有更簡單的方法。

回到案例,第一是太陽能電池片的裂紋檢測,這裡有多種不一樣的裂紋,有十幾種不同的瑕疵,比如像單條的裂紋、交叉的裂紋等。

目前我們一個初步的結果,這個精度其實是指「recall」(召回率),快到100%了。誤報目前是接近3%,這種情況下,根據整個電池面板的比例最後大概能省到1/10到1/20的能力。

我們再往前走一步的話,可能正常的誤報率就進一步降低到跟人相當、或比人還有更好水平的時候,就完全代替了人工,所以人力的比例會變成零,但這也要求你的精度足夠高,甚至高過人。實際上真正的情況下,機器的recall要比人的recall高,因為機器不會疲勞。

案例二是列車故障的檢測。我們每天坐的列車,如果進了車站從來沒有人檢修,一直到出了故障才檢修的話,這個也是挺恐怖的,其實大家也不用擔心,車進站的時候都是有檢修的。

這個圖片顯示的例子是貨運列車,這個進來以後都會有檢修,過去是人要上去檢修,今天有很多公司用的方法都是拍幾千上萬張圖片,這些圖片就放到數據中心,大家喝著咖啡、喝著茶就可以看了,但其實他看的時候壓力是很大的,因為很容易漏掉。

我們當時做了一個演算法,故障的種類也是千奇百怪,有好幾百種,比如開關沒有關好、漏油、裂紋等。這個真的是非常難的問題,我們當時做了其中一部分。上線測試的時候,人檢漏檢掉而機器能夠檢出來的有141個,雖然這裡的誤檢率還是蠻高的,因為這個情況非常複雜,但實際上可以大大地減少漏檢的可能性,同時也可以降低人力。

我們基於這些案例,最後總結出來阿里視覺診斷的引擎。

城市大腦

最後要介紹的是城市大腦

它要解決的是城市數據的問題,這個問題提出來是因為今天城市裡的數據其實是非常多的,尤其是攝像頭的數據量非常大 。這些數據的價值還還可以進一步挖掘,有很多很有意義的、可以解決現在城市管理方面很多難題的一些價值,把這些挖掘出來。

為什麼能挖掘出來呢?就是因為今天AI的技術、今天的算力到了這樣一個階段,可以讓我們去思考、去嘗試建一個這樣的「城市大腦」去挖掘城市數據的價值。

我給城市大腦的定義就是用AI和算力挖掘大量城市數據不可替代的價值。這個價值是什麼?可以有不同的角度去講,城市治理和服務的數據化、智能化,全面實施全量的優化決策、預測和干預,帶來的就是高效、低耗、少能力、便捷等。

城市大腦題目非常大,我們今天主要從其中兩個角度講即城市交通和安防兩個角度來講。

城市目前的幾個現狀是——

第一,盲人摸象

整個城市的感知其實是有點盲人摸象的。有很多感知手段,地磁線圈微波、卡口、GPS、視頻,但視頻沒有被充分利用起來,其它的監察數據的話,設備也是經常損壞,沒有一個全面的感知,只是看到了一部分的東西,所以叫「盲人摸象」。

第二,燈下黑。

即使我們用到攝像頭了,其實大部分城市攝像頭是不太智能的。「燈下黑」就是說攝像頭有,可我沒有辦法去做分析,因為你人力只有這麼多。攝像頭有很多,幾萬、幾十萬,甚至大城市有上百萬的攝像頭。但是,除了查違章有一部分智能攝像頭,其它大部分都是事後去看的和當時少量的人力觀察。

第三,霧裡看花。

今天的感知手段不能做全局、全量的實時感知。所以我們沒有辦法去找到很多現象,比如擁堵也好、安全隱患也好,它背後的原因在哪裡,所以我們叫霧裡看花。

我們進一步看城市大腦是什麼樣的東西?首先城市有大量的數據,包括視頻數據,我今天講的更多也是視頻數據,而且視頻數據跟其它數據不一樣的地方在於,視頻數據(pixel)是需要進行分析的,其它數據是直接可以使用的。

所以,我們希望所有攝像頭裡視野能看到的東西,我們都能理解,包括:車、人、物、事。

車的情況,什麼車、什麼速度、往哪裡走,車牌。

人的情況,駕駛員、行人、騎自行車的人。

物的情況,各種交通標誌、拋灑物等之類的。

事的情況,發生什麼事件,有沒有擁堵、逆行、交通事故等都要理解得很透徹。

有了這些之後,我們就可以進行決策和優化了,比如簡單的決策是直接把這個事件事故的結果報告出來,有交警進行下一步處理;優化比如紅綠燈優化,我們知道所有交通的流量,「眼見為實」地通過視覺分析出來交通的情況,基於此我們可以做更好的紅綠燈配時的優化。

還有,把整個城市裡面的視覺對象放到搜索引擎里去,這就是像上次講過的拍立淘這樣的技術,今天我們做的是城市元素,所以我們把它叫「索引城市」,裡面可以進行搜索可疑車輛、可疑人,比如失蹤的人、有肇事車輛逃逸等,就可以通過它來尋找。當然,我們建立這種視覺數據的關係以後,也可以發覺他們之間的規律,找到他們之間背後的原因。

下一步預測,雖然我們沒有辦法預測每一個人、每一輛車的行為,但我們可以預測一個趨勢,比如10分鐘以後的車流是什麼,20分鐘以後是什麼樣子的,甚至可以做長時間的預測。短時間預測對我們GPS導航就很有好處,今天的GPS導航其實是沒有預測的,預測也是用的歷史數據做的預測,不是實時數據做的預測。如果說有很好的預測,那對你的路徑規劃可以做的更優化。而長時間預測的話,比如如果對一個城市第二天發生的情況進行預測,比如第二天天氣不好,還有幾個重要的活動,你大概能夠估計出來明天車流、人流的情況,可能有哪些地方交通擁堵會增加多長時間,哪裡交通事故的概率可能會增加。

有了這些信息以後,你就可以進行干預了。

第一種干預,可以預先分配這個資源,預先放到那裡,人力、警力、醫療資源,一旦出了事情以後,馬上就可以應對。

更厲害的干預,就是比如明天要發生的不好事情的話,我們可以提前做一些事情不讓它發生,比如交通的管控、比如誘導等之類的。

關於城市感知,我們今天提出來的城市大腦是要做感而全面知、感而全量知、感而實時知。這三個概念我分別簡單做一下介紹。

全面知,我們需要對整個路面上的情況了如指掌,也是今天因為我們在雲端的方案有這麼大的算力、有這麼大的靈活度,以及今天AI技術的發展,可以讓我們去年做不同情況下的精細目標檢測識別、跟蹤等之類的,不管是什麼天氣、什麼質量。

事件事故檢測也是一個異常檢測的問題,因為事件事故的種類樣子也很多,樣本數量又比較少,跟剛才講的工業診斷有點像,不過它不是圖片而是視頻,而是視頻的難度更大。這裡我們也是把它變成異常檢測的問題,也就是說我們有大量的正常的數據,我們去為正常的數據建模,有了正常的數據的模型,那麼異常的視頻片段送進來之後,它的響應就會非常高。

除了全面以外,還有全量、實時,這更多是兩方面的內容。

方面一:系統層級。背後要有一套計算平台來支撐,也就是需要有一個大的視頻處理的平台。我們處理一路視頻、兩路視頻沒有問題,處理十路有沒有問題,但處理百路、千路、萬路的時候會不會有問題?這裡其實要有一套背後的系統來支撐。我們阿里雲有這樣一套系統,在這個基礎上我們就build了一個視頻處理的流水線。當然也有不一樣的地方,因為數據的吞吐量大,計算的複雜度高,所以我們也需要對它進行一些優化和改造,使得它能夠吃的進去這麼大量的數據,處理得了,還能吐得出來結果。

方面二:演算法本身的計算速度。這個也是非常重要的。如果計算的成本非常高,就沒有辦法實現。所以計算的加速是非常大的投入,當時我們做了三個方面的加速:器件加速、模型精簡和並發計算流程的優化。

一個具體例子,就是我們最近發布的一個產品,叫「天曜」。這個產品背後我們做了球機的演算法,使得原來沒有智能的球機變成有智能的球機,就代替了交警的巡邏,而且它可以24小時巡邏,360度自動巡航,可以對交通違法、交通事故進行全面的監測。將來也許可以自動地進行處理,現在還是要人力來處理。

很多交通擁堵都是事故引起的,我們能夠快速地處理,根據攝像頭看的的內容,就知道是誰的責任。不是很嚴重的話,趕緊走人,以免造成交通擁堵;還有一些嚴重的事故,我們能夠及時地發現,及時地把醫療資源(救護車)送過去就能挽救人的生命。天曜是全天候、全面交通事件、事故感知的一套系統。

這項工作的特點就是充分利用城市既有的監控設備發揮最大的效率。我們對現有整個鏈路、整個設備不進行任何改變,我們通過雲計算,把無智能的設備變成一個具有強大人工智慧的設備。讓這個視頻監控實現了自動的巡航、巡檢,實現了讓機器替換人力,使得警力可以用在更重要的地方,而不至於用在這樣一個比較簡單的場景。我們現在也在跟AI晶元進行測試,成本會進一步降低,能耗也會降低。

接下來我們跳出來看一下,城市大腦不同的地方在哪裡?城市大腦的不同之處,我們是通過大量異構城市數據中,通過大規模的計算和AI演算法挖掘出不可替代的價值。像剛才講的這些價值,過去的方法是沒有辦法實現的,人力也是無法完成的。這就是第二點,城市大腦在做的事情是大多是人的智能是不能完成的,因為它的複雜度、計算量是沒有辦法完成的,AI在這些方面其實是超越人力的。

第三點是城市大腦希望有一些會成為一個城市基礎設施,就像水和電一樣。這是創造出來的一個需求。

城市大腦是一個如此巨大的項目,所以我們要把它做成人工智慧開放創新平台的。因為它的問題複雜度、數據的量、數據的複雜度和要解決問題的數量之多,以及它可能產生的價值和影響力之大,使得它可以成為一個創新平台。這也是為什麼城市大腦會成為科技部四個國家人工智慧開放創新平台之一。

總結

我們剛才講了四個例子,核心是要給客戶創造價值,這個價值有的是錦上添花,但基本上是雪中送炭和創造出來的剛需為主,因為這部分更有競爭力一點,在商業上也更容易成功。

我們再回到最開始,確實人工智慧會去改變、去顛覆、去革新各個行業。所以我經常講的一句話是:Intelligence Everywhere,勢不可當。我們從業者在這其中,到底是成為「勢」還是「擋」,這是我們不同的選擇,不同的選擇和策略,可能成為擋,也可能成為勢。

人工智慧對行業的影響一定會進入各行各業,大量的簡單勞動力可能會被機器替代,複雜但有規律的腦力勞動也可能會被替代掉,頂級的技術、藝術、設計、服務、科研、教育等這些還需要專業的人力,但人工智慧會成為他們的助理。

人工智慧今天如果真正能讓它落地,而不是成為一個泡沫,不是成為一個虛的東西的話,我們一定要深入這個行業、理解這個行業,理解這個行業的數據、需求、局限、和價值點等,為這個行業的場景定製出最適合的最有效的演算法和系統,這樣的話才能夠真正讓人工智慧落在實處,能夠創造、改變我們的未來。

-The End-

將門是一家專註於發掘、加速並投資技術創新激活商業價值的創業公司的創投機構,旗下設有將門創新服務、將門技術社群以及將門投資基金。

將門創新服務專註於使創新的技術落地於真正的應用場景,激活和實現全新的商業價值,服務於行業領先企業和技術創新型創業公司。

將門技術社群專註於幫助技術創新型的創業公司提供來自產、學、研、創領域的核心技術專家的技術分享和學習內容,使創新成為持續的核心競爭力。

將門投資基金專註於投資通過技術創新激活商業場景,實現商業價值的初創企業,關注技術領域包括機器智能、物聯網、自然人機交互、企業計算。在兩年的時間裡,將門投資基金已經投資了包括量化派、碼隆科技、禾賽科技、偉景智能、Convertlab、迪英加科技等十幾家具有高成長潛力的技術型創業公司。

如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投後服務,歡迎發送或者推薦項目給我「門」:bp@thejiangmen.com


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 將門創投 的精彩文章:

自底向上看深度學習網路的工作原理

TAG:將門創投 |