曠視科技副總裁謝憶楠：中國人工智慧的系統與準繩

科技 07-12

2018年，商業創新邁進新的階段，商業創新在業務飛速發展的同時，伴隨而來的也有風口大熱背後的認知沉澱與實踐積累。7月10日36氪聯合《零售老闆內參》舉辦的2018商業新生態峰會在北京舉行。本屆峰會以「質」為主題，希望新的時代浪潮下新商業企業可以看清商業本質，最終完成新商業的革新與升級。

近幾年國內湧現了一大批優秀的以計算機視覺為研究方向的AI企業，並且仍然有源源不斷的創業者投身其中，讓人禁不住懷疑，行業泡沫是否已經出現。當前的局面究竟是泡沫還是春天？在2018商業新生態峰會上，曠視科技副總裁謝憶楠圍繞中國人工智慧的系統與準繩，與大家分享了他的觀點。

以下為謝憶楠發言全文：

感謝大會邀請。

我們今天講的是特意跟著大會的主題——本質、明質、遠質，重新調整了一下內容，我們講中國人工智慧的系統與準繩。首先說系統，我去年參加了一個人工智慧大會，聽美國一位獲得圖靈獎的老師跟我講美國和中國在這波人工智慧熱潮中的區別，美國更多是通過計算力和演算法驅動，他們不斷地嘗試演算法能達到怎樣的極限，他們擅長直線的嘗試。所以我們可以看到阿爾法狗，看到非常強的技術展示給我們。這個過程中其實我們會發現一個問題，他其實並沒有講這些技術能做什麼。我們不能指望每天會花幾百萬電費的阿爾法狗做什麼東西，但是中國的人工智慧來自於場景，真正來自商業化，跟我們今天的大會主題非常貼近。所以說我們今年或者說中國這波人工智慧是通過很多的場景、AI商業化去實現的。

所以我們可以看到中國和美國之間，大家都講中國領先或者美國領先，其實根本不存在領先與落後，是我們的系統跟人家本身就不同，後面會解釋一下。

第二個是準繩，為什麼寫準繩？是因為有一個二級分析師的朋友跟我很熟，從2014年做第一次研討會，到今年他跟我說現在越來越看不懂一級市場給人工智慧做估值的模型了，因為他們從任何的資料和數據上來判斷，都覺得沒辦法理解估值和該企業所做的生意到底區別是什麼。所以我們總結了一下我們創業的第七年，到底應該做什麼？

我先解釋一下曠視科技，大家都以為我們叫Face++，其實Face++是我們的人工智慧開放雲平台。我再重申一下，我們叫曠視科技。

我們看這麼一個圖，這個圖上下兩張照片，兩張照片都取自於網上的網紅照片，他們通過化妝讓自己變得完全不一樣，這個照片在國外主要用來做什麼呢？我們經常可以看到計算機視覺公司刷人臉識別的榜單，做的事情就是給計算機兩張照片，讓計算機來判斷不同照片中的到底是不是一個人，如果概率很高就回答YES，概率不大就回答一個NO。國外很多的人他們畢生解決的就是這個問題，中國公司用同樣的一個場景解決的卻是一個千古難題——證明你是你。我給大家解釋一下什麼地方會用到這個。第一是最近引發熱議的網約車服務，而我們的技術可以證明開車的這個司機是駕照上的人，司機必須要通過人臉識別完成實名信息認證。第二是所有的互聯網金融平台、新媒體平台的作者都必須通過實名認證，需要你告訴平台「你是誰」，平台不會允許和真實用戶身份不一的人來使用。總結來說，我們會看到國外用這項技術只解決了一個問題，就是用來判斷兩個看起來完全不一樣的人如何能證明他是一個人，而中國卻用這個難題解決的是商業化的問題。這個界面是我們商業產品的模型圖，這就是目前最大的第三方在線身份實名認證平台FaceID。同樣解決一個技術問題，但中國公司不僅僅指曠視，更多會選擇用這項技術解決一個商業場景的難題。中國公司的本質就是不斷地通過這些AI能解決的問題找到實際應用場景。

這句話來自於去年MIT給到的一個評價，我覺得很中肯。 MIT評論說美國應該學習中國，它雖然沒有直接肯定中國的模式是對的，但它認為中國AI公司現在所做的事情對整個社會或者技術是有提升的。

接下來我們講準繩。我們判斷一家公司到底是不是有泡沫，可以從這五個方面去看。

第一個方面是技術的去人力化。目前大家比較習慣於用以下幾個指標判斷一家公司技術好壞。第一個指標是剛才講的某一個演算法結果，演算法級刷到百分之九十九點九幾，那個點比千足金還要高。第二個指標是很多的演算法人才組成了龐大的科學家團隊，這個團隊可能多達三、五百人，甚至在公司佔比80%以上。第三個指標是論文產出，要知道中國在今年所有的論文產出數上已經達到了世界頂峰。但是這些就真的是對的標準嗎？——並不全面。從論文這一點來看，我們看到另外一個數據是，中國論文的引用度在全球排第四位，甚至連前三都不到。原因是什麼？原因在於技術本質的準繩。中國企業更偏向於可以量化的指標，而真正的技術準繩是什麼？我講的是去人力化。曾經有一位BAT公司級別很高的人來曠視參觀，我感受非常深。我們用很長一段時間來講演算法的突破，但他們其實沒有太在意，最後講到數據標準的問題，所有人的眼睛泛起了一個火花，來問我們「數據從哪買的，數據的標註是誰來做的」。所以我們看到一個本質問題是，多數企業目前研究團隊中，可能100人中的80%根本做的不是Researcher該做的事情，他做的是數據清理。人工智慧給的定義是人類給計算機一個正確答案，讓計算機不斷地尋求正確答案，從而去衍生其他的東西。所以你的標註如果出現了問題，對AI的理解就很有問題。目前人工智慧所有領域的東西，他用的是監督式學習，就是人工判斷。我們經常聽到一句話是「有多少人工就有多少智能」。你的技術裡面，你的百人團隊是否能用一百倍的演算法，實現人力成本減少。

因為卡、算力便宜，人會越來越貴，所以現在我們去看AI公司的技術本質，就是要看它的底層代碼是不是自己做的，是不是能夠做到在整個的系統裡面降低人工干預的比例。

我們都非常關注晶元的自主研發，那麼就人工智慧而言，如果操作平台、操作引擎不是我們自己的，往上往下所有的晶元這些東西我們都不可能去直接掌控。這些關鍵技術才是我們去判斷一家公司的準繩。為什麼谷歌要開源TensorFlow？你用我的TensorFlow就要買我的TPU，你買TPU就要用谷歌所有一切的工具，這樣谷歌就成了數據的窗口。之前互聯網公司搶的是流量，現在的AI公司搶的是數據，他們通過這個才能實現真正的掌控，所以真正的AI公司不要去用那些所謂的可以量化的數量去衡量它，我們就看一家公司的演算法引擎，是不是能夠為數據進行一些可控性的處理，它是不是能夠創造自己的操作引擎。我可以講目前80%的中國人工智慧公司，演算法引擎都是通過開源平台加上自己的一部分能動性演化出來的。

第二個方面，商業的從0到1，這個階段我們可以把人工智慧當成一個工具，解決很多人無法解決的問題。比如說網約車的問題，我們無法用人工給每一輛網約車做實時驗證，但我們的FaceID可以讓手機成為一個理解、認證人臉信息的工具。

但是我們要看到，如果人工智慧只是作為一個工具，它的門檻相對較低，所以接下來我們要講第三個方面，商業的從1到N，人工智慧從技術工具到數據結構化、可視化的演變。

我們可以拿安防場景來舉例。最近網上熱評張學友是中國最成功的刑警，開一次演唱會抓一次人。但演唱會場景卻與真實的安防場景有很大的差異。演唱會場景的人臉識別技術只是一個工具，在整個抓捕過程中需要多人、長時間參與。從跟進監控屏幕的報警信息、指揮中心傳遞信息給分局，到分局研判結果的返回，再到分配警力去現場搜尋，整個過程需要40分鐘到1個小時。只有在演唱會這類相對封閉的場景下，才能允許這麼長的耗時。

但是在一個地鐵里，我們了解到警方的要求是從在逃嫌疑犯出現開始，要兩分鐘之內完成定位，並且讓警員實施抓捕。為什麼是兩分鐘？如果做不到兩分鐘這個人坐地鐵就走了，這就是技術到商業最基本的要求。我們會發現，目前很多場景下我們只是傾向於用技術來證明它可以解決問題，但是卻忽略了商業對於技術其實也有要求。地鐵里出現的人是活動的，民警站點也是活動的，在這個場景只有三環。第一環是在下電梯的時候快速定位，第二環是對他的臉和特徵進行一個匹配，再從臉部信息延展到人體包括背部信息也能準確識別，這就是一個警察所具備的功能，這就是一項技術驅動商業化真正要實現的事情。所以中國有很多安防企業用AI做這件事情，但是他們只證明了AI能夠成為一個工具，但是真正要去實現商業化，不僅是成為一個工具，而是可以通過AI技術模擬出人具備的特性，這樣才能實現商業價值的從1到N。

第四個方面我要講AI帶來的產業升級。我拿曠視在零售店的落地來舉例。曠視對於新零售的理解是重構零售行業整個供應鏈。在我們這個視頻的場景里，顧客拿了一個牛奶，這個拿牛奶過程中的數據可以實時反饋給這家店的網上倉儲存儲供應商。我們為什麼學日本零售？因為他們有兩件事情是我們根本比不了了。第一是他們的毛利率，他比我們同樣的零售體系可能高一個數量級。第二是例如711這類便利店可以實現每天三次補貨，它對店鋪中的關鍵數據有深厚理解，每家店從貨品擺放到貨源補充都可以滿足顧客需求。我們傳統的便利店是缺乏這項能力的。每家店都需要一個好的店長，711成功之處在於它可以複製很多店長。但中國便利店太多，我們很難實現讓每家店的店長都具備標準化素質，所以我們需要一個系統。在這個場景需求下，我們用AI技術賦能零售店裡的攝像頭和貨架，通過這種設備就可以像店長一樣觀察和分析來到這家店的一般有哪類人，他們對什麼東西感興趣，會看什麼東西、最後會買什麼東西。最後能幫助零售商家實現人效、平效等多方面的提升。這就是技術走向商業化實現數據聯通，讓技術去解決商業本質上的問題，而不只是把商店裡的人流熱圈畫出來就可以了。

第五個方面，我們去看周期。

第一層包括銀行、安防還有媒體，裡面基本上巨頭林立了。拿安防舉例，我們可以看到，不管是傳統巨頭還是我們這樣的新入者，都已經在安防行業里駐兵兩年以上。真正的機會在第二層，手機、物流、零售、保險、製造。這裡為什麼說手機會是接下來一到兩年的重要指標？現在的手機是一個通訊工具，但未來手機會向個人助理方向演進，它將具備很強大的智能管控功能。比如拍照，我拍出來不好看，但攝影師卻可以拍出獲獎作品，這是因為使用者的能力不一樣。 AI要解決的就是把個人能力的差異降到最低，你不用會拍照，你會用手機就可以了。最後一層是自動駕駛、醫療、AR還有家用機器人，這部分的周期相對更長一些。

我特地選了中美這張圖作為今天的總結。中國要用AI解決城市的問題，而美國想維持自己的基礎霸權。為什麼我講中國要解決城市的問題？其實靈感來自於之前看的羅振宇推薦的《大國憲制》，其中提到中國是一個很大的國家，要維持中國的運轉和其他國家的運營方式都不一樣。中國已經提了很多年的智慧城市建設，也有越來越多企業在關注和提倡。我們要去理解這件事情。伴隨技術的發展與成熟，未來城市的運行與管理離不開兩大核心：一是計算力，二是大數據。我們現在之所以會定義某些城市為一個不可再膨脹的超大型城市，是因為目前的算力和數據無法再維持更多的用戶，不可維持就意味著城市的運營管理、資源使用和污染等都變得不可控。但如果我們真正實現了城市大腦的話，就有可能讓城市得到更加良性的發展。這就是為什麼中國一直提倡人工智慧技術的應用，因為基於對中國現狀的真正了解。

最後再次感謝主辦方的邀請，謝謝大家！

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 36氪 的精彩文章:

※對話BOSS直聘廣告製作者：廣告要像楊超越，「好」在傳播里是有問題的
※哪些跡象告訴我們，公司可能不行了？

TAG:36氪 |