當前位置:
首頁 > 科技 > 微軟蘋果和這家中國公司,世界只有這三家具備完整智能AR技術體系

微軟蘋果和這家中國公司,世界只有這三家具備完整智能AR技術體系

蘋果、微軟、華捷艾米的新一代AR晶元同步量產,席捲全業的巨變即將到來。

北京北五環,佔地2.9平方公里的中關村軟體園區內,分布著國內外600家高科技公司的總部和研發中心。

2017年,這片園區貢獻了超過2000億的產值,每平方公里的產值高達805億,單位密度產出依舊居全國首位。

智慧和財富在此交匯,行色匆匆的路人,思緒里或許正激蕩著改變你我生活方式的新東西。

2月,我們在這片園區拜訪了華捷艾米的團隊。本次到訪出於一則留言——稍早前,我們的一篇文章里提到了商湯科技、曠視等專攻「計算機視覺」的企業。這兩家風頭正勁的企業,分別於2017年拿下了4.1億美元和4.6億美元的新輪融資;即便放大到整個資本市場,他們的估值體量也位列第二集團,僅次於小米、滴滴、螞蟻金服、美團等超級獨角獸。

華捷艾米是誰?它憑什麼被這樣認可?獲知信息後,我們認真查閱已公開資訊,得到兩條比較關鍵的產業信息:2018年6月左右,3家企業的手機晶元即將實現量產,分別是微軟、蘋果和華捷艾米。而在全球範圍內,也僅有這3家公司具備完整的智能AR技術體系(包括人物提取、骨架識別技術和動作跟蹤技術等)

這堪稱驚人的信息背後,到底隱藏著一家怎樣的至今不廣為人知的公司,為了揭開它神秘的面紗,我們趕往了華捷艾米的北京總部,並在那裡看到了「AI的眼睛」。對於AI(人工智慧),很多人早已審美疲勞。從沒有哪項技術像AI一樣,還未真正面世,便挑起軒然大波。輿論每天都面臨AI新聞的密集轟炸,但深刻改變生活的AI技術從未到來。

從企業到市場,AI划過了一條涇渭分明的線。

幾乎所有大型的科技企業,都在為之展開「軍備」競賽:上游產業鏈的英偉達,由GPU晶元更迭至AI晶元後,市值在2年內翻了10倍;中游的亞馬遜,幾乎將「深度學習」融入了產品的每個環節,成為AI市場的最大贏家;谷歌瘋狂燒錢,隔三差五便爆出革命性的AI黑科技,但始終停留在新聞階段;國內,百度正式轉型為AI公司,阿里和騰訊為之持續併購;BAT之外,一眾初創公司打著AI的理念,產品沒成熟,便收穫了天價估值……

這些企業努力描繪著AI震撼人心的應用場景,但民眾認知中的AI卻是另一幅景象:幾年來,除了吊打各路英傑的「阿爾法狗」,鮮有其他具象且具影響力的AI成果出現。基於這份落差,甚至有人將人工智慧稱為「人工智障」:吹起來比天大,學啥啥不行。

到底什麼是AI?它什麼時候才能改變我們的生活?這個宏觀的問題,可以做如下總結:

從發展階段看來,AI可簡單分為三類:弱AI、強AI,以及超AI。

弱人工智慧是擅長某個單方面的AI,比如阿爾法狗能把柯潔打到崩潰,但你要讓它識別動物,它也得崩潰。弱AI的範疇相當廣,只要涉及歸納、運算,並得到自動化結果的,都屬其中。比如百度依託大數據,根據你的興趣推了條新聞,這就算弱AI;亞馬遜的無人機自動識路送貨,算弱AI;波士頓動力的Atlas機器人一個炫酷到爆炸的後空翻,同樣只算弱AI。

即便是弱AI領域,成果的差別也堪稱巨大,個性推送和無人駕駛顯然無法類比,後者涉及的計算機視覺、深度學習以及數據統籌的難度是前者的幾何倍數。

一言以蔽之,部分AI已經作用於我們的生活,但是效果不明顯;而那些效果明顯的,比如高智能機器人、無人駕駛等,離我們還很遙遠。

現在的AI大環境,更像是一個「有機分裂」的整體,不同公司、細分行業,研究的是弱AI的某個點,而這些點最終、也必然會結合成為強AI,徹底顛覆人們的生活。

引用學術界的觀點就是:現在的弱人工智慧就是地球早期的氨基酸,它們會在某一天突然組合進化成為生命。至於這一天是什麼時候,誰也說不準。

在弱AI「進化」的過程中,有一個經典的認知誤區:那些你認為很難的,對於電腦而言巨簡單,而那些你認為特「弱智」的,對於電腦而言巨TM難。

比如,解一套微積分題,電腦可以秒出結果;但識別放在面前的是一棵小樹還是一株大草,對於電腦而言則極端困難;架構一套金融市場的策略模型,對它來說輕而易舉;而讀懂幼兒的圖書、真正理解各種詞意——谷歌為此花了幾十億美元,還沒做出來。

人類覺得特別容易的事情——視覺、動態、移動,甚至直覺,對於電腦而言難於登天。伸手拿起一件東西,是人類在經過幾億年的進化後,不需要思考便能完成的事情。我們有著全宇宙已知的最複雜的東西——人腦,各處肌肉和關節、以及視覺,在人腦的指揮下瞬間配套完成各種物理工作,這是人類的本能。

這種本能,對於電腦而言恰恰是最難的——現在的電腦連網站的驗證碼都看不懂,能分辨貓狗的計算機,就能稱得上「超級」AI。

看懂、聽懂都做不到,怎麼能進化成強AI?因此,弱AI的首要難點,便是解決包括計算機視覺在內的各類「基礎」問題。

「科普」結束,主角登場。華捷艾米之所以被稱為「全球三強」,根基是它在核心演算法的基礎上,賦予計算機以立體視覺,進而研發出了擁有全套自主知識產權的3D-AR解決方案。

簡而言之,它最強的地方,是在大批獨角獸公司「鑽研」二維視覺的背景下,通過AI技術,給了計算機一雙類似人眼的「三維眼睛」。

在華捷艾米,我們看到了這些場景:

一位測試員正對著屏幕玩各種體感遊戲,從保齡球、乒乓球到跳舞機,不同於微軟的Kinect之於Xbox,他是「裸身」遊戲,身上沒有任何體感設備。唯一的「載體」,是電視機下方一個內置了華捷艾米AR晶元的白盒子。

華捷的市場負責人介紹說:「不同於以往的體感遊戲,玩家在華捷的體驗中需要拿出真實的力量。比如打乒乓球,晶元能讀出你的每次速度和加速度,你必須用真實的力度獲得足夠的勢能,才能克服重力,完成擊打。」

另一位測試員,則通過Pad與一個虛擬形象互動。在他的指揮下,這個「小人」靈巧地翻躍著辦公室間的桌椅,遇到牆壁時還不忘繞開。

看上去都是「遊戲」,但其所象徵的技術以及適用的場景,卻遠超遊戲的範疇。

華捷艾米的創始人及CEO李驪,如此簡述整個遊戲的過程:

在技術層面,上述場景的實現經歷這樣的過程:

如果你聽得雲里霧裡,那麼只需要記住最關鍵的一點:在全球,能實現這一系統解決方案的僅有三家企業,分別是微軟、蘋果,以及華捷艾米。

這一結論或許和很多行業新聞大相徑庭——在AI業內,尤其是國內AI界,計算機視覺是最火的細分領域,平均每10家公司中,就有五六家有「獨到」的視覺技術;而根植計算機視覺的創業型企業里,已經誕生了四五家獨角獸級別的企業。

不論是專攻計算機視覺的各大「獨角獸」,還是機場、高鐵、安防等領域廣泛投入使用的人臉識別,核心都是基於2D視覺,國內目前基於立體視覺、推出廣泛應用的,有且只有華捷艾米一家。

出於計算機視覺在弱AI領域的重要性,作為中國立體視覺的領航者,這家企業的每一步,都是將國內行業往更縱深的方向推進。

「三強」之中,蘋果是目前全球AI結合AR產業的領先者。2017年9月,蘋果推出了包括手機、平板電腦、Apple TV等在內的一系列AR產品,並且向供應商下單1.2億套AR相關組件。

雖然鮮以AI企業自居,但蘋果全面AR化的背後,包含了大量AI技術與知識產權。有統計稱,為了拿下這些技術,蘋果掏出了接近200億美元的併購資金。結合AI技術,蘋果在自己的強勢領域找到了合適的應用場景,在「落地」上為一眾企業指明了方向。

「三強」中的另一家微軟,則堪稱企業界AR乃至AI的鼻祖。早在1992年,比爾?蓋茨就對人工智慧做出規劃,要「創造能看、能聽並且能理解人類的計算機」。以此為指引,微軟建立了人工智慧研究所,招募了大批語音識別和計算機視覺的頂尖研究者,一「養」就是20多年。

很多AI實踐領域,微軟都是先行者。早在1998年,他們就展示過數字地圖技術,遠遠早於谷歌;其3D體感設備Kinect,被稱為革命性的交互產品……

微軟之於AI,就像美國科技之於全球。他們像燈塔一樣探索未知,為後來者提供可見的路徑。不過,在成果轉化上,微軟的AI始終不盡如人意,有業內人士稱:微軟養了20年科學家,投入的資金早就以百億美金計,至今沒有收回成本。

在蘋果、微軟百億美金級別的投資背景下,華捷艾米的成功顯得不可思議:一家創業型的中國企業,如何實現了同樣的技術壁壘?

創立華捷之前,李驪曾供職於聯想和中興,期間完成了原始積累。2010年前後,計算機視覺大熱,國內幾乎所有上規模的科技和互聯網公司都投身其中。浪潮之下,李驪認定這個技術能「改變世界」,於是辭職創業。

不過彼時,他的出發點只是「山寨」一把微軟,和「改變世界」沒有任何關係。但一圈轉下來後,他發現:山寨的可能性完全沒有,而此前大舉進軍的企業們,也正成批撤退。

撤退和無法山寨基於同樣的原因:基礎學科和邏輯原理的難度太大。

企業經營不同於純粹的科學研究,新的項目一般周期是2到3年,如果2年沒有實質性進展,大概率會被叫停。

對於企業而言,過分執著於基礎科學並非好事,財大氣粗如微軟、谷歌,才能承受「瘋狂燒錢」沒商業回報的工程;而強如亞馬遜,也更多是在應用場景上變出花樣。

「求學」的過程很順利,因為「難度很大,教授們一聽都很感興趣」,不僅全力配合,有的還專門給華捷的技術團隊開課授業。

雖然團結了大批專業力量,但整體的突破依舊無比艱難。李驪從未想過,光是理順邏輯原理,就需要數以年計的時間。整整4年時間裡,他和團隊四處奔波,掛靠在各類學校的下屬公司里,打一槍換一個地方。

「從沒想過要那麼多時間,但專家們是越難越想研究,我甚至巴不得他們說做不出來,我好徹底解脫。」李驪說。

千難萬阻化為一句話:堅持就是勝利。

在想盡各種辦法死撐後,團隊最終迎來了曙光:2014年8月,各方專家教授最終理順了邏輯原理,同一時間,華捷艾米正式成立。

天使輪時,華捷艾米的估值是1.3億,1年後,其估值便暴漲至12億,並被工信部列為AR和人工智慧核心企業。

雖然身價暴漲,但很長時間內,華捷艾米都是一家隱於水下的公司。掌握基礎原理後,他們還有大量演算法、數據的問題要克服,除此之外,更關鍵點在於準確的定位和「變現」方向。

AI領域,企業的市場應用是出了名的「尷尬」。過去幾年,大批AI公司嘗試了各行各業,「小」到市場零售,「大」到航空航天,AI概念無處不在,但探索、試點期從未結束。

「雷聲大、雨點小」,是造成輿論對於AI認知混亂的原因之一,而之所以難「親民」,歸根結底是相關AI的技術和服務不能滿足行業的需求,客戶企業付出的成本高,效果卻不盡如人意。

手中的立體計算機視覺如何變現?華捷艾米做了兩個定位,其一便是結合AR技術,先做強「增強現實」。

AR和VR幾乎是同時期火起來的熱詞,但VR已經經歷了「瘋狂投錢、挨個倒閉」的狂潮,AR的發展卻方興未艾。

究其原因,這兩者雖然聽起來像,本質卻截然不同。VR所謂的虛擬現實,本質是顯示方式的革新,其入門難度相對較低,因此初創公司如雨後春筍。而AR則涉及與真實場景、動態物體的交互,對AI相關技術提出了很高的要求。

與遊戲結合,AR能創造各式各樣的遊戲場景與虛擬形象,讓真實與虛擬無縫銜接,遊戲體驗數倍提升;與教育相結合,教師能創造各種適時的場景與物品,比如虛擬的器官將代替真實器官,讓學生們隨意剖析……

市場負責人介紹稱:諸多場景中,華捷艾米的技術已經做到了「無中生有」和「無處不在」,讓使用者得以身臨其境,虛擬與真實皆觸手可及。

和AI一樣,AR的應用同樣沒有主戰場,完全在考驗業界思想的極限。而所有的這一切,都必須建立在更精確的計算機視覺、更完善的人機交互的基礎之上。

相較大AI時代的不可預知性,AR+AI的時代已經迅猛來襲。

2015年開始,微軟發布了Hololens,谷歌投資Magic Leap,蘋果收購Metaio,百度發布Baidu Eye……巨頭加速的兩年後,業內的第一波大地震正式到來。

今年6月,蘋果和微軟的新一代晶元即將實現量產。業內消息稱,繼發布全套AR產品後,未來,蘋果所有的產品都將進入AR時代。

為了契合AR的需求,2019年,蘋果將推出徹底革新的iOS系統,與此同時,微軟的Windows也將基於AR進行全面變革。

全新的起點,為消費類電子行業划出了一條命運的轉折口。巨變中的落後者們,不得不展開千方百計的追趕。

去年底,華捷艾米先後接待了一眾國際巨頭廠商,後者希望將華捷的IP納入自己的體系。

「眼睛」是AR的基礎,也是一眾弱AI變現的關鍵,無人駕駛、適用性機器人等理念,都極端考驗立體視覺。1年間的爆發,源於華捷艾米的領先技術,也與其定位息息相關。如前所述,方向上,華捷做了兩個定位,其一是結合AR技術,另一便是基於先行者與領導者的優勢,做一家賦能的基礎企業。

立足賦能的定位,華捷艾米的晶元技術得以流向多個領域,比如液晶電視中的面板,智能機器人,以及手機晶元。

經過9年漫長的獨立研發後,他們將立體視覺、手勢體感、人物摳像、AR技術等完美融合,締造了當下幾乎「無所不能」的晶元。其技術能與各行各業緊密結合,讓各大企業加快進入AI時代,並且迅速走上「立體」的正途。

不過,飽受追捧的態勢下,李驪也動起了「小心思」:華捷艾米脫胎於「國家隊」,這輪變局裡,他也更希望和民族產業掛鉤,互利互裨。在他看來,AR浪潮是一批中國企業重新定位、彎道超車的好機會,比如展訊等晶元公司,有能力大大縮小與高通的差距,成為中高端手機晶元市場的奇兵。

李驪對華捷艾米抱有十足的信心,按照他的規劃,未來凡是需要用到計算機視覺的領域,都可以是華捷艾米的應用範疇——這個領域,幾乎包攬了AI應用的大半壁江山。而他和團隊要做的,就是讓這雙眼睛更精準、讓它背後的大腦更快。

人類的科技進步正以持續加速伴隨著爆炸式突破的方式迅猛向前。過去100年,人類的科技成果超越此前千萬年的總和,有學者預測:21世紀的100年,人類的科技成果將是20世紀的1000倍。

在這個急速巨變的時代里,一個新技術,很有可能從根本上改變人類的生活方式,而一家小公司,也完全有機會在短時間內成長為巨頭企業。

身處其中,即便只是一個見證者,也著實刺激。

來源:華商韜略


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器人大講堂 的精彩文章:

哈佛大學終身教授何毓琦:年輕人如何做好科研
重磅!人工智慧即將進入產業爆發的拐點

TAG:機器人大講堂 |