當前位置:
首頁 > 知識 > 專訪Professor X:無人車即將落地,但可能不是你想的那樣

專訪Professor X:無人車即將落地,但可能不是你想的那樣

Professor X 的研究甚至影響到谷歌的無人駕駛團隊。圖片來源:Flickr

撰文 | 邸利會(《《知識分子》》主筆)

責編 | 李曉明

知識分子為更好的智趣生活 ID:The-Intellectual

Professor X,中文名肖健雄。他擅長黑科技,其名卻難以用英文發音,同事和學生們乾脆以X稱呼之。X也象徵著未知,確實,他所從事的領域,無人駕駛,很長時間裡也是一個待解的難題。不過,目前來說,X已經部分可解,部分場景下的應用即將落地。

看起來很年輕,還像一位研究生的肖健雄,其實已經是無人駕駛領域的老兵。早在十幾年前,還是本科生的他就跟隨香港科技大學權龍教授做計算機視覺,並發表了計算機視覺頂級會議(ICCV)的論文。在香港科技大學的本碩連讀完成後,肖健雄赴麻省理工學院(MIT),跟隨Antonio Torralba教授在計算機科學和人工智慧實驗室繼續其研究,之後成為普林斯頓助理教授、普林斯頓計算機視覺和機器人實驗室創始主任,學有淵源且成績卓著。他在2017年被《MIT技術評論》選為35歲以下的創新者。他的研究還影響到谷歌的無人駕駛團隊。

因為渴望研究能發生「看得見」的效用,肖健雄在2016年創立自動駕駛公司AutoX並擔任CEO,其意願是將自動駕駛平民化,讓每個人都能從單調乏味的駕駛中解放出來。在剛剛結束的深圳CCF-GAIR大會上,肖健雄介紹了AutoX的最新進展並分享了自動駕駛的見解。會後,他接受了《知識分子》的獨家專訪,談了談這幾年他走過的研究道路以及對於自動駕駛技術落地的看法。

Professor X 肖健雄


1 開創三維深度學習學術領域

《知識分子》:你從什麼時候開始對機器人和計算機視覺產生興趣的?

肖健雄:說實話研究了十幾年,挺久的了。我從本科的時候就開始在研究計算機視覺,當初讀的是香港科技大學,我那時候在考慮要不要讀研究生,就仔細學習了系裡老師的各種研究,其中權龍老師的研究,做三維重建技術,特別吸引人。我在上大學之前也是搞計算機的,包括我高考是計算機保送的,所以也是研究計算機各個方向很多年。我覺得最吸引我的還是人工智慧這個領域。

人工智慧也有很多方面,有醫療、自然語言處理,但是最吸引我的是視覺,所見即所得,更直觀一點,結果好不好立竿見影。所以我在本科的時候選擇了跟權龍老師一起做研究,我是他職業生涯裡帶的少數的幾個本科生之一。跟他一起做研究,第一個項目就成功發表了ICCV論文。權老師的要求很嚴格,只有這樣他才會收我做他的研究生。我們當時做的是谷歌的街景分析。像語義分析、三維場景分析,這些已經很成熟、最起碼比較流行的技術,但在當初是很少人研究的。

權老師研究非語義的三維重建,我加入他的組裡做研究的時候,希望有進一步的突破,所以我提出把語義跟三維結合起來,那個時候也發表了ICCV的另外一篇文章,專門做三維語義的街景分析,可以直接應用在自動駕駛上。在馬路上看三維場景,做語義分析,這是樹,這是人,這是汽車。所以那個時候已經開始研究這個,其實也是谷歌資助的研究項目,數據是谷歌給的,連我們的研究經費也是谷歌贊助權老師實驗室,所以很多成果被用進了谷歌地圖。後來谷歌地圖那個團隊又變成了谷歌無人車的組,我們給他們貢獻了一些的最早期的那個版本的技術。

《知識分子》:原來是這樣的故事,你和權老師的研究還是不一樣?

肖健雄:那個時候本科讀完,剛上研究生。當然權老師主要強項是做三維的,圖形學應用方面。我在三維的基礎上再擴展了語義,所以真正有了人工智慧,不是純三維而已。我覺得圖形學應用挺好的,卡通和視頻看起來很酷炫,但是沒什麼實際用處,所以我更偏向是那種能夠真正跟物理世界發生交互的研究,所以我們那個時候就自己採集了大量的數據,當然更多的數據都是谷歌提供的。

《知識分子》:那個時候你們已經有車?

肖健雄:谷歌有車,我們沒車。他們用他們的車抓數據給我們。因為數據量很大,谷歌就寄了整個硬碟過來。我還記得當初很開心,第一次見到有這麼多數據。當初整個硬碟很大,網路還是很慢的,傳不過來,所以從美國寄到香港。用大量的數據做大量的分析。

《知識分子》:那個時候已經在做無人車了嗎?

肖健雄:那個時候還沒徹底地弄一個車在路上跑,我們合作的是谷歌街景地圖團隊,也就是後來的谷歌無人車的團隊。但是這些技術都是相通的,我之後在MIT讀博士早期的時候還去谷歌實習了一段,也是在谷歌地圖組,所以也是挺有淵源的。後來我主要在學術圈做,他們自己在公司內部做。他們一開始從學術圈借鑒這些演算法,再把它工程化,所以其實大家本質上殊途同歸。

《知識分子》:後來你去了MIT做博士主要做了哪些研究?

肖健雄:我在MIT師從Antonio Torralba,他是做語義分析的一個教授,特別擅長大數據分析。像ImageNet也是最近的事情,ImageNet的前身有一個LabelMe的數據集,是我的導師做的(按:作者是Bryan C. Russell,Antonio Torralba);SUN Database是我和導師一起做的,都是比較老的歷史。那時候我們開始做大數據分析,語義切割、語義分析,深度學習還沒火起來,但是我們在實驗室得到的結論是大量的數據非常有用。後來深度學習出來了,那是一種很好的使用大數據的用法。我在MIT實驗室最後一年,在導師的基礎上再跨越一步,擴展到三維的,用三維深度學習開始做物體的檢測、跟蹤,像車輛的三維檢測。現在每個人都在說融合,前融合、後融合,那時候在MIT讀博士的後期,這些技術我們已經發明了。

《知識分子》:什麼時候開始把深度學習的方法引進去?

肖健雄:那個是2012年就開始做的,我還發表了一篇文章,第一次用深度學習,把顏色、攝像頭跟深度的信息融合起來,用三維深度學習做前融合,其實這個工作開創了整個三維深度學習學術領域。現在這個領域很火,如果去CVPR(註:IEEE國際計算機視覺與模式識別會議)這種會議,裡面有幾百篇論文都在討論這個,但是當初沒人做的,我們是第一個做這個。因為我還記得剛開始做這個的時候,我博士導師還覺得不可能做出來,我就暗自給自己打氣,我一定要做出來給你看,就憋一口氣。後來在普林斯頓大學,我的實驗室已經在做無人駕駛了,用模擬器做各種試驗。真實路測方面我們沒有正常的汽車,但是我們有移動的機器人。也蠻大的,開30公里每小時的機器人,其實就是自動駕駛的車,跟我們現在的送貨小車蠻像的,但是沒方向盤。

《知識分子》:在普林斯頓的時候,也做機器人吧?

肖健雄:對,除了無人駕駛,我們也做機械手抓取東西,就是先物體檢測,檢測出來要抓。我帶領團隊跟MIT合作,用機械手參加Amazon Picking Challenge的比賽,就是機械手的物體識別、抓取、放下,拿了全世界第三、第四名。

《知識分子》:這都是很難的任務。

肖健雄:對的。這個技術跟無人車非常相關,也是用三維深度學習的方法,認出這個物體在哪兒,大小多少,朝向是什麼,這些都得做得很好。


2 「希望整個行業不要吹到太火」

《知識分子》:但是大家感覺到還是不能完全實現自動駕駛,假設別的條件都沒問題,單純技術是可以達到的嗎?

肖健雄:我覺得這個技術現階段好到能演示,這個肯定沒問題,問題是能不能真正運營,因為演示只需關心正常情況下會發生什麼,但是運營的時候要想的是最糟糕情況下會發生什麼。我覺得現階段很多地方還沒辦法做無人駕駛的運營,特別是中國的路況特別複雜。我覺得中國路況演示也可以,但是敢真的無人嗎?這是問題。

我覺得在一些限定場景,像園區或者速度稍慢可以做,但是那些在大馬路上完全無人駕駛技術還不成熟。距離完全無人、完全不出任何事故,我覺得還得一定的年份,沒那麼快。包括谷歌的無人車團隊做了這麼多年,現在在美國也不是挑紐約這種大城市,而是挑比較簡單的路,人比較少,地廣人稀的地方開始運營。所以我覺得任何公司號稱兩年後在北上廣深大規模運營(無人車),要麼就是在打擦邊球,要麼就是在吹牛。

《知識分子》:所以你覺得目前整個行業的技術還沒達到那個高度么?

肖健雄:對,因為我是做學術和技術出身的,喜歡實事求是,我也希望整個行業不要吹到太火,到時候沒法實現,出現AI冬天。技術有所能,有所不能。在大暴雨天里無人駕駛,我們公司在一年半前早就做了演示,但是真敢在大暴雨天沒有安全司機,開那麼快,還能確保萬無一失嗎?這個要求是完全不一樣的。運營的時候要考慮的是最糟糕的情況下,性能也要夠安全。

《知識分子》:尤其要做成一個大眾都使用的產品,這個難度就相當高了。

肖健雄:對,千奇百怪的事情都可能發生。

《知識分子》:無人駕駛的歷史是很久很久了,德國很早,包括美國DARPA Grand Challenge,伯克利的智能交通,到現在谷歌等,我們有沒有可能最後完全在一個限定的場景,比如說改造整個交通系統,用智能交通的概念來做?

肖健雄:這個肯定可以。但是這個在純市場經濟情況下很難達到這種水平,除非是政府計劃就是這麼搞。純市場經濟很難進化到那一步。這包括車子、人的智能化等。但總不能強迫路上每個人都裝個感測器,這不可能,就像大家會忘了戴手錶,除非把全世界人民注入一個晶元在體內,一出生就打進去,要不然沒辦法。也看城市規劃怎麼設計,要全規劃成有一層根本沒有人可以走,只有車,就像地鐵一樣,那麼沒有問題,地鐵早就可以無人駕駛了。

《知識分子》:你覺得某一個階段人和車是混在一起的?

肖健雄:對的,人和車混在一起肯定是可以,但是來得沒那麼快,我覺得肯定在一些比較特殊的場景,一開始肯定不會就是無人計程車。我覺得一開始是物流的小車,或類似的這種非常接近的應用,這些場景已經到臨界點了。

《知識分子》:現在來說AutoX關注的產品都是能落地的?

肖健雄:我們特別擅長研究,要研究什麼特別酷炫的,我們向來干這行的,但是光研究酷炫的沒什麼用。我們所有的發明創造都是為了產品服務的。我們是以產品為導向的公司,如果產品需要我們研究發明這些,如果產品不需要,我們不研究發明這些。

《知識分子》:你現在覺得哪些現在可以落實成產品?

肖健雄:我覺得我們的三款產品中,小車是最容易落地的。因為送貨跟送人不一樣,比如說從A到B,如果送人,因為人坐在上面是要求走得又快又舒服,肯定要抄最短路過去,假設有個路口特別難走,還是得走,要不然繞一大圈,雖然也到達目的地,但是乘客不開心,舒適度很差。

送貨就沒這個問題,稍微繞一點,可以挑一些簡單的路徑開過去,這樣的話也能達到目的地,慢一分鐘沒問題,只要按時到就好,那麼快也不一定特別有作用,所以我覺得這是最可能讓我們這個技術更早落地,我們不會專門鑽牛角尖。載人車不是我們不做,技術一直在開發,在改進,數據一直在積累,有一天就可以進化到走那種複雜的路,但是在沒那麼成熟的情況下,我們也可以用在貨運上,而不是一定要等到有一天突然覺得技術特別成熟了才可以開始用起來。我覺得小車送貨,是先落地的,行業也逐漸意識到這一點。

《知識分子》:運貨的車是不是可以只靠視覺?

肖健雄:我們是以視覺為主,但是多感測器,裡面有激光雷達、毫米波雷達、GPS還有超聲波雷達,這些都有。

《知識分子》:這些是為了更安全一些?

肖健雄:對的,多層冗餘確保萬無一失。我們第一層是靠攝像頭,單靠攝像頭就可以走了,完全可以,沒問題。但是萬一出事呢?所以加了一個激光雷達,但是也不夠。萬一激光雷達也出錯了呢?我們就用超聲波雷達和毫米波雷達,多層冗餘。做一個安全性要求高的產品的心態是考慮最糟糕情況下行不行,而不只是能演示。所以現階段這種多層冗餘是必須的。以後隨著技術越來越好,可能越來越精簡,比如說我們大量運營的數據證明這個超聲波雷達從來沒被用到,再跑三年,也沒被用到,那我們下一款就省了超聲波雷達。一開始上來肯定是要過分的小心。安全第一,寧可過分的小心,確保萬無一失。

《知識分子》:送貨包括在公路上送貨?

肖健雄:對,但我們不做城際間的無人駕駛,因為城際間的無人駕駛更遙遠,落地會更遠。因為城際間大家會用大卡車,大卡車有兩個重大問題,一是特別重,一旦重慣性就大,一旦慣性大剎車距離就遠,也就是你要看很遠,精確判斷,要不然太近,反應過來的時候已經剎不住了;二是大卡車一旦出事就是大事,災難性後果,比如在加州到現在還不讓無人駕駛的大卡車測試,法律也會有巨大的障礙。

《知識分子》:但有的公司專註大卡車送貨?

肖健雄:有,我覺得這個肯定早晚會做得通,問題是做多少年才能通。我認為短期內港口可以,但是真上大馬路、高速公路上,很難有一個全無人駕駛的大卡車。我自己開車,看到一個有人駕駛的大卡車都要趕緊躲遠遠的,你搞個無人的,壓力更大。我覺得這個肯定是比較遠的未來。


3 無人送貨車會來得更快更猛烈些

《知識分子》:初創公司無論在任何技術潮流當中要戰勝大的公司必然有一些特別的優勢,你覺得AutoX主要的優勢在哪裡?

肖健雄:我覺得我們選了一條不會有很大巨頭的路。你看中美市場,我覺得中國市場的無人駕駛會比美國慢很多,為什麼呢?中國路複雜,這個沒辦法,AI要求更高,對技術要求更高。大家肯定會努力,無數個公司,包括我們公司肯定都會努力。但是人類的科學水平就是這麼高,沒辦法,不可能要求在此時此刻就突然有了重大突破。第二,中國的人力成本非常便宜,無人駕駛需要使用感測器、電腦和線控系統,算半天比人還貴,大家就不想用。美國沒這兩個問題,美國有很多地方的路都是非常簡單,地廣人稀。美國的人特別貴,工資高,感測器不用降到太便宜,已經比人便宜了。所以,我覺得無人駕駛的爆發點肯定會在美國先開始,再在中國開始。中國北上廣深這種路太複雜了,而且有大量的二三線城市和農村人口進入這些大城市去當司機,這個成本實在是很難算過來。但是中國市場非常大,未來的前景是非常好的。所以除了美國市場的布局以外,我們也在中國設立了辦公室,準備長期深耕打硬仗,做好一切準備就緒只欠東風,等到最後中國爆發點的到來。

《知識分子》:主要的賽道是怎樣的?

肖健雄:有一些偏小眾的賽道,特殊應用場景,像掃地機、港口這些都可以做,但是這個市場很小,成為小公司可以,但是很難成為大公司。大的市場主要有三條賽道,一個是載人計程車,一個是我們這種本地送貨車,另外一個是長途無人大卡車。無人大卡車技術最難,在美國方面也是最慢的。

除了技術不成熟,載人計程車的另一個壞處就是巨頭眾多,有Waymo、Cruise、Uber,跟他們PK,就是螞蟻戰大象:大象跑著跑著,還沒看到螞蟻宣戰,螞蟻就被大象不小心給踩死了。巨頭的優勢還不僅僅是技術,還包括資金、生態、人力、品牌一系列的。我覺得這些都是很難克服的,所以我們公司是比較巧妙地選擇不跟他們正面競爭的一條道路。這也有一個好處,因為他們在打硬仗攻克無人計程車的過程中,留給了我們一個時間窗口,比如說他們用十年時間終於攻克技術和商業,整個美國都全部有了無人駕駛計程車,那我們就有十年時間。無人計程車這個問題本身很難,會消耗他們大量精力,所以他們沒空來搶我們的地盤。我們有十年的時間可以讓自己成長的很強大,十年後他們肯定會看中我們這塊地盤,我們也會打他們那塊地盤。載人計程車我們也做,不是不做,我們通過送貨車,積累大量的數據,通過自己的業務賺到大量的資金和建立自己的品牌,然後再回到無人計程車上跟巨頭們一決高低。

《知識分子》:你們跟一些車企合作或者一些晶元公司合作嗎?

肖健雄:我們跟這些公司都合作。我們公司是有所為,有所不為。你看我們做很多東西,但其實我們不是沒事幹自己偏要做那麼多東西,而是什麼東西買不到我們做什麼,買得到就通通拿來主義,又快又好。我們做整體系統的集成,如果別人有一個激光雷達,我們就用它的激光雷達,別人有攝像頭就用它的攝像頭,別人有晶元我們用它的晶元,我們跟這些公司都保持著非常良好的關係。別人的公司有個車很好用,我們也用。但是有時候反而是他們沒辦法提供給我們一些我們需要的東西,包括我們公司自己開發我們的載貨車線控系統也是這樣。無人駕駛需要線控系統能用電腦控制方向盤,油門剎車,但是很多汽車廠沒這個能力,我們只能自己開發這個能力,跟他們合作把這個車做出來。

《知識分子》:你覺得在自動駕駛人才這方面有沒有缺口?

肖健雄:我們不只是有某個單一方面的人才,我們有一系列的人才。我們有感知的人才,有規劃、決策、系統人才,有軟硬體的人才,硬體包括機械工程師、電子工程師,因為我們做產品化已經很成熟了,所以我們最基本的鏈條已經形成閉環。所以我們公司人雖然多,但是每個人都會有所側重,都是公司重要的一份子。

《知識分子》:有點不可想像,因為你們成立時間也不太長。

肖健雄:對的。但是我們非常專註,所以跑得很快,我們是奔著做一款真的產品出來的,來進行統籌規劃。我們做大量的技術研發,所以我們也有大量的演算法人員,發揮我們的強項,在演算法上突破;我們也有大量工程能力特彆強的工程師,來自谷歌、蘋果、臉書和車廠等等做過大型系統的,做好軟體和硬體架構設計。出於保護原創技術,我們不是經常出來說我們的技術,但是向一些同行在技術上做了一些宣傳,適當地透露一些我們可以透露的技術,包括我剛才在演講中,也首次披露了我們的三維模擬器。當然我們還有很多不可以透露的,比較機密的技術。

《知識分子》:你們現在可以披露的獨特技術有哪些?

肖健雄:第一是攝像頭的感知,這方面之前有很多媒體的報道,因為我就是做這個出身的,所以做了大量的研發,包括雙目攝像頭、目標檢測、實時分割、從圖片就可以估計出物體三維的框,這些都是可以的。

第二項是大規模地圖的建立。我們給大家看的視頻裡面都是區狀的,每個區域裡面的大街小巷都有,全部掃描起來,這是多感測器融合,融合了攝像頭、激光雷達、GPS、IMU,還有車的速度這些全部集成在一起做出這個大規模的地圖,這是一個很強的能力。這個是很多公司沒有的能力,因為我們現在要運營的都是區狀的任何兩點的自動駕駛運營,所以我們需要這種技術,這是我們比較領先、領跑的。

我覺得世界上擁有這個技術的公司不是很多。Waymo和Cruise是肯定有的,其它公司都是只有一兩條線,百度稍微有小片區域。很多初創公司還是一個圈的地圖而已,只能跑一個圈。我們還融合激光雷達和攝像頭,所以我們的高清地圖都是有顏色,很多公司的高清地圖都是純激光雷達的,沒有攝像頭,所以你看它的地圖沒有顏色的,只有反射率,是黑白的。

第三是三維模擬器,這也是比較重大的一個開發,這已經突破了谷歌跟百度的水平。我們從零開始搭建,自研了一個三維模擬器,跟我們的自動駕駛系統大量集成,這也是非常重要的。市面上有些公司可能在賣三維模擬器,其實沒法用,因為它從來沒有真的和自動駕駛系統連在一起用,當然開發三維模擬器的人員也不知道自動駕駛公司需要什麼,所以做的也不是特別好。我們在模擬器裡面是多感測器可以模擬出車在開的時候攝像頭能看到什麼,可以模擬出激光雷達能看到什麼。我們一系列全部測試都可以在三維模擬裡面進行,就在車上路之前就已經知道這個版本做的多好,多安全。可以在模擬器里做大量的測試。

第四是軟硬體一體化設計的能力,包括計算平台的冗餘設計和線控系統。

《知識分子》:你們也在路測?

肖健雄:當然,我們有大量的車在實際路測,我們路測比誰都勤快,比很多其它初創公司車多,我們在美國比百度車還多。

《知識分子》:大部分人,還是很關心怎麼樣從天天開車當中解脫出來,即使美國在什麼時間點有可能會看到大量的運營?

肖健雄:在美國一些小區域實現無人計程車的落地,在2021年可能Waymo可以達到。不是全部城市,少數一兩個城市,可以真的無人駕駛。我覺得某些廠商說可以做得比這個快的,我覺得都是不科學的,除非是特定場景。在中國,可能需要更長的時間,但是勢不可擋。無人車即將落地,但是最先的,可能不是大家想的那樣做無人計程車,反而是無人送貨車會來得更快更猛烈些。

製版編輯 | 黃玉瑩

本頁刊發內容未經書面許可禁止轉載及使用

公眾號、報刊等轉載請聯繫授權

copyright@zhishifenzi.com

知識分子為更好的智趣生活 ID:The-Intellectual

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 知識分子 的精彩文章:

關注世界盃:「這不公平!」有了視頻助理裁判,你還會這麼怒吼嗎?
蘋果中國員工涉嫌竊密被捕;可以口服的胰島素

TAG:知識分子 |