當前位置:
首頁 > 新聞 > 「AI好青年」肖健雄:榨乾攝像頭性能,漸進式實現自動駕駛

「AI好青年」肖健雄:榨乾攝像頭性能,漸進式實現自動駕駛

「AI好青年」肖健雄:榨乾攝像頭性能,漸進式實現自動駕駛

「如何看待肖健雄離開普林斯頓大學去創業?」答案不言而喻,「學而優則商」已是計算機視覺圈(或泛人工智慧圈)習以為常的事情。

因此有人總結學術界大牛從商之路的三種選擇:一是教授被工業界挖走,帶領各個大公司的研究院;二是有著極強技術背景的學生在畢業後或經過短暫的職業生涯後聯合幾個志同道合的同學(或朋友)共同創業;三是教授從高校離職,創立自己的公司。

毫無疑問,肖健雄屬於第三條路徑。

X 教授創立 AutoX

肖健雄是 MIT 人工智慧實驗室的博士。創業前,他是學術圈裡的明星人物,周圍的朋友和同事喜歡稱他為 Professor X(「X 教授」)。

在學生時代,肖健雄曾先後獲得包括 ECCV(歐洲計算機視覺會議)、Google Research 在內的最佳論文獎等。2013 年從 MIT 畢業後,他在普林斯頓大學計算機系擔任助理教授,後創辦了普林斯頓大學計算機視覺和機器人實驗室(Computer vision and robotics lab)。

在他的個人網站上,肖健雄是這樣介紹自己的:在計算機視覺,自動駕駛和機器人技術方面有十多年的研究和工程經驗,也是 3D 深度學習、RGB-D 識別和地圖、大數據、機器人深度學習等領域的先鋒。

有了這樣的背景,又是華人創業者,這讓他很快成為駐紮在矽谷的中國資本追捧的對象。

去年 6 月,當他離開普林斯頓大學決定要去創業時,外界便好奇:「X 教授」會創立一個什麼樣的公司?「教授創業一定緊密紮根自己的學術成果。所以我想健雄老師公司的關鍵詞也多半和 Deep Learning(深度學習)、Vision (尤其是 3D vision) 緊緊相關。」曾有人這樣猜測。

最終,肖健雄創辦的 AutoX 向外界揭曉謎題——這是一家為自動駕駛汽車提供軟體(包括感知、決策和控制)解決方案的科技公司。

憑藉在學術界的名聲,肖健雄目前已為 Auto X 招來 20 餘人,他們大部分來自美國頂尖高校:MIT、斯坦福大學、伯克利,並曾經在微軟、Facebook、蘋果、Magicleap 以及本田有過工作經驗。

「自動駕駛並不是奢侈的」

「為什麼是(選擇)自動駕駛?」今年 5 月,在 TiEcon 2017 上,肖健雄在演講上回答了這一問題。

他說,自動駕駛是一個「讓人興奮的領域」。回顧過去幾十年在科技領域發生的變革,從個人電腦、互聯網再到智能手機,幾乎改變了每個人的生活。而未來三十年能改變每個人生活的將會是自動駕駛汽車。

更讓他「超級興奮」的是,自動駕駛是他所擅長領域(計算機視覺和機器人)的大規模應用。

在自動駕駛的生態系統中,參與者有汽車廠商、Tier1、晶元公司、出行服務公司等等,肖健雄指出,要將自動駕駛生態打通,需要一個非常好的 AI 軟體平台——這是 AutoX 可以施展拳腳的地方。

在自動駕駛的世界裡,特斯拉是為數不多使用基於攝像頭的方法來實現全自動駕駛的公司。在特斯拉第二代 AutoPilot 硬體上,特斯拉希望通過 8 個攝像、前向雷達、超聲波雷達和 GPS 數據來實現全自動駕駛。沒有激光雷達,這是特斯拉與主流自動駕駛公司最大的區別。

「AI好青年」肖健雄:榨乾攝像頭性能,漸進式實現自動駕駛

但 AutoX 選擇了一條比特斯拉更激進的方式。

今年 3 月,AutoX 拿到加州 DMV 頒發的自動駕駛路試牌照,隨後這家公司對外公布了一段在不同天氣下的自動駕駛路測視頻。

「AI好青年」肖健雄:榨乾攝像頭性能,漸進式實現自動駕駛

值得注意的是,這輛改造自林肯 MKZ 的原型車並沒有搭載諸如激光雷達、毫米波雷達、超聲波雷達、差分 GPS 等感測器,取而代之的是總成本不到 500 美金的 7 個攝像頭——這相當於一台智能手機的價格。

肖健雄想要解決的問題,正擊中自動駕駛領域痛點——造價高昂的感測器無法快速將科研成果商業化。其中一個例子是,在谷歌分拆出來的自動駕駛公司 Waymo 長達 10 年的研究中,最大的一個進展是將感測器價格降低由原來的 75000 美元降低到 7500 美元。

在 TiEcon 2017 上,肖健雄說:「AutoX 的使命是使自動駕駛技術平民化,自動駕駛並不是奢侈的,而是人人都能享受到的技術。」

「Make AI stronger,make software better」

攝像頭的好處是,即使是非常低端的攝像頭,依然有較高的解析度。攝像頭對物體的識別包括交通燈的識別非常清晰。當然,這一方案的最大優勢是硬體成本非常低並且易於集成。

但問題是,目前僅僅依靠純視覺方案可靠嗎?肖健雄答:「Make AI stronger,make software better.」(讓 AI 更強,讓軟體更好。)

聽完他在 TiEcon 的演講後,台下一位觀眾評價:AutoX Jianxiong Xiao has more faith in camera-based rather than sensor-based autonomous driving.(肖健雄對基於攝像頭而不是基於感測器的自動駕駛更有信心。)

作為新創公司,AutoX 目前的收集的數據還不夠多,不足以讓其系統做出更好的決策。未來,AutoX 希望打造一個自動駕駛車隊來收集更多數據並不斷完善這一解決方案。

今年 7 月,在 CVPR(國際計算機視覺與模式識別會議)的現場,雷鋒網與肖健雄博士聊了聊 AutoX 的新動向以及他關於自動駕駛的思考。以下是對話實錄(有刪減):

雷鋒網:介紹 AutoX 的最近情況,比如團隊規模、最近計劃。

肖健雄:最近增長到大概 20 多個人,增長速度可能沒有其他公司那麼快,我們喜歡把最好的人招進來。我們招人依舊是兩個標準:又紅又專,就是專業技能非常強大,又特別注重 Teamwork。

目前有一些計劃但不方便透露。我們可以說的是會在 2 年內將產品推向市場,讓用戶可以用到。

雷鋒網:AutoX 的方案是捨棄激光雷達、差分 GPS ,使用汽車前端的 7 個攝像頭,這樣成本也很低。但從安全性的角度說,你們是如何考慮的?如果只用攝像頭可以做到什麼樣水準的自動駕駛?遇到惡劣天氣、逆光等極端情況,如何應對?

肖健雄:我們從來沒有說要放棄安全性,但很多人就把安全性當成一個不努力做視覺的借口。

安全性並不是說物理世界信息不足,而在於軟體要足夠好。我覺得在理論上絕對可以靠 Camera 做到非常安全。只要有所投入,在這個領域花更多精力,跑出來的效果並不會差。

惡劣天氣和逆光主要靠提高演算法的魯棒性,提高數據級,當然相機也不能太差。基於這個前提,其他就是拼軟體了。

雷鋒網:你是否覺得視覺可以解決自動駕駛一切問題?

肖健雄:我覺得長遠來說,肯定可以解決自動駕駛一切問題,問題是這個時間我們是否有耐心等待,比如說花 10 年、20 年實現完全無人駕駛。

我們從來不排斥其他感測器,也不排斥其他技術,只是說專攻在相機上。我們的論點是:大家太小看相機了,導致沒有努力把它的功能提高。它還有很多油水可「榨」,只是大家沒有努力「榨」而已。

雷鋒網:你之前演講說要打造「自動駕駛大腦」,這個「大腦」是怎樣的?

肖健雄:自動駕駛大腦有點像操作系統,往大說,比如 Windows;往小說,比如 Linux Kernel 的核心代碼。

我們現在做的是最核心的 kernel,包括感知和決策兩個模塊。我們把 kernel 搭建好,然後在這個基礎上加上其他感測器、其他服務層。

雷鋒網:現在很多公司目標是做 Level 4 級別的自動駕駛技術,目標是非常遠大的,但離落地產業化很遠,你如何看待這一級自動駕駛的商業化問題?

肖健雄:我覺得大公司像谷歌可以這樣玩,因為它有足夠多的錢,但絕大部分的創業公司不行。初創公司每一到兩年需要融資,然後沒賺到一分錢,我覺得這是不健康的方式。

我一開始為什麼選擇 Camera ,因為激光雷達在將來 10 年後才可能很便宜,但兩到三年後可以便宜嗎?絕對便宜不了,沒那麼快的。

雷鋒網:你覺得在無人駕駛這個領域,創業者或後來者還能從中找到哪些機會?

肖健雄:我覺得要做得有特色,比如集中在 niche market(小眾市場)。沒有特色、大而全,就做 Level 5,十幾年後才賺到錢,我覺得基本沒有機會,也沒有辦法生存。

這與普通初創公司並不一樣,比如滴滴或 Uber,做一個 App、搭建一個伺服器就可以開始了,然後大家集中火力干 6 個月,短期內就能佔領市場,取得很好的成績。

但自動駕駛不是這樣的,即使我們集中火力干 6 個月,還是不能實現全自動駕駛。這不是錢可以解決的問題,而是需要更多技術積累。

所以我更看好漸進式的路徑,先輔助駕駛,然後再升級,我覺得這是有道理的。絕大部分汽車廠也是這樣,他們不會馬上就實現自動駕駛,消費者就能買上這樣一輛汽車。

雷鋒網:在自動駕駛領域,從 2009 年到 2017 年,你印象最深刻是什麼?

肖健雄:我覺得印象最深刻的就是大家觀念上的變化,以前自動駕駛覺得不可能實現,覺得不 work,只是純科學研究。大家對這一領域過於悲觀。

現在很多人覺得自動駕駛可能實現了,又過於樂觀。很多人包括像 Elon Musk、黃仁勛都覺得無人駕駛問題已經解決,我覺得他們想得太簡單。

無論是過於悲觀還是過於樂觀,這兩種方式都不正確。最好是理性看待:你要看到它確實很有前途,但又是一種漸進式的進化。

雷鋒網:AutoX 期待與什麼樣的公司合作?

肖健雄:我們對整個交通和移動出行都非常感興趣,合作夥伴主要有四種:

第一是汽車廠商。這是我們最想合作的夥伴,主流的主機廠可以讓我們的產品進入主流車型。一開始可能不是完全無人駕駛,而是輔助駕駛,可以是 L2、L2.5、L3,不同 Level(級別)的輔助駕駛。這是我們與其他自動駕駛公司的區別,我們更喜歡漸進式的模式——一軟體逐步升級、數據逐漸積累。

第二是與主機廠相關的 Tier1,通過與他們合作,我們聯合開發將軟體、硬體,然後銷售給主機廠,將它裝進主流車型。

第三是 Uber、滴滴這樣的出行公司。但這種模式的問題在於:要真正達到無人駕駛才能開始商業化。這個門檻會更高、周期會更長,可能要很多年後才會普及。

第四是物流公司,包括快遞、卡車等等,無人駕駛如果是載人,可能要求更高,載貨要求則會低一些。

雷鋒網:談一談你對參加 CVPR 的感觸。

肖健雄:現在這個領域真的引起了大家的關注。以前始我從事 CV 研究的時候,這算是一個冷門行業,根本沒什麼人關注,當時會議規模也很小。現在都四五千人,太誇張了。

CVPR 受到這麼大關注對我們這個領域的好處是,可以吸引到社會最傑出的人才進來,這對整個領域快速發展非常重要。

「AI好青年」肖健雄:榨乾攝像頭性能,漸進式實現自動駕駛

*在CVPR的Workshop上,從左至右:Fisher Yu、彭軍、肖健雄、倪凱、吳甘沙、侯曉迪 圖片來自馭勢CMO雨嘉

雷鋒網:今年 CVPR 很多自動駕駛相關的中國公司,比如滴滴、圖森、地平線、Momenta、AutoX 都在積极參与,這些公司或多或少都做著與深度學習相關的事情。你覺得深度學習給自動駕駛帶來什麼改變?

肖健雄:深度學習對自動駕駛、對 AI 領域的影響是巨大無比,不能小覷。

現在自動駕駛公司使用深度學習,已經成為常識。比如,我以前在普林斯頓教書,有兩個星期就是教深度學習,學生們學完後都懂了,然後他們各自去做自己的項目。

我覺得深度學習已經有一點像「你會不會使用電腦、使用 office。」所以在不久的將來我們不應該號稱「我是基於深度學習的公司」,這就好象說「我們是一家基於使用電腦的 IT 公司」一樣。

深度學習進展還是很快的,同時我覺得有一些進展不一定真正可以實用。

比如 GAN(生成式對抗網路,Generative Adversarial Networks),我覺得這在非人命相關的領域是十分有用的,但在自動駕駛上我會持保留態度。因為外界沒區分清楚這到底是純學術研究還是可以真正使用的技術。

現在很多技術還不完美,可能只是一個非常初級的想法,還需要更多時間才會演變得更好。比如 CV(計算機視覺),也是 20、30 年前有了初步的 idea,進化到現在才達到適用的水平。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

燒錢、跳票和生產地獄,Musk在特斯拉財報會議上說了這些
騰訊安全探索論壇(TSec): 全球前沿安全技術的首發地
機器學習如何「著陸」醫療行業?三位行業專家談關鍵四點
博創聯動陶偉:農業機器人難做在哪兒?
特斯拉悄悄在Model 3車內裝了一枚攝像頭,它到底用來幹嘛呢?

TAG:雷鋒網 |

您可能感興趣

夢想照進現實?自動駕駛漸行漸近
李彥宏:「最後一公里」自動駕駛更容易實現
安智汽車郭健:自動駕駛產業的腳踏實地與仰望星空
自動駕駛中感測器包的實現形式猜想
廣汽郭繼舜:主機廠為何要漸進式發展自動駕駛?
投資蜂擁發展超乎想像激進 完全自動駕駛5年內能照進中國現實?
自主品牌自動駕駛有望明年實現
自動駕駛的「演進之路」
明勢資本黃明明:牽手主機廠,自動駕駛下一步是構建實時動態數據閉環 | 自動駕駛這十年
就Uber自動駕駛汽車出事後感言,自動駕駛為何還不能在中國實現
蘋果新專利曝光!自動駕駛汽車將能實現自動無線充電
從商業模式出發的AliOS能否實現自動駕駛的彎道超車?
電影走進生活 寶馬實現摩托車自動駕駛
自動駕駛的未來趨勢
自動駕駛汽車為啥能夠自動駕駛?
「限定場景」的自動駕駛是自動駕駛嗎?
自動駕駛汽車什麼時候能實現?
張弛和自動駕駛 誰能《飛馳人生》?
最新研究,AI相機的小身板快運算,能讓自動駕駛汽車看得更遠更清!
波音推出的太陽能自動駕駛飛機終於要啟航了!