當前位置:
首頁 > 科技 > 吳甘沙:什麼是真正的無人駕駛

吳甘沙:什麼是真正的無人駕駛

吳甘沙:什麼是真正的無人駕駛



圖解谷歌第三代無人車

無人駕駛的第一步是輔助駕駛或半自動駕駛,特斯拉的autopilot即是此類;第二步是高度自動駕駛,在大街小巷多數場景下可以自動駕駛,還能支持多輛車的編隊行駛;最後是全自動駕駛或無人駕駛,完全由人工智慧來駕駛,可以把方向盤、油門和剎車拿掉。在無人駕駛上谷歌是個中翹楚,技術遙遙領先


吳甘沙


自動駕駛是個籠統的概念,往往各種混雜說法見諸報章。在搜索引擎上,你會看到諸如「長安汽車完成長距離無人駕駛首試」、「特斯拉無人駕駛出事!還敢放心交給它嗎?」、「樂視無人駕駛超級汽車亮相」這樣的報道,顯然混淆了概念。


我們在這裡一一正本清源。首先一個大概念是智能駕駛,在駕駛的智能方面有駕駛輔助(driving assistance)和自動駕駛。駕駛輔助還是人開,智能體現在對環境的感知、並適時預警(比如車道線偏離和前車碰撞預警)。

從駕駛輔助到自動駕駛是很大的飛躍。自動駕駛在感知之外,加上了規劃/決策和控制。駕駛輔助的感知強調低誤報(誤報多人們就不用了)、低頻觸發,人是最終的決策者,所以駕駛輔助出錯無傷大雅。自動駕駛的感知有極高的要求,因為把一段時間的控制權完全交與了機器,不僅要求低誤報(不然莫名其妙的剎車不但煩人,在高速上很危險),而且要求零漏報,漏一次就是交通事故。


自動駕駛常常有三種不同的形態:


首先輔助駕駛或半自動駕駛,特斯拉的autopilot即是此類。在某些場景下汽車可以進入自動駕駛,比如自動的緊急剎車,在封閉、結構化道路上的自適應巡航和車道保持,還有自動泊車。必須注意的是,這類技術有較大的局限性,特斯拉近日的多起事故都是出現在十字路口、入口/出口和雙向路,這超出了autopilot的處理能力。


下一步是高度自動駕駛,在大街小巷多數場景下可以自動駕駛,還能支持多輛車的編隊行駛。這類技術的環境感知和駕駛認知能力得到了極大提升,不僅僅能處理上述autopilot不會的路況,甚至能在完全沒有車道線的非結構化道路暢行。高度自動駕駛汽車還能在複雜路況下與其他智能車輛或人駕駛的車輛共享或競爭路權。


最後是全自動駕駛或無人駕駛,完全由人工智慧來駕駛,可以把方向盤、油門和剎車拿掉。

未來5年,傳統車廠和零部件供應商的主要努力方向是第一、第二類自動駕駛,這並不是以拿掉駕駛員為目的的,而是讓駕駛員更加安全和舒適。顯然這是更穩妥的漸進道路。


而一些人直接選擇了無人駕駛作為切入點,同樣劍指2020年。他們認為前兩種自動駕駛是危險的,因為機器失效時、突現危機的電光石火中駕駛員不一定能立刻進入狀態、做出清醒的決策。所以終極的辦法是「消滅「駕駛員。這樣的車是真正為出行者設計的,小孩、老人、寵物、殘疾人都能夠開車,出行的權利極大釋放。傳統車主要賣給消費者,而這類車則是面向運營,好處是運營者可以限制它的運行區域和應用場景,利用區域內的高精度地圖,可以布置增強的環境支持(比如GPS地基增強),並且限制速度。


在無人駕駛上谷歌是個中翹楚,技術遙遙領先。即使這樣,谷歌還是把這類車的速度限制在25英里/小時(或40公里/小時,提升到35英里/小時的實現難度可能要增加1倍),在城區場景下,這個速度不是大問題,很多大城市的平均通行速度只有20-30公里/小時。


谷歌的第一輛無人車是基於混電車Prius改的,頂上裝著64線激光雷達,他們以此來建立高解析度的三維環境模型,或高精度地圖。為了建圖,車往往到晚上開出來掃街,因為這時候路上比較清靜不易被發現(有人發現了也誤以為是街景車),而路面上臨時的車輛和其他物體也比較少。


谷歌的第二代無人駕駛車卻是來自一個創業公司510 SYSTEMS,其核心Anthony Levandowski是加州大學伯克利分校的,並非出自無人駕駛車三強(卡耐基梅隴、斯坦福和麻省理工),但做的東西非常棒,於是谷歌悄悄把這家公司買下來,並且在其基礎上發展出了基於豐田Lexus的平台,一直到現在Lexus仍然是谷歌車隊的主流車型,常在路上行駛的有20多輛。

谷歌的第三代無人駕駛車是真正的躍遷,這款車是完全從頭設計的,長得萌怪,有點像樹袋熊。谷歌在設計上做了很多思考,比如移除了雨刷,因為並不需要有駕駛員在雨中看清路況。按照設計,這種車是沒有方向盤的,但由於加州法律的限制,車裡還是有個遊戲操縱桿作為方向盤。谷歌目前已經有30多輛這種車在路上跑,同時還在大量製造。


谷歌的60多輛車已經行駛了200多萬英里,然而在實用上面臨一定的問題:一是激光雷達等感測器太過昂貴,二來區區200多萬英里不能證明無人駕駛足夠安全或比人更好,因為在美國人的駕駛水準是9000萬英里才死一個人。


另一條路線逐漸成為主流,他們從駕駛輔助和輔助駕駛開始,死磕以視覺為主的低價方案,試圖實現快速商業化。其中翹楚是Mobileye和特斯拉,Mobileye的駕駛輔助系統已經在1000多萬輛車上安裝,而特斯拉的autopilot在短短7個月間積累了1.3億英里的自動駕駛里程。


Mobileye從車道線、車輛檢測到行人檢測,從演算法到晶元,從後裝的駕駛輔助產品到幾百款車型的前裝,從駕駛輔助到輔助駕駛,把單目攝像頭加傳統計算機視覺的技術路線發展到了極致。

但這並沒有阻止業界在更廣領域的探索。基於多目攝像頭的立體視覺,在很多場景下展示出優於單目的感知能力。而在演算法上,基於深度學習的汽車視覺演算法展現了更強的適應能力,並一定程度上削弱了Mobileye的先發優勢。


Mobileye基於10多年的經驗和1000萬英里的數據,精心設計了分辨車道線和道路目標的識別特徵,比如巡航時前面汽車的特徵包括車身下的陰影,對稱的方形後部,對稱的車燈等。但這種方法不能保證從其他角度識別各種形狀的汽車,事實上特斯拉的致命車禍中,車上安裝的Mobileye攝像頭未能認出拖車的橫側面。


在大數據的支持下,深度學習強大的自我特徵學習能力超越了多年的人工特徵工程。人們發現,傳統的計算機視覺演算法不能趕上高度自動駕駛的需求,在更複雜的路況中(比如不同角度的汽車識別、完全看不見車道線的非結構化道路),深度學習成為唯一的選擇。很多後來者,包括筆者所在的馭勢科技,迅速把深度學習應用到汽車感知。當然,Mobileye並沒有故步自封,也開始了基於深度學習的探索。


視覺不僅僅是感知的重器,它提供了建立自動駕駛地圖的另一種思路。前面講到,谷歌堅持用激光雷達建立高精度三維地圖——稠密點雲表徵的三維世界,並且通過實時的點雲匹配來判斷當前位置,但它的問題是:數據量大,每公里需要幾個GB的數據,無法把全世界裝在硬碟里,目前的網路條件也無法實時下載和更新;另一方面,每輛自動駕駛車都必須裝昂貴的激光雷達,這推遲了自動駕駛的普及。


於是業界開始探索新的思路。傳統地圖廠商,如HERE、TomTom和四維,尋求在現有地圖上進一步提高解析度,增加更豐富的路面語義信息(地標、交通信號、車道、坡度和曲率)。一方面地圖測繪需要高端感測器(如激光雷達),測繪完對大量數據做離線處理,變成很小的矢量地圖,汽車可以實時下載,另一方面定位時則只需要較低端的感測器。圖商和車廠仍需進一步合作驗證這樣的地圖是否適合自動駕駛。


Mobileye以及筆者所在的馭勢科技都不約而同地採用視覺地圖,因為攝像頭每輛車都有,從視覺中提取的地圖又特別小,適合實時上傳、通過眾包的方式更新。事實上基於視覺的定位更接近人的工作方式。我們根據道路上的標誌來評估大致的位置,並且根據路麵線條的變化做實時的決策(是選哪一條車道,是否上匝道等)。那麼,只需從視覺中提取出那些標誌和線條,眾包上傳到地圖(每公里只需10KB級別的數據),而行駛時可以通過視覺匹配來獲得定位。


在視覺狂飆猛進的同時,其他的技術也在飛速發展。比如視覺加雷達的多感測器融合,在很多場合下能夠獲得更好的感知能力。視覺的優勢是解析度高,含豐富語義,但缺點是受天氣和光照影響;毫米波雷達只能跟蹤對象,而無法獲知其大小形狀,但受環境影響小。兩者的融合已經成為目前輔助駕駛的標配,特斯拉的autopilot即是如此(它還有短距離的超聲波雷達)。


值得一提的是,特斯拉的致死事故中縱然有Mobileye視覺未能認出拖車橫側面的緣故,也有雷達識別失誤的問題。雷達安裝較低,垂直掃描角度小,只能在較遠的距離看到拖車(拖車底盤高,所以近距離時不能掃描到),在這起事故中拖車被認成龍門或橫跨馬路的交通標誌。目前,各個感測器通常只能在各自識別完成後做融合,這時候的融合邏輯變得非常困難,因此,多感測器的底層、深層融合非常值得探索。我們已經看到雷達和攝像頭的合體RACAM,以及激光雷達和攝像頭的混血版。


當然固態激光雷達的異軍突起將改變感知技術的格局。傳統的機械激光雷達要做每秒5-15轉的360度掃描,機械馬達做到足夠可靠、激光發射和接受做到足夠精準是非常昂貴的。固態激光雷達通過半導體技術,比如MEMS鏡子或相控陣的光學干涉,實現了電子掃描。半導體受益於摩爾定律,可以迅速降低成本。未來5年我們可望看到100-500美金的激光雷達產品。


除了感知,在規劃和控制這塊我們也看到了長足的發展。傳統的規劃考慮安全和舒適性,而現在把競爭性也放入了考量。自動駕駛的車輛如何去預測行人和其他車輛的動機和動作?如何激進地併線來獲得路權?谷歌和Mobileye等都在開始嘗試新的演算法,比如採用強化學習和遞歸神經網路。必須指出,機器學習和專家知識是可以互補的。谷歌年初發生了自動駕駛車撞上大巴的事故,如果在規劃中融入對大巴駕駛員判斷的經驗知識可能可以規避。


另一些勇於吃螃蟹的人試圖用深度學習的端到端學習,來整個解決感知-規劃-控制的一攬子問題。視覺圖像作為輸入,經過神經網路,控制信號直接出來。這個思路早在深度學習出來之前就由Yann Lecun試過,並不成功,而近年來深度學習的發展讓業界對其又重燃希望(AlphaGo不就是把故紙堆里的Q Learning和深度學習嫁接,取得巨大成功嗎?)。英偉達在從感知到控制的端到端自我學習上做出了有益的嘗試,谷歌傳言也在探索這一方向,黑客George Hotz用2000行代碼實現的原型也被奉為傳奇,但筆者判斷真正實用尚需時日,在規劃和控制上有限數據樣本的統計學習還不足於取代人類的經驗知識。

吳甘沙:什麼是真正的無人駕駛 點擊播放 GIF/240K



狀如樹袋熊的谷歌第三代無人車


作者:吳甘沙,為馭勢科技聯合創始人,英特爾中國研究院前院長


請您繼續閱讀更多來自 九天攬月 的精彩文章:

無人機的最新打開方式,你跟上套路了嗎?
作為世界首富,他和雞較什麼勁?
《VR將顛覆應試教育》,2016浙江高考零分作文出爐!

TAG:九天攬月 |

您可能感興趣

李彥宏坐的無人駕駛汽車是什麼樣子的?
無人駕駛、無人零售,難道真的是胡扯嗎?
李彥宏談無人車違章原因:是人操作,不是無人駕駛的錯
無人駕駛算什麼?這才是真正的黑科技,會飛的汽車你見過么?
真正的無人駕駛汽車離我們還太遠
你真的了解「無人駕駛」嗎?
傳戴姆勒正與滴滴談合作:或為無人駕駛
「激光雷達」PK「攝像頭」,誰是無人駕駛的王道?這裡為你解惑
無人駕駛真的要來了?
李彥宏騷氣秀無人車惹爭議,但無人駕駛真的來了!
為什麼說駕駛無人機是軍隊里最不好乾的工作?
真愛鬧!特斯拉無人駕駛出行路人被嚇傻
為什麼印度禁止無人駕駛?真相在這裡
別說無人駕駛車了,無人駕駛的飛機都要來啦!
可別被嚇到了,無人駕駛的「幽靈船」正在向你駛來
英特爾:人們對無人駕駛汽車的安全性依然不放心
麥肯錫:自動駕駛汽車技術,何時能真正實現?
關於「管理駕駛艙」,你想知道的都在這裡!
無人駕駛汽車普及有障礙:它的眼睛為何那麼貴