當前位置:
首頁 > 最新 > 傳統視覺演算法VS人眼仿生,誰會勝出?這家公司「有料」

傳統視覺演算法VS人眼仿生,誰會勝出?這家公司「有料」

對於主機廠和消費者來說,自動駕駛最應該被關注的依然是安全問題。

Toramon CEO劉?表示,目前市場上多款搭載L2級輔助駕駛系統的車輛,包括特斯拉的自動輔助駕駛系統仍然存在諸多安全隱患。

例如,2020年6月深圳一輛特斯拉Model 3在開啟AutoPilot「自動輔助駕駛功能」時,對變道的、局部可見的大型貨車毫無反應,徑直撞了上去。

特斯拉2020年最新推出的全自動駕駛(FSD)中也存在頻繁的識別失誤,比如下面這些失誤在FSD測試者上傳的視頻中普遍存在。雖然沒有全部造成撞車事故,但如此高頻的識別錯誤率還是不禁令人擔心。

樓梯被識別成了卡車

這個不存在的車輛被誤識別,造成了一次自動剎車,車主上傳了這次事件

箭頭所指的車輛實際並不存在

這輛皮卡一直都沒能被檢測出來,幸好特斯拉車主在這裡右轉,而不是直行

針對識別的這類痛點,目前主流的視覺方案都是通過AI 數據的技術改進模式。這對增加樣本數量、提高安全性很重要,但由於長尾效應,即使在深度學習方面投入巨大,窮盡所有障礙物也是一件幾乎不可完成的任務。

包括特斯拉遇到的這些識別失敗在內的無數事實也證明,不管測試了多少億英里,駕駛的過程中總會出現一些系統沒有訓練過的異形物體,比如摩托車後面馱滿的各種形狀的貨物、從卡車上掉落的大木箱、皮卡拖著的遊艇等。

這意味著,在現有技術路線下,未知場景直接威脅到駕駛安全。

而作為一家視覺技術領域的創新公司——Toramon科技(中譯名為哆來目科技)從另一個視覺感知策略出發,過去五年一直專註於讓汽車實現人類一樣的判斷,為現在主流的視覺方案對未知場景進行兜底。

什麼是人眼仿生

從Toramon公開的實測視頻中可以看到,其視覺系統可以檢測到包括道路隔離墩、停在路邊侵佔車道的車輛以及沿各種方向移動的車輛和行人。

誰能料想到,如此先進的技術,所借鑒的理論竟來自上世紀70年代。

當年,美國一位名為大衛·李的博士在給空軍心理研究室做研究的過程中,發現了人類在駕駛過程中,雖然並不能準確判斷障礙物距,但卻可以在駕駛的過程準確地做出剎車的判斷,躲避障礙物。

原因是,人在遇到障礙物時進行剎車、轉彎的決策過程來源於身體感知到的車輛與障礙物碰撞所消耗的時間長短。

即,人的防碰撞的機制是來源於直覺,直覺背後是人體更深層次的生理機制在發揮作用。為此大衛·李發表了論文,闡述了自己的觀點和邏輯,在後續多年裡得到了駕駛安全業內的廣泛認可。

自動駕駛感知中,希望通過多種感測器,來感知車輛行駛的環境,模仿人類感官,以達到比肩甚至超越人類駕駛員的能力。但傳統計算機視覺感知的原理並沒有真正仿效人類駕駛員的視覺感知系統。

2013年, Toramon首席科學家在大衛李的理論基礎上,延伸並發明了「人眼仿生的人工智慧視覺技術」,模仿人眼對靠近物體的運動感知機理,用以識別物體的碰撞風險與碰撞時間。

該技術可通過攝像頭實時進行圖像採集,處理兩幀及以上的圖像複雜人工智慧演算法對圖像中的運動信息進行處理,檢測圖像特徵變化,分析圖像中物體運動軌跡變化,進行碰撞預測,高效計算並預測碰撞時間與地點,實現自動防撞。

同時可以監測正向、 側向以及橫向碰撞危險,其運動感知的核心是物體膨脹-碰撞時間的演算法,以及物體膨脹-碰撞點識別的演算法。

最重要的是,這種人眼仿生識別技術並不局限於靜止物體、已知或者未知障礙物,對所有可見障礙物都有效,也無需主流方案必備的深度學習神經網路。

人類在開車時多數無法判斷與前車的準確距離。如果路上突然有一個東西朝車飛過來,我們本能的反應是避開它,而不是看清楚是什麼,再剎車再打方向盤。因此人類視覺底層對碰撞的感知靠的是運動感知直覺,而不是測距和圖像識別。

由此,Toramon將上述理論構思實踐於自動駕駛中,通過人眼仿生,即用單目攝像頭 運動分析,在嵌入式系統上直接得到碰撞時間TTC,由二維分析構建三維場景。

而同樣是構建三維場景,以百度、Mobileye為代表的方案是採取AI 數據的方式,需要先將車輛間的距離測算出來,再配合自身的車速才可以計算出碰撞時間。

這就是為什麼Mobileye需要強調自己可以測多遠,精度是多少。因為這些數據對於它計算碰撞時間來說很重要。

而與百度等方案商在做的三維視覺方案不同,其構建的三維也並非XYZ時間距離軸,而是XYT。也就是將多數三維方案中使用的Z軸換為T軸,用來表示碰撞時間。無論從行為實驗還是數學推導上,科學家都證明了該方法是完全可以實現的。

簡單來說,Toramon的人眼仿生技術繞開了距離測量這一環節,通過攝像頭進行實時圖像採集,檢測圖像特徵變化以及圖像中物體運動軌跡的變化,進行碰撞預測,高效計算並預測碰撞時間與碰撞點,實現碰撞預警,繞過了測距就避免了經典圖像識別中的長尾問題。

解決FCW難點

值得一提的是,人眼仿生技術的優勢不僅限於此,其對攝像頭的要求並不高,沒有攝像頭同步的難題,嵌入式系統上就可以實現,相應的功耗也小。

最關鍵的是可以在一定程度上解決傳統計算機視覺中同時兼顧橫縱向視野的經典難題。

以目前最難提升性能的前向碰撞預警(FCW)為例,由於透視的原因,較遠一些的物體看起來都居於圖像中心區域,如果沒有車道線指引,很難區分前方物體是否在自身車輛的同一車道內。

目前眾多的前向碰撞預警(FCW)方案都依賴車道線來剔除旁邊車道上的物體可能造成的誤報。該方案很大的局限就是,如果旁側的車突然切入,或者在根本沒有車道線的十字交叉路口遇到從其他方向駛來的車輛,系統則無法判斷危險。

因此,車道線缺失的複雜場景對於自動駕駛系統來講是一個非常大的難關,目前業內的對策是採用高精地圖和激光雷達,但在落地方面依然困難重重。

但如果不能準確判斷物體相對於自車的橫向偏移量,那系統將不知道該物體會從自己身旁擦肩而過,還是會和自己相撞。

相對於目前的碰撞預警方案,Toramon的技術具有四大優勢:

1)檢測未知障礙物;

2)全方位碰撞預警(OCW)涵蓋並超越了前向碰撞預警(FCW)的範圍。OCW能檢測到攝像頭覆蓋範圍內的任何方向的碰撞危險,比如側向加塞換道、橫穿車輛、斜穿以及對面來車等;

3)識別車輛轉彎時遇到的靜止和移動障礙物等;

4)預防小重疊碰撞(small overlap),比如侵佔部分車道的臨時停車。

「仿生技術特殊在什麼地方?大繁至簡,用一個通用的辦法實現了更廣泛的碰撞預測包括未經訓練的障礙物。還有一個特色,叫精準的碰撞點預測。」 Toramon CEO 劉?強調,用我們的方案可以精確預測即將要撞到障礙物的哪個具體位置,而不是一個籠統的物體。

仿生技術解決了目前自動駕駛視覺感知方案面臨的諸多難題,為未知障礙物等場景提供兜底解決方案。

目前,Toramon已成功開發出量產級別的車規級ADAS產品,產品質量得到了國家客車質量監督檢驗中心出具的檢測認證報告。同時,產品已在重慶公交實際運營50萬公里以上。

此外,該公司已與某國內知名主機廠以及某日系知名車企完成了裝車驗證,並有望用在明年的量產車型上。

在方案服務方面,Toramon不僅可以提供商用車視覺感知終端,還可以為商業夥伴以IP核的方式提供授權,加快產品的商業化落地。

公司CEO劉?表示,Toramon正在著力於為主機廠提供低成本的、主動安全量產方案。同時,根據客戶「軟體定義汽車」的新模式需求,希望為客戶的域控制器提供獨特的自動駕駛仿生視覺感知核心IP和軟體模塊以及深度學習融合方案。

最終目的就是大大提高環境感知能力,為未知場景以及複雜環境提供兜底視覺解決方案,從而提高車輛行駛安全性,減少碰撞幾率。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!


請您繼續閱讀更多來自 高工智能汽車 的精彩文章:

L2+級智能駕駛需求爆發,供應商深度拆解技術鏈探尋最優解
汽車晶元「短缺」超出想像,或影響技術與規模的「競爭博弈」