他比蘋果還早研發出光學防抖,現在卻加入做「機器人眼睛」的創業大軍
雷鋒網【新智造】按:SLAM 技術最早被用於核潛艇的海底定位,近年來逐漸進入民用領域,尤其是掃地機器人在消費市場的推廣,使得SLAM作為機器視覺的解決方案,備受重視。基於三維視覺的 vSLAM 技術也被廣泛應用與機器人、VR、自動駕駛等智能設備上。本篇文章為雷鋒網新智造頻道 SLAM 專題的其中一篇,對初創企業遠形時空的報道,主要介紹了其用於智能設備的視覺感知感測器和配套的軟體解決方案,以及創始團隊對於市場、技術的看法。
雷鋒網正在啟動「新智造成長榜2017」評選活動,我們將對人工智慧與機器人行業進行大規模報道、梳理和調研,並聯合數十家著名投資機構根據這些創新公司的技術實力、商業能力和成長性進行深度評選,最終從多個領域分別選出一些極具潛力成長性的創新公司。如果你想參與我們的評選,可點擊「報名」鏈接,或通過郵箱xinzhizao@leiphone.com聯繫我們!
華中科大光電子專業畢業後,李昌檀先後在索尼、飛利浦、聯想等大廠里工作了十幾年,具體工作略有差別,但核心一直沒變,那就是圍繞「光電子」,做手機攝像頭的系統、硬體、底層軟體和集成。
在這個行當里,李昌檀取得了不少成績,比如在 iphone 還沒有光學防抖功能的時候,他做了中國第一款光學防抖手機,雖然由於各種原因,賣的並不好。十多年的研究,李昌檀希望自己能站在更高的維度上來看產品,他想知道用戶真實的需求是什麼,也想知道如何能做出有用的產品,但大廠分工細緻,層級嚴格,已經無法滿足他的需求。
於是,2014年李昌檀開始了第一次創業,作為初始團隊加入了一個 VR 公司 。這次創業最大的收穫,就是讓他結識了黃石生博士。黃石生畢業於清華大學計算機系,師從計算機圖形學領域的胡事民教授,在過去一直專註於圖像與視頻等媒體的研究,在圖形學與視覺領域的頂級學術會議(SIGGRAPH/SIGGRAPH Asia/TVCG)上,發表過四篇文章。
相識一年之後,李昌檀聯合黃博士,創辦遠形時空,開始了第二段創業生涯。李昌檀對雷鋒網新智造說:
我們要做一些有用的事情,技術門檻高,是一門手藝活,有很多坑,需要一個一個爬出來,不是模式的創新,也沒有很大的槓桿。
這個手藝活,就是基於視覺的 vSLAM 軟硬體解決方案。在李昌檀看來,原先做的手機,現在流行的VR、無人車、無人機等沒有本質的區別,都是用於人機交互的一個工具,底層技術是相通的。但有個區別在於,原先做相機,主要是讓人看,現在是要讓機器能夠看懂。
雷鋒網新智造了解到,SLAM 技術的全稱為 simultaneous localization and mapping ,即實時定位及地圖構建,SLAM 並不是一項新技術,國內外都有數十家公司在研究。黃石生介紹說,無論是定位還是地圖,分開做都不是難事,難點在於結合,同時要保證即時。
SLAM 不僅僅是一項技術,其實更是一個包含感測器和演算法實現的系統。在感測器方面,可以選擇的比較多,比如激光雷達、攝像機、視覺里程計、GPS等,主流的是激光雷達和攝像機。
有了感測器感知環境之外,還需要演算法實現,讓機器「看得見」。遠形時空選擇的解決方案是攝像頭+慣性導航+演算法。黃石生認為,這樣的解決方案,有以下幾個優勢:
小型化
雖然激光雷達精度可以達到毫米級,但在工程上無法小型化,尤其是旋轉式的激光雷達。從目前在自動駕駛領域的實現來看,都需要給激光雷達預留很大的空間,在 VR/AR 等小型設備上,幾乎沒有用武之地。
成本低
激光雷達成本相當高昂,旋轉式的激光雷達成本在8000-80000美元之間,固態雷達相對便宜不少,但相比攝像頭還是非常昂貴,這對於廠商來說,成本很高。
響應頻率高
激光雷達的響應頻率不如攝像頭,可以輕鬆達到50-60赫茲,慣性導航則更高,可以達到1000赫茲,這樣輸出信息時就非常快。
擴展性強
使用攝像頭的解決方案,除了用來實時定位構建地圖外,用戶還可以利用它擴展其他功能,比如人臉識別、手勢等其他視覺識別的功能。
特別就 VR 領域而言,現有的視覺解決方案都是由外而內的追蹤,比如通過 Lighthouse 和 Constellation 的高精度追蹤系統,而遠形時空提供的 SLAM 解決方案,則不需要配合,是一體化的解決方案。
但以攝像頭為主的解決方案採集到的信息量大,背後需要配套非常強大的演算法來進行處理。經過李昌檀和黃石生的努力,在雙目 SLAM 和單目 SLAM 兩方面,演算法和性能都有了非常大的提升。
在vSLAM學術研究方面,有很多優秀的工作,有的已經開源(例如ORBSLAM、LSD-SLAM、OKVIS、DSO、ORB-VIO、SVO等),為追求準確性這些方法往往採用計算強度很高的視覺優化(Bundle Adjustment),導致計算功耗很難降低,而純視覺的 SLAM 往往受光照條件、高速旋轉運動、抖動等等影響而產生不穩定,因此,這些方法在產品化在實際產品化過程中有較大難度。
遠形時空推出的雙目 SLAM 和單目 SLAM ,不僅僅依靠攝像頭,還輔助慣性感測器(即 Visual-Inertial SLAM),很大程度上克服了純視覺 SLAM 的缺點。另外,為提高穩定性和精度,遠形時空團隊在感測器硬體、慣性輔助的圖像特徵追蹤、丟失重定位等核心技術方面都做了優化,提高了 vSLAM 的穩定性和精度。
雙目 SLAM 表現
單目 SLAM 表現
遠形時空團隊推出的雙目 SLAM 和單目 SLAM 的精度均在厘米級,drift 小於1%,而計算功耗很小,比同類產品減小超過至少一半以上的計算量,最低時只是1/4左右。
在機器視覺領域,其實存在著眾多玩家,比如百度前日剛收購的矽谷公司 xPerception,其定位和業務範圍與遠形時空非常類似,國內還有格靈深瞳、速感科技、Human+、拓視覺等初創企業。面對競爭相對激烈的市場,李昌檀認為:
其實我們也看到一些比較優秀的創業團隊,我們覺得非常好,大家能夠一起教育市場,把這個市場做大。而且,暫時還沒有一個可以通吃產品,我們非常希望做一個能用在很多領域的產品,但實際上還不存在通用的解決方案。所以,無論競爭是否激烈,必須得在某一個細小的領域紮根下來,再拓展更容易一些。
目前,遠形時空基於這種解決方案,做出了一個嵌入式的硬體產品,並將首先在 VR 領域進行落地,國內外各有一家 VR 廠商已在洽談合作,預計在年內會有進一步消息。現在公司共有10人左右的技術團隊,已完成數百萬的天使輪融資,即將開始下一輪的融資計劃,大概千萬量級。新一輪融資將會用於產品量產、新品研發、團隊擴充三個方面。
※日本要在2020前完成高精度地圖採集,但你可知個中的戰略細節?
※亞馬遜組建團隊研發自動駕駛技術 旨在解決最後一英里的無人送貨
※699元米動健康手環發布 華米又給自己貼了一個標籤
※確認了AI作為自己的支柱後,亞馬遜雲服務如何贏得AI大戰的未來?
※大疆發布「飛行眼鏡」,讓你用頭部控制無人機
TAG:雷鋒網 |
※厲害,解放軍火箭發動機竟然是在廁所研發出來的!
※老外研發出防摔手機殼,再也不怕手機摔碎屏,太實用了
※日本大學研發出一款智能機械人,真實呈現了兒童表情
※來真的了!沙特發出最後通牒,大批戰機打頭陣,現場火光衝天
※戰士再也不用擔心半夜凍醒,我軍研發出新型多功能斗篷,禦寒神器
※研究人員開發出媲美蘋果人像光效的打光功能
※活著能發出美麗的熒光,撈上來還能做成美食,這魷魚的一生不虧
※中國發明了會飛的相機,也開發出超精確的火箭彈,卻不是導彈!
※這些星座潛力大,壓力下能爆發出強大的動力,事業發展比別人快!
※藍鯨不僅體型龐大,發出來的聲音比飛機都響,心臟猶如一輛汽車
※終於揚眉吐氣了!中國研發出最新型導彈,技術先進突防強悍
※科學家們發現鯊魚能夠激發出一種攻擊細菌的新型表皮
※美國陸戰女機械師,發出警示,你敢靠近,我就敢開槍,威風霸氣
※中國研發出新材料,真正做到光學隱身,站在面前也看不到
※神經科學家現在開發出一種電子眼植入物可以恢復失明小鼠的視力
※他是武器發明家,康熙年間就研發出機槍,只可惜沒被重用反被殺害
※心理學:學會這幾點,你也可以在舉手投足間散發出強大的氣場!
※有了矛盾,生命才能煥發出燦爛的光芒
※研發出來卻從不使用,中國空軍部隊中唯一一款特殊的戰鬥機
※到緊急關頭,這三大星座才會爆發出真實能量