當前位置:
首頁 > 科技 > Vizum董霄劍:給機器一雙眼,2米內視覺誤差1毫米

Vizum董霄劍:給機器一雙眼,2米內視覺誤差1毫米

Xtecher【錯別字基金】溫馨提示:如果您在閱讀過程中發現錯別字,請在文章底部留下說明+聯繫方式,我們會立刻發給您5-88元隨機紅包一個,同樣的紅包會發給文末留言點贊最高者。

蕭伯納曾說過,你看見一樣東西就會問「為什麼」,而我會夢想那些還未出現的東西,並且問「為什麼不?」。

當為所有機器人裝上一雙眼睛的夢想呈現在董霄劍面前時,他問自己:為什麼不呢?

作者|安妮的盒子

編輯|小魚、甲小姐

微信公眾號ID|Xtecher

眼睛是心靈的窗戶,是人類獲取外部信息最重要的感覺器官。而董霄劍要做的事,是給機器人都裝上一雙智慧的眼睛,讓它們看懂這個世界。

於是他做出一個重要的決定——進軍人工智慧領域,專攻立體智能視覺。

原展訊通信首席科學家、偉景智能( Vizum)CEO董霄劍

2016年6月3日,董霄劍放棄令許多人羨慕的高薪、高管職位,全身心地投入到這項事業中去,創辦了專註研究和發展機器視覺的北京偉景智能科技有限公司(以下簡稱Vizum)。

走進董霄劍的辦公室,一本《圖像處理、分析與機器視覺》和其它的一些技術資料躺在他的辦公桌上。

「這裡面沒有我想要的答案。」董霄劍告訴Xtecher記者。

這是一個全新的挑戰,答案的確無處可尋,只有做出真正的創新才能獲得打開這扇「心靈之窗」的鑰匙。創業後的董霄劍已經做好絕不回頭的打算。

輕鬆的事情,都不叫創新

這位在展訊歷史上不多的、上上下下都稱之為「董博」的首席科學家總是喜歡看「大勢」,並且頭腦極其活躍,是個極致的思考者。

很多人都是通過「AlphaGo」知道的人工智慧,但董霄劍卻並非「隨大溜」。事實上,早在2011年,時任展訊通信首席科學家的董霄劍在考慮展訊技術發展計劃時就大膽提出:要大力發展人工智慧!而當時,他主要看好的就是人臉識別的巨大市場前景。

這在當時絕對算得上是一件非常超前的事了,那時很多人甚至要特別去搜索一下人工智慧為何物;還有的人則認為,在中國發展人工智慧是想都不敢想的事情。

董霄劍卻很堅定,他相信這是高科技公司早晚要去涉足的領域,且隨著各種演算法性能和晶元處理能力的提升,人工智慧一定會大放異彩。除此之外,他還開始思考人工智慧最應該解決什麼樣的問題。

他觀察到,現在行業內做視覺識別的,多半是從一個角度形成機器對物體的平面識別,可人類看到的事物一定是立體的,單從這一點來看,平面就註定無法讓物體擁有類人水平的視覺識別能力。

除此之外,如何在「看」世界後,讓機器真正「看懂」世界,這就要求視覺識別在基於感知層、認知層的層面上擁有進一步的「思考能力」,包括信息處理以及機器自我語言處理。想要讓未來的機器人理解和傳遞信息,必須從「教會」機器人「看懂」這個世界開始。

一個始終縈繞在董霄劍腦海中的問題,什麼樣的眼睛才能幫助機器人真正看清、看懂這個世界?

「首先它要是『一雙』才行,人類進化幾千年形成現在的器官形態,是一件很美妙的事情,也是大自然最為合理的構造,所以機器人的眼睛也應該是雙目/多目的。」董霄劍說,「並且它還應該是立體的、彩色的,且一定是高精度、可量化的。我們的智能視覺不僅是表面簡單的圖像分類,而是能智能地解決實際的應用問題。 」

顯然董霄劍要做的是核心的統一化的立體智能視覺技術和產品,是突破性的理論和產品創新。這樣的要求對技術和理論的挑戰非常大,傳統的應用於機器人的視覺技術可以簡單的概括為「有認知無立體,有立體無認知」。

長期從事通信晶元系統和演算法研究使他有著深厚的信號處理理論功底。他所具有的跨學科綜合理論技術——雷達信號處理+通信信號處理+圖像信號處理+晶元系統研究——使得Vizum能夠把各個領域的理論技術移花接木的應用到視覺計算領域從而巧妙破解了這些技術障礙和難題並展現出可持續提高的技術路線。

「事實上,在未來的『智能+物聯網+5G通信+晶元』的大潮中正好是我們大展身手的好機會。未來,我們會推出基於5G網路的具有智能感知和認知的物聯網晶元,而機器的增強感知就從我們的智能眼開始。」

董霄劍所帶領的團隊不僅在智能圖像處理領域擁有深厚的理論基礎,而且在立體視覺、物體識別、深度學習的融合應用上也擁有深厚的技術積累,加上他本人快速研發和實現產品化的能力,Vizum很快得到業界和資本的關注。

2017年5月22日,Vizum完成來自產業領軍方的5000萬元人民幣A輪融資,這是Vizum繼2016年底完成來自恆坤睿金、將門創投的數千萬級天使輪投資後,在半年的時間裡完成的第二次融資。

別站在人群中,要站在跑道上

碩士畢業的第一年,董霄劍就已經成為百萬富翁。

那是1992年,最火的科技產品當屬腰間的尋呼機。和其他琢磨著如何攢下在當時不菲的一筆錢來買一台尋呼機的同齡人不同,雷達信號處理專業出身的董霄劍已自己動手做起尋呼機系統。

當時尋呼機的編碼卡都是國外設計和生產,技術被卡著脖子,價格當然由別人定,成本百來塊的東西,國外產品的售價可以賣到3萬5千塊。

那一年,董霄劍就成為國際一線廠商在尋呼這塊業務上的最大勁敵。他敏銳感覺到這個市場機會,並用了五個月的時間,自己親手焊板子、寫代碼,硬是把尋呼機編碼卡給做出來了,售價只有5000塊,價格是進口產品的零頭。由他創辦的尋呼公司所開發的編碼卡和尋呼軟體在華東地區的市場佔有率一度高達30%。

一個好玩的段子至今讓董霄劍記憶猶新。」他喜歡打籃球,當時很少人有手機,總是湊不齊人一起打球,於是他乾脆給幾個朋友各送了一台尋呼機,從此再也不愁打球湊不齊人了!」

四年後,拿到人生第一桶金的董霄劍面對許多機會和選擇,但他最終決定去東南大學攻讀無線電工程博士學位。總是著眼於大勢的他又一次預見了時代的發展方向——移動通訊。

面對躁動的一切,能夠放棄漫天飛的鈔票而選擇重返校園深造,這在許多人看來實在不可思議。他描述,20年前,「大哥大」還是奢侈品,「下海」經商的人極其活躍,我國的東南部率先富了起來,人們蠢蠢欲動,都希望抓住一夜暴富的機會。

「我始終覺得想要實現一個目標,必須全力以赴、心無旁貸。別站在人群中,要站在跑道上!在專業領域和最牛的人一起做事情。」

博士畢業後,董霄劍憑藉其深厚的技術積累、獨到的市場洞察力和對創新的不懈追求,在2006年受邀加入了展訊通訊,擔任全新的WD部門負責人,目標瞄準CMMB、WCDMA和WIMAX產品。

期間,他和他的團隊曾用2個月時間研發出適應廣電數字電視廣播標準的CMMB系統設計方案,是「從拿到標準到系統設計完成」業界最快的經典案例之一。這款產品不僅各方面都滿足行業高標準,也是市場上第一顆CMMB的SOC晶元,到CMMB晶元量產只用了10個月。

2009年,為了提高某款初期TD晶元在中移的外場測試中的通信性能,董霄劍帶領30個左右的上海工程師到北京,封閉式開發,從穿T-shirt的季節到穿棉襖的季節,最終實現了使用此晶元的手機系列的入網和成功入庫。憑藉在TD-SCDMA和CMMB項目開發上展現的技術實力和研發組織能力,董霄劍被任命為展訊通信首席科學家,獲得了展訊最高技術級別,也成為整個公司那時唯一一個達到這一技術級別的人。

也正是從2009年起,董霄劍開始負責展訊全新一代的TD-SCDMAEDGEGSM多模40nm晶元的系統演算法設計,這款晶元將展訊多模晶元產品的性能提升到一個新的高度,其通話穩定性和數據吞吐量都是行業第一,成為展訊歷史上的經典。而後,董霄劍又帶領的一個15人的演算法團隊從標準開始進行LTE產品的系統設計,最終完成LTE的MODEM演算法,軟硬體架構和射頻需求等設計。

在展訊時的「董博」

從業近20年,讓董霄劍成為移動通訊時代當之無愧的風雲人物,也讓他愈加深刻地感受到:將一個研究的理論變成真正的產品,其付出、努力和艱辛要遠遠大於單純的技術「點」的突破,這要求實踐者不僅擁有深厚的理論知識,而且還需要他們熟悉產品的研發過程。

這一次,他又站在了為所有機器人和移動設備裝上一雙類人的「眼睛」的賽道上,決意一搏。

最美好的願望,一定最瘋狂

人類文明的發展已經到了人工智慧時代,這是一個不以人的意志為轉移的時代。

在這樣一個產品化的時代,董霄劍認為,一個公司和一個研究機構在實現一個偉大的產品上應有著天然的不同——最明顯的是公司可以針對市場需求,系統地組織一項技術以及一個產品、吸收社會各種資源來做一件事情,而研究機構只需要一個技術點就可以了,在這點上,純研究機構不太可能成為偉大產品的創造者。

可身邊的人卻時常可以在如今的董霄劍身上看到一個在研究機構里搞研究的人的身影——他鑽研成像的原理,和自己的團隊討論計算機視覺技術,甚至探索起光的本質……

很多人認為,給所有機器人和移動設備裝上一雙類人的「眼睛」,讓他們能認知、理解外部世界,並最終實現真正的智能,這聽上去更像是一個不可能完成的願望,美好又瘋狂。

「就是要做別人想都不敢想的事。」董霄劍笑著說。

縱觀他的職業生涯,歷經三次大轉型,最讓人稱揚的是每次對時代發展脈絡的準確把握,從雷達到尋呼,從尋呼到手機,從手機到人工智慧,每一次新技術趨勢的到來,董霄劍都是這個領域積極活躍的前鋒。

能抓住機遇,發揮創新者的潛質、資質、能力,成為這個領域的弄潮兒,這讓他感到興奮。

如今,Vizum團隊核心成員皆來自國內外知名半導體公司,在手機基帶晶元、物聯網、智能硬體等領域有大量成功開發案例,參與量產的晶元總計近20款,涉及通信及多媒體,累計總銷量達數億片……

有了前沿的創新理論、豐富的工程經驗,加上團隊高效的執行力以及快速實現產品迭代的能力,成立半年的Vizum就在去年年底推出可市場化、應用性高的機器智能眼產品——ViEye。

ViEye可以完成3D數據獲取和物體識別,主要聚焦於與機器人配合的工業應用場景。它給機器人和設備提供的不是一種簡單的數據羅列和視覺圖像,而是一個在其自我認知基礎上「看到」的立體而豐富的世界,並能根據特定需求自主呈現高精度3D坐標及高精細度目標尺寸等量化信息,目前的產品2米內視覺誤差為1毫米。隨著認知能力和晶元集成度的不斷提高,ViEye的功能將不斷增強,機器人也會有越來越明亮和智慧的「眼睛」。

正如Vizum的預期,產業界對ViEye的反響極其強烈,「實際上,這是『機器換人』強大趨勢的一個側面反映和必然的現實」董霄劍說。

而在董霄劍心中,Vizum的產品還要挑戰更多。他告訴Xtecher,今年,ViEye產品應用功能將擴展至3D場景重建、3D人臉識別和智能認知,滿足移動避障、環境認知等應用的需求。

為了這個既瘋狂又美好的願望,他現在每天堅持快走,每周都會抽空去游泳。「我們正在追求的目標很遠大也極富挑戰。」董霄劍堅信Vizum將會成為一個偉大的機器智能公司,為此他必須保持精力充沛。「我的投資人對我只有一個要求,就是堅持運動。」

我是Xtecher特稿記者安妮的盒子,如果您有國內外科技行業新鮮資訊或獨到見解,歡迎與我聯繫。

(添加好友請註明公司、職位、事由)

━━━━━

封面設計:王思寧 排版:陳光 校對:米琪

━━━━━

Xtecher官網平台現開通認證作者,

(添加好友請註明公司、職位、事由)

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Xtecher 的精彩文章:

NVIDIA研發可不依賴GPS的視覺導航系統;生命奇點完成5000萬A輪融資
紐若思獲浙江資科600萬融資,做從前到後的睡眠診療方案
跨境醫療領跑者甘偉傑:哪怕只能幫助到一個人,我也要做
Uber CEO宣布無限期休假;庫克證實蘋果正開發自動駕駛系統
回顧:當人工智慧遇到視頻,會有怎樣的前景和未來

TAG:Xtecher |

您可能感興趣

據說能一眼看出這些視覺誤差的人,智力絕對超過160!
這是一則有味道的新聞:睡覺誤食AirPods 拉出來正常使用
穿錯衣服or視覺誤差?楊冪的胸居然墜到腰!
在視覺誤差中發現前進的路,眼瞎的人絕拿不到最高分
18歲母親出現幻覺誤把1歲女兒當成劫匪,將其刺死在床上
美研究人員正在利用VR幫助我們的眼睛避免在太空中的視覺誤差
眼力測試題:這些視覺誤差你能看出來幾個?你夠天才嗎?
O型腿者易被視覺誤解的那些事
讓大家有錯覺誤以為是藝術品的國際飛機場,超前衛
寶寶睡覺誤區
哄孩子睡覺誤區和正確做法,寶媽們你們做對了嗎?
孕期,准媽媽們的睡覺誤區有哪些,這兩種睡姿對孕婦胎兒都不好