當前位置:
首頁 > 最新 > 熊友軍:機器人將成為第三代人機交互入口

熊友軍:機器人將成為第三代人機交互入口

引言:人機交互模式經歷了從PC時代到移動互聯網時代的重大變革,下一場變革會以怎樣的形式出現?

優必選CTO熊友軍博士(中)和微納感知計算市場總監程剛(右)

「休息一下吧!」優必選CTO熊友軍對優必選即將於6月推出的新品機器人樣機發出這樣的語音指令,這個名為Alpha mini的虎頭虎腦的小機器人回答道:「好吧,是該休息一下了。」旋即做了個弓步,進入待機狀態。在此之前,熊友軍在距離mini幾米開外向他詢問了天氣,讓他播放了Micheal Jackson的Dangerous,在問到它「你知道我是誰嗎?」這個問題時,mini叉著腰晃了晃身體,說「我還不認識你的臉,走過來讓我看下哦」,憨態可掬的模樣徹底顛覆了大夥對機器人機械刻板的印象。

第三代人機交互會通過機器人來完成

「這台機器人我們不僅是希望把它作為一個機器人來打造,而是希望它能成為『第三代人機交互中心』的數據入口。」熊友軍指著Alpha Mini說。

對於人機交互的變革,熊友軍是這樣理解的:人機交互的方式經歷了幾次革命性的變化。最早的第一代是人和個人電腦的交互,我們必須坐在電腦前,要用到眼和手,而且人不能離開,一旦離開個人電腦就不發再實現繼續交互了,這是第一代的人機交互,有固定的位置和固定的交互模式,人要非常投入才能交互,這是以設備為中心的;第二代的交互方式就是現在移動互聯網的交互方式,也就是手機時代,我們通過觸摸屏在任何時間在任何地點都可以跟手機交互相對PC時代來說,這是一個很大的進步。

第三代的人機交互我們就希望通過機器人來完成。人跟機器人交互有很多種方式,是多模態的:首先,機器人跟我們是一種主動的交互方式,因為它是主動去收集數據的,我不用再去解鎖再去輸入密碼,所以就解放了雙手,現在我們其他的機器人產品已經實現了控制家電的功能,不用再去拿遙控器控制,所有指令都直接跟它說就完成了。機器人的一大優勢在於它有各種各樣的感測器,除了語音、視覺,它還有電子皮膚、觸覺等等,所以人跟機器人的交互方式就可以非常隨意和自然。

第二,因為它是一個機器人,人在跟它交互的時候會有一種天然的親近感,跟冷冰冰的音箱或手機相比,它能更好的滿足人的情感需求,因為交互是一個閉環,我給它輸入命令,它會有一些反饋的手段,音箱和手機的反饋手段是比較單一的,但是機器人的反饋手段多種多樣,這也就是我們所說的『多模態』。

還有一點是我們給機器人指令的輸入方式也是多種多樣的,除了語音、視覺、觸摸等方式,我們甚至可以不用刻意跟機器人說什麼,而它會主動的收集數據,比如說我們在聊天,機器人在旁邊就可以把我們的聊天的情況主動的收集起來,然後把這段視頻上傳到雲端,再通過後台的雲服務系統,通過語音轉寫,把我們說話的語音轉換成文字,甚至通過AI,把這些內容進行歸納總結整理,說不定你們一走出辦公室,一篇完整的紀要就完成了。」

智能語音作為基礎技術之一

支撐機器人成為第三代人機交互中心

「每一次人機交互的迭代都會帶來一個的萬億巨大產業。中國錯過了PC時代,趕上了移動互聯網時代,那麼在人工智慧時代我們希望中國能跑在前面,能佔據領先的優勢,這是我們努力在做的。所以我們希望能把第三代人機交互中心上下游產業鏈的技術的公司都能整合起來,真正能打造一個產業鏈。深圳在這方面有很大優勢,這個優勢就在於我們跟用戶很近,產業鏈很完整,有好的想法就能藉助深圳產業鏈的優勢把它落地成為一個很好的產品。」

運動控制一直是優必選的核心技術,但是要完成機器人的多模態交互還需要其他基礎技術的成長,其中一個很重要的就是語音的交互技術。

「智能語音這一塊不是我們的強項,所以我們更多的在尋求合作。在對比了很多家的方案後,微納感知計算的方案是很有優勢的。」智能語音技術作為人機交互閉環中的信息入口,對能否實現自然友好的人機交互有重要的影響。「如果機器人始終聽不清楚人在說什麼,那所謂的人機交互就根本無法實現了。」優必選戰略合作夥伴微納感知計算市場總監程剛說。而微納感知計算團隊的核心技術就是解決機器人「聽」的問題,不僅讓機器人能「聽見」,更加要讓機器人能「聽清」,而且有別於現在跟類似Siri這種手機語音助手的近距離交流,要保證機器人在更遠的地方都能聽清人的指令,3米,甚至5米以外。

微納感知一直專註於聲學技術及智能語音交互方案的研發,目前已經可以提供從軟核演算法、晶元模組、到聲學設計的Turnkey聲學方案。微納感知的遠場語音交互方案面向語音增強(讓人聽的舒服)和智能語音交互(讓機器聽的明白)兩大領域,廣泛服務於安防監控,聲學通信,機器人,智能音箱和智能家居等行業。

「我們目前已經有很成熟的智能音箱解決方案了,不過機器人的遠場語音方案難度要大得多。」程剛說,「首先機器人形態比音箱複雜得多,聲學結構不易處理,此外機器人運動過程中振動和舵機的噪音都會嚴重影響語音交互。」 經過數月的打磨,微納感知計算為優必選Alpha mini打造的「耳朵」已經讓它能在5米的距離,在各種運動的場景,可以清晰的「聽」見各種複雜的指令,讓機器人成為第三代人機交互中心成為可能。

熊友軍相信,假以時日,機器人會深入人們生活的方方面面,成為人們生活、工作的親密夥伴,另一方面,機器人也會在不斷交互中收集信息,成為大數據的入口,真正實現人機交互的一次變革。而包括智能語音在內的基礎技術就像一位位幕後英雄,支撐這次變革的發生。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 深圳微納研究院 的精彩文章:

TAG:深圳微納研究院 |