當前位置:
首頁 > 最新 > 語音遠場交互的下一個主戰場是手機?

語音遠場交互的下一個主戰場是手機?

全文約2500字,閱讀時間預計6分鐘。

在 AI 時代,你永遠都不能忽視語音交互。

在2014年亞馬遜的Echo智能音箱面世之前,喬布斯於2010年花2億美元收購了Siri,並在2011年將其作為蘋果的語音助手隆重推出。

這也是喬布斯生前為蘋果做的最後一件事,但卻為蘋果內部帶來了第一次翻天覆地的變化,因為他為蘋果鋪平了走向未來的道路——迎接將來人機交互的另一次重要轉換。

現如今,時代在變,技術在變,不變的是人們對語音交互的關注。

畢竟,在如今的萬物互聯時代,人工智慧變成了可能的流量入口,語音交互也水漲船高,成為了一直高居不下的風口。據相關預測,語音交互領域的落地代表產品之一智能音箱,2018年全球智能音箱出貨量將超過5600萬台。

但對於很早就應用了語音助手的手機呢?

聲學在線在行業內獲悉,2018年將是手機遠場語音交互產品的關鍵一年,誰率先搶佔了語音交互戰的先機,誰就掌握了接下來手機市場爭奪戰之中的制高點。

巨頭混戰智能音箱

在語音交互的落地產品選擇上,亞馬遜、谷歌、微軟、阿里、百度、京東等國內外各大巨頭都不約而同地選擇了智能音箱。

據Canalys相關數據預測,預測2018年將是普及智能音箱的「決定性一年」,相比全年出貨量剛過3000萬台的2017年,2018年智能音箱全球出貨量預計將達到5630萬台。

但如今的智能音箱市場,已不是2014年亞馬遜剛推出的Echo的情形:在幾大巨頭迅速跟進的態勢下,智能音箱行業演變成了「百箱大戰」,今天你89,明天我79;今天你出貨量全球第一,明天我馬上開拓新的市場反超;你方唱罷我方登場。

價格戰此起彼伏、新品層出不窮,智能音箱業已成為國內公認的一片紅海。想要繼續在智能音箱的領域再分一杯羹,難度實在太大。

就連相關的智能語音晶元都帶著十足的火藥味:先是科大訊飛的語音合成晶元,後聲智科技的麥克風陣列晶元,最近更是有雲知聲發聲、出門問問亮相,Rokid緊隨其後,就連剛獲得D輪融資的思必馳也抓緊宣布計劃,甚者還在朋友圈就已經展開了一輪唇槍舌劍。

在百度智能生活事業群組總經理景鯤看來,在2018年,語音交互市場肯定會更活躍,會有更多有意思的產品出現,並且出現的節奏會更快。

就比如之前聲學在線提到的鎚子TNT工作站、火狐語音交互瀏覽器,以及智能音箱+機頂盒的結合體天貓精靈魔盒。

再比如近日外媒報道中,獲得三家巨頭亞馬遜、微軟、Salesforce投資2700萬美元融資的Tact.AI。

該公司目前產品改進後,就可以成為銷售人員在路上的「語音助手」:除提供下次會議概要外,還可以提供交易細節和其他相關信息,為他們準備下一次更高效的會面。

大家都在尋找下一個現象級的遠場語音交互入口。

亟待AI加持的手機廠商

蘋果的日子也並不好過。

曾經被認為是蘋果公司的下一個重大創新的siri,在被谷歌的Assistant、微軟的Cortana、亞馬遜的Alexa挾智能音箱之勢圍攻後,毫無還手之力。

根據市場調查機構Trendforce公布的2018年第一季度全球智能手機市場份額數據顯示,蘋果排名第二,市場份額16.4%,而到第二季度則預計下降到11.4%,排名降至第三。

為此,蘋果給出的應對之策之一是用Siri在語音交互上發力。在WWDC上,Siri增加了一個新的應用:Shortcuts。通過這個App,用戶能夠和各類應用結合,以增加Siri的「存在感」。

而對於國內手機廠商來說,2018年也意味著一場肉搏戰。

IDC數據顯示,今年Q1,華為、OPPO、vivo、小米四個頭部玩家市場佔有率總和達85.8%。此外,還有三星、蘋果的虎視眈眈,以及鎚子、聯想等的各種反撲。

那麼這些手機廠商如何打動用戶,獲取更大的市場份額?在中國市場競爭激烈,海外市場也進入持久戰的2018年?

答案只有一個:創新,還是創新。

vivo執行副總裁胡柏山就很明確地指出,「不做創新一定會死掉的,沒有創新能力支撐,品牌廠商最終一定over。」就連一直在講性價比的小米,也在技術領域進行高額投入。

畢竟,一旦迭代產品一招不慎,或許整個就會前功盡棄,跟樂視、魅族、金立等一樣,消失無雲煙。

此時,通過遠場語音交互來賦予手機更新的交互方式,就有可能產生一個Siri之於iPhone的創新,一方面建立起自身的技術壁壘,強化手機的應用場景,一方面也可以提高用戶效率和體驗,大大降低用戶使用門檻,增強用戶粘性。

兩者一拍即合

雖然遠場語音交互的落地要比大家預期的要慢,但在巨頭的推動下,在智能音箱落地的同時,遠場語音交互也在不斷地向前推進,智能音箱的喚醒速度和準確率都達到了較高的水平。

隨著遠場語音交互從智能音箱向其他產品的延伸,一系列遠場語音交互的技術難點也隨之會得到解決。

比如在iPhone 4S時期受制約的Siri,iPhone6s的時候就可以直接對siri進行語音喚醒了,就是因為6s上有一顆專門進行語音激活的低功耗晶元。之後隨著語音晶元的不斷開發,針對各種產品的低功耗語音晶元產品也不是不可能開發的。

對這一制約語音交互的難題「功耗問題」來說,目前的難點在於語音交互助手如何時刻保持被喚醒的狀態,還能盡量低降低功效,以確保採用語音交互有很好的效果,成本也不會大幅度的提升。那麼,我們可以假設,之後的產品完全可以配備一個專門處理語音交互的低功耗處理器。

與之相對的,遠場語音交互的應用場景還是相對廣泛的:

1、車載情景,在駕駛的模式之下,排除強雜訊的干擾,直接解放雙手,手機用戶可以自如地打電話、聽音樂等;

2、家居場景,介於智能音箱和智能家居的中間態,進行智能家居的遙控,在不同使用場景中,滿足2米以內小區域的覆蓋;

3、摒棄手機自身的噪音,迴音消除的其他場景,比如打遊戲時的自我識別,看綜藝時的自動彈幕,隨身攜帶,粘性比較足;

我們也可以看到,目前小米和華為也做了一些有益的探索:

5月小米發布會上,雷軍發布了MIUI10,最大的亮點是可以直接語音喚醒小愛同學,點擊屏幕即可下達語音指令,導航、接電話、回微信等都無需上手操作。

6月華為全球合作夥伴與開發者大會上,余承東提及華為全場景生態戰略時就談到,華為手機進車可實現AI降噪、免喚醒、免手動等功能,用戶可以輕鬆掌握所有的家用設備,通過華為智能助理在辦公環境下進行語音交互等等。

對於手機廠商來說,做好遠場語音交互即是挑戰也是機遇。我們也可以預測,未來的3年,手機也一定會成為遠場語音識別的主戰場。

Ps,歡迎加入我們的討論,動動你的手指,做個小投票哦!下周一我們會公布相關投票結果,歡迎期待!

-End-

本文章圖片來源於網路


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 聲學在線 的精彩文章:

量子計算機如何輕鬆搞定經典演算法不可能完成的任務?

TAG:聲學在線 |