當前位置:
首頁 > 知識 > 冷落谷歌,無感Alexa,日本市場智能音箱霸主名叫Clova

冷落谷歌,無感Alexa,日本市場智能音箱霸主名叫Clova

智能家居是AI領域最火熱的話題之一。而智能家居目前最熱門的領域又是智能音箱。其中,智能音箱的核心技術「語音交互」也是人類最自然、最直接的交流方式。隨著影響交互技術的發展,在人與設備有距離或用手不便的場景下,用語音可迅速解決問題,不但可以解放雙手也同時也可解放雙眼。

作者 | 熊利郎、陸少游

一、智能音箱的市場規模

富士CHIMERA研究室在2018年對智能音箱市場進行過調查。此調查中的智能音箱對象,除了搭載基礎的Wi-Fi和藍牙等網路功能和配備了音頻輸入輸出和語音助手功能的揚聲器外。部分帶攝像頭模塊和顯示器的產品,以及能夠進行音頻交互的產品均被算作智能音箱市場中。

該市場調查報告顯示,從2017年下半年開始一直到年底,谷歌和亞馬遜等多家外國製造商推出的產品形成了日本國內市場。而日本製造商在2018年積極進入市場,也使得市場正在快速擴張,預計將達到46億日元(2017年水平的2.9倍)。未來由於智能音箱的擁有率比較低,以及家電設備的自動化操作的普及,智能音箱的市場將會有一定程度的增長。值得警惕的是,由於未來家電也會逐漸增加語音交互的功能,智能音箱的增長率有可能會逐年降低。

日本智能音箱市場規模現狀與發展趨勢預測

數據來源:富士經濟

二、智能音箱中常見的技術

喚醒(Wake Words):麥克風在7x24小時接收並持續分析這些外部聲音。實時檢測到關鍵的喚醒詞。一旦檢測到了喚醒詞,就把之後的語音信息傳遞給語音識別伺服器。

自動語音識別(ASR):揚聲器收集的語音信息,並不能直接被AI用於分析,必須要先轉化成文字。此技術的目的是將人類語音中的辭彙內容,轉換為計算機讀取和分析的數據。通常涉及到了信號處理、模式識別等眾多領域。

語義理解(NLP):自然語言處理/智能音箱中最核心的領域。此技術用於把人類的語言轉化成機器能夠理解的文字和數字。同時也需要將長句子中的單詞進行辭彙邊界的界定,消除詞義的歧義,判斷模糊的語法後,進行自動分詞並解析。最終轉化為計算機可理解的內容,並做出合適的響應。

語音合成(TTS):此技術用於將文字智能地轉化為自然語音流。利用智能語音控制器確保文本輸出的語音音律流暢,使得用戶在聽取語音時感覺自然,降低機器語音輸出的冷漠與生澀感。通常會涉及到文本的斷句、字詞切分、多音字的處理、數字處理、縮略語處理等。

三、日本智能音箱應用場景及產業鏈公司圖譜

四、 智能音箱案例

Clova:外形沿用了布朗熊和莎莉雞的形象。具有語音交互功能,可以為用戶提供新聞資訊、天氣、播放音樂、控制智能家居的服務,只需簡單的語音即可完成各種任務。此外,日本葬儀服務公司Yorisoo也與Clova合作,將4位僧人的「三分鐘法話」搭載於音箱內,並有「悲傷、憤怒、迷茫」三種感情共12個應對選擇。只要人們對智能音箱說出「喂Clova,幫我安排一位僧人吧」,就能根據當時情境聽到來自不同僧人的法話。

日本佔有率最高的Clove音箱

Gatebox:LINE公司推出的虛擬全息語音助手在功能上與其他智能音箱並無太大差別。但這款語音助手是由小桌燈大小的玻璃盒子構成,利用VR技術投影出全息虛擬角色。相比其他智能音箱,Gatebox能夠以更直觀的互動模式與用戶進行交流。

Alexa:理光已採用Alexa for Business來操作RICOH Intelligent Voice Control系統。用戶能夠使用語音來操作與Amazon Alexa兼容的複印機和掃描儀,以提高員工的業務生產力。三菱UFJ銀行與Alexa合作,採用語音登陸銀行賬戶,來查詢賬戶餘額,股票價格,最新的金融新聞和各種積分等。

Google Home:該智能助理與Yamato宅急送合作,推出了根據語音修改宅急送配送時間的服務。用戶只需說「OK Google、連接到Yamato宅急送」後,可根據語音提示來修改對應的配送時間。Google Home 也可用於PIXELA公司下的Conte燈光控制系統,用語音操控燈光的開關、調節燈光強弱等。

五、智能音箱在實際應用中的局限性

1. 缺少殺手級應用:現實情況是,很多音箱無法滿足最基本的基礎內容服務,殺手級應用沒有出現,導致的智能音箱應用場景不強。目前階段,市場僅剩嘗鮮的用戶,後勁不足。

2. 智能互動不足:智能音箱系統的互動僅限語音,且由於技術限制導致識別率無法令用戶滿意,在識別方言或者環境嘈雜的情況下用戶需要反覆發布操作指示才可正確識別。

3. 行業標準不統一:智能音箱方面沒有形成統一的技術框架和標準,各個品牌的產品難以實現互通互聯,僅限與同一品牌運營商下的產品進行聯動。出現問題時,只能選擇開發商提供的同品牌產品,給用戶帶來了不便。

六、智能音箱的未來趨勢

1. 雲計算的普及:藉助5G網路的優勢,當寬頻速度和延遲等不足以成為限制條件時,通過雲來實時計算和分析,將有助於提高對於用戶指令的識別精度。

2. 語音識別技術的增強:可準確識別出用戶的聲音,並分析語言來了解用戶的需求,最後根據用戶的需要來完成相應的任務。當識別精度越來越高,用戶將逐漸依賴與純語音交互。

3. 未來物聯網的最佳入口:智能音箱可根據用戶的一句話就完成新聞播報、聲控購物、收聽電台、預報天氣等日常任務。隨著人工智慧技術的成熟和IOT生態的完善,未來將有可能成為不同品牌、不同產品之間最佳的溝通橋樑。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

斯坦福教授自創編程語言造出全球最快網路晶元,如今被英特爾收購
與華為合作不能斷:晶元大廠高通、英特爾向美國政府施壓

TAG:機器之心 |