當前位置:
首頁 > 科技 > 前途未卜的智能音箱,語音助手還差一個殺手級應用

前途未卜的智能音箱,語音助手還差一個殺手級應用

作者 |Rani Molla

譯者 | 劉旭坤

整理 | 非主流、Jane

出品 | AI科技大本營

近日,亞馬遜推出了一款可以用語音控制的智能微波爐。至此,亞馬遜推出的由 Alexa 語音控制的智能家居產品的數量已累計超過十種。由此,我們可以看到亞馬遜推廣自家語音助手 Alexa 的執念。

不僅亞馬遜如此。Google 也一直在擴充可以用語音助手控制的家居產品,包括近期發布的 Google Home Hub,一款帶屏幕的智能音箱。Facebook 則在上個月剛剛發布了 Portal,一款可以進行視頻通話的智能音箱。蘋果也有HomePod ,而其中至關重要的語音助手 Siri,則從 2011 年開始就出現在幾乎蘋果的所有產品中了。

隨著語音助手的使用範圍越來越廣,用戶對隱私問題的疑慮也是與日俱增,然而消費者對智能音箱似乎仍十分買賬。智能音箱預計將會成為即將到來的美國感恩節和聖誕節購物季中的送禮佳品。更何況已經有超過 1/4 的美國人已經擁有智能音箱,並且每月會至少使用一次語音助手功能。

人們對語音交互的接受速度出乎意料地快。智能音箱的銷量長紅和各種研究機構對語音交互的信心也讓隱然讓語音交互的市場上泛起了泡沫:

Canalys 稱兩年內全球智能音箱總量將增加超過 200% 至 2.25 億台。

加拿大皇家銀行資本市場公司預計到 2020 年 Alexa 帶來的購物營收會超過 50 億美元。

市場研究機構 Juniper Research 稱 2022 年全球在語音助手上的廣告支出將從 0 增加到 190 億美元,與當前整個雜誌廣告市場的規模不相上下。

雖然其中一些預測可能會成為現實,然而做出如此樂觀的估計恐怕還為時過早。美國國家廣播電台 NPR 和研究機構 Edison Research 聯合發布的報告顯示:約 1/3 的智能音箱用戶在購買一個月之後新鮮感減退,使用智能音箱的頻率也開始下降,且有接近一半的用戶表示願意回到沒有智能音箱的日子。數據體現了人們對新技術一貫的熱情,然而語音助手恐怕現在還不算一項革命性的技術。

現在,語音助手和智能音箱確能幫我們打開收音機、調暗燈光或者朗讀天氣預報,但是,想要顛覆人們的生活,只做到這些還遠遠不夠。

語音交互到底有什麼用

其實,語音是一種很有用的人機交互方式,但發展一直受到技術條件的限制。現在隨著逐漸降低的價格和越來越快的網速,語音的處理可以轉移到伺服器上,也讓智能音箱和語音交互趕上了發展的風口,改變了人機交互的方式。

聽歌、聽廣播和聽有聲書成了智能音箱的典型使用場景。據統計,有 70%-90% 的智能音箱用戶都用智能音箱在線聽過歌,而有約 50% 用戶則是天天都用智能音箱聽歌。這些數據表示用戶消費媒體內容的方式已經發生巨大改變。此外,流媒體音樂公司 Spotify 發現,通過智能音箱收聽的用戶比一般用戶更願意每天收聽音樂,而且更傾向於在周末聽音樂,或者專門聽一些懷舊風格的音樂。

除了新興的流媒體平台,傳統的廣播電台用戶中也能看到智能音箱的發展。NPR 個性化與策展部總監 Tamar Charney 稱,通過智能音箱收聽 NPR 直播的用戶從去年的 4% 增長到了19%。NPR 發現智能音箱用戶增長的同時其他平台的收聽率卻並沒有下降,這對依賴公眾捐款生存的電台來說至關重要。用戶收聽時間越長,對內容就會越感興趣(電台會在節目中提醒用戶可以用智能音箱來聽 NPR 廣播)。Voicebot 博客與播客創始人 Bret Kinsella 也談道:「智能音箱讓人們重新開始聽廣播了。語音技術的殺手級應用就是播放音樂。」甚至連播客都在語音助手的應用下變得活躍了起來。根據語音控制播客的 APP ——Scout FM,其創始人 Cara Meverden 也說,智能音箱用戶的播客收聽率是手機用戶的兩倍。

使用智能音箱收聽播客的用戶比使用電腦或手機收聽的用戶更願意讓廣告播完,而播客靠的就是廣告收入。Meverden 也說道:「用戶很少讓 Alexa 跳過廣告,因為讓 Alexa 快進 30 秒跳過廣告還不如就讓廣告播完。智能音箱用戶其實更被動,語音介面提供什麼,用戶就接受什麼」。

智能音箱的流行也帶動了一些智能家居設備的使用,比如智能空凋、智能電燈、智能門鎖,都能讓用戶在任意地點進行操控,而且現在這樣的方式正在逐漸成為主流。Google 的語音助手已經可以控制超過 10000 種智能家居設備,亞馬遜 Alexa 則更勝一籌能,可以與超過 20000 種智能家居設備兼容。

語音助手簡化了很多之智能家居產品的設置工作,很多時候智能家居產品都能實現即插即用。

Google 產品管理和硬體總監 Micah Collins 談道:「過去只有安裝和設置智能家居設備的人才會使用它,但是現在語音控制在智能家居產品的可用性上帶來了巨大的提升。」

這直接導致了智能家居設備銷量的上升。IDC 數據顯示,全球智能家居設備市場,包括智能音箱、電視盒子、空調、家庭監控和安全設備等的總銷量預計今年將增長 27%,達到 5.5 億台。

這已經直接影響到了整個智能家居產業。大多數的 Leviton 智能開關和插座都可以通過 Google 的語音助手或 Alexa 進行控制,在被問及開關和插座的智能化是否有助於提升銷量使 Leviton 產品經理 James Shurte 表示:「肯定啊!智能家居產品就靠有語音控制才賣貨。」

語音助手讓智能鎖具設備製造商 August 去年的營收翻了一倍。August 的聯合創始人&CEO Jason Johnson 說道:「當用戶購買了一個智能音箱後,他們接下來就想買點智能燈、智能鎖試試,看好不好用。好用的話他們以後就會選擇那些可以用智能音箱控制的家居設備。」

理想狀態下,你只需要動動嘴,就可以控制房間的溫度和開關門鎖,或者讓電視播放你喜歡的電影。聽起來很酷而且科技范兒十足,但是這些工作沒有語音技術的話也就是走幾步的事,或者在手機 App 上完成。

儘管看起來智能音箱在流媒體和智能家居方面的功能很完善了,但是,如果智能語音助手智只能做到這些的話,那無疑要讓人們大失所望了。因為離開了聲控其實人們的生活一切照舊。

語音購物?別鬧了

除了聽音樂,控制智能家居,企業還期待用戶通過語音助手來購物,但是這一現象還並未真正實現。大多數調查顯示,曾通過智能音箱購物的用戶只有約 20% ,這其中還有一半是好奇的嘗鮮者。據 The Information 統計,在亞馬遜智能音箱用戶中通過 Alexa 購物過的比例不到 2%。無論數字是多少,至少目前不是零售商想要的。

實際上,根據 Voicebot 公司 5 月的一項調查指出,大多數人們還是喜歡去實體店購物。只有不到 1% 的美國用戶說他們更傾向於用智能音箱買東西。

也許是作為回應,最新推出的智能音箱都加上了屏幕,亞馬遜也給 Alexa 的購物指令打起了廣告。這顯示除了語音技術目前的一些局限性,尤其是在商業業務場景中。Google Collins 也曾談及「對於純語音技術產品而言,實現購物還有些為時過早,購物中更多的是視覺和觸覺體驗。」

在亞馬遜和淘寶上買東西隨便搜點什麼都能蹦出幾十頁搜索結果,但用智能音箱搜索用戶一般只能有一兩種選擇。能適合這種模式的恐怕只有廉價的日常消耗品而非服飾,比如說廁所里用的衛生紙,價格不貴,經常需要買,而且一般人不會費很多功夫來比較不同的衛生紙品牌。有用智能音箱購物經歷的用戶中 85% 都購買了智能音箱給出的第一個結果。

儘管大品牌都有提前布局智能音箱購物的意向,但目前還沒有找到很好的切入點。智能音箱和語音助手們還在努力爭取用戶的信任,所以現在 Google 和亞馬的遜智能音箱是根據用戶的消費歷史等信息在為用戶提供最相關的產品。不過看看亞馬遜和搜索引擎里的遍布的廣告就知道當用戶對智能音箱的搜索結果產生信任時,廣告也不會遠了。

商家們現在唯一能做的就是給智能音箱增加與自己產品相關的新功能。比如汰漬就開發了一款相當於智能音箱上 APP 的技能來教用戶如何清除衣物上的各種污漬。這些新功能並不局限於單一的智能音箱平台(當然可能要開發多個版本)所以品牌可以在多個智能音箱上布局。為智能音箱提供晶元和軟體的高通以及為智能音箱提供音響系統的 Sonos 也都在各個智能音箱廠家中間選擇保持中立,讓自家平台保持開放。這其實也是自然而然的選擇,因為這樣高通和 Sonos才能實現自身利益的最大化。

智能音箱的未來

智能音箱之所以是智能音箱,恐怕只是因為對著音箱說話比對著冰箱說話看起來更正常一些。當人們習慣了和設備使用語音進行交互,智能音箱應該也就完成自己的歷史使命了。人機語音交互的重點是語音助手,語音助手具體在什麼地方,在音箱也好在冰箱也好,其實並不相干。

有人預測未來上街購物隨處可見的語音助手將能識別出你並給予個性化的推薦,然而目前的現實是我說話稍微快點語音助手就跟我說他/她聽不懂。所以語音技術的走勢如何目前還很難判斷。

上世紀 80 年代滑鼠 - 這一人機交互的新方式剛剛出現時也遭到了用戶的冷嘲熱諷,但現在我們知道以滑鼠為載體的人機交互理念並沒有錯,只不過受到當時的技術水平所限制。早期滑鼠精度不高,而且軟體設計者也還沒有找到發揮滑鼠潛力的方法。四十年後的今天,滑鼠或者觸摸板已經成了軟體和電子遊戲設計中必須考慮的因素了。

語音交互比用滑鼠進行交互更加自然更加直觀,但目前也處在與當年滑鼠類似的尷尬境地。

語音技術諮詢公司 Rain Agency 的首席創意官 Will Hall 表示:「有新興技術出現時人們總是習慣於把老觀念往新技術上面靠。比如第一個電視廣告其實根本就和廣播上的廣告一樣只有聲音,其後電視廣告才慢慢地演變成為多種感官並用的展示方式。比如展示一輛汽車駛下高速的同時播放著音樂,這樣觀眾既有視覺感受也有聽覺感受。對語音技術也是同樣的道理。」

除非有一天我們能找到一種只有藉助語音才能完成的用例或者發明,否則語音技術只不過是把在線內容換了一種方式呈現而已。

https://www.recode.net/2018/11/12/17765390/voice-alexa-siri-assistant-amazon-echo-google-assistant

AI福利精選

對於想系統學習人工智慧的朋友,我們為大家準備了一個乾貨資源包,包含多家一線公司技術大咖30+精選講義跟對方向,可以讓你的學習事半功倍,歡迎掃碼領取!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI科技大本營 的精彩文章:

11月最佳機器學習開源項目Top10!
一文掌握常用的機器學習模型

TAG:AI科技大本營 |