當前位置:
首頁 > 最新 > 在 AI 技術還不夠成熟可靠的時代,我們究竟想要一款什麼樣的智能音箱

在 AI 技術還不夠成熟可靠的時代,我們究竟想要一款什麼樣的智能音箱

10 年前電影《鋼鐵俠》上映,影片中那個能幫助主人翁 Tony Stark 處理各種事物、計算各種信息的智能管家 Jarvis,憑藉著流暢無障的人機對話、近乎無所不能的技能、具備人格和獨立思維等理想的設定,成為了不少人對 AI 助手的完美假想對象。

鋼鐵俠劇照

是的,在科幻作品從來都不缺乏想像力,回憶起早期標榜科幻的動漫作品《人型電腦天使心》,同樣也為我們描繪了一個更加理想化的 AI 世界:AI 變成人型具象的產品形態,來服務人類。

當然,以上只是科幻作品對於 AI 所進行的暢想,距離現實生活仍有非常大的差距,不過一部分在過去曾被認為是科幻情節的功能,例如語音助手,其實已經在智能手機、智能音箱等產品上露面了。

儘管它們不能做到像 Jarvis 那樣將自主意識轉移到雲端,從而變得無處不在;也不能做到像人型電腦那般擬人模擬,但作為一個搭載智能語音助手的產品,它們基本也能完成用戶在日常生活中指派的多數命令。

(圖自:TechHive)

相比起智能手機,在銷量上還不足以被稱得上是「爆款」的智能音箱,近年來反而變成了被越來越多企業寄予厚望的 AI 「新容器」,在現今的智能音箱領域裡,不僅有矽谷科技巨頭的風向指引,還有一部分國內創業團隊全力押注。

儘管智能音箱的存在感正在逐漸變得越來越明顯,但有不少用戶反饋,現階段的智能音箱仍然無法勾起他們的購買慾望。

不過,這問題到底出在哪裡?


小米智能音箱

前面之所以提到科幻作品中 AI 的情節與現實中 AI 情況的對比,其實我想順延下來表達一個點—落差感。實際上,大多數用戶在買智能音箱之前和買智能音箱之後,往往都會形成這樣一個非常明顯的反差:

買之前:這些功能看上去好方便、好好用!

買之後:用起來好像也就那樣…

如果將智能音箱帶來的這個落差感從使用體驗的角度再進一步分析並拆分,我們基本上可以總結出造就這種反差感受的幾個細分點。

功能並非剛需

現在的智能音箱在功能上基本都大同小異,它們大多都是以播放音頻內容作為核心,並在語音交互的基礎上,拓展了聊天、控制智能家居、查詢天氣、講笑話、查交通、定鬧鐘等方面的功能。

XX,幫我設一個 7 點的鬧鐘。

XX,播放一首周杰倫的歌。

XX,今天需要帶雨傘嗎?

實際上,對於用戶來說,這些功能並非剛需,況且一部分智能手機已經兼具了語音助手,透過這些智能手機,你也能獲得相似的功能和體驗。

(圖自:Tata CLiQ)

不懂人意,答非所問

與宣傳視頻中描繪的美好景象不同,在實際體驗中,語音識別率和句意理解仍然是阻礙用戶獲得良好使用體驗方面的障礙之一。

首先是語音識別率,我想很多用戶在多次喚醒智能音箱未遂,或音箱多次無法準確識別出指令後,應該會對智能音箱的興趣減掉了一大半。

渡鴉智能音箱

其次是句意理解的問題,在某些時候,大多數智能音箱其實是不能聽懂你的意思的。一旦提問句式變得複雜、句子結構與智能音箱預設不符,那麼它很容易將你的指令變成搜歌或搜索網頁的關鍵詞。

不具備「流暢」的對話能力

也正因為它不懂人意、答非所問,並且它響應速度慢、每次接受指令前,都需要喚醒詞喚醒。因而這些問題所帶來的中斷感和不便,就讓你很難與智能音箱展開一次流暢的對話。

而且,目前還有蠻多的智能音箱並不支持聊天內容上下文關聯,簡單來說,就是智能音箱已經記不住你上幾句話說了什麼。

AI 仍需要用戶幫忙培育

實際上,現在的智能音箱產品還不能做到真正的「智能」。它需要繼續積累用戶的數據,並通過分析用戶的使用情況,逐步完善其智能性,這樣它才能在你需要的時候,變得相對更懂你。

天貓精靈智能音箱

從這一過程到真正成熟,可能需要相對漫長的時間,而這對於購買了產品的用戶來說,可能不是一件能接受的事情。因為這樣便會在他們的主觀印象中,留下一個智能音箱技術不成熟、不實用的烙印。


外媒 Forbes 曾在《解釋人工智慧重要性的關鍵定義》一文中提到,人工智慧的定義已經逐漸從傳統字面上的理解轉變為 3 種試圖實現的形態:

構建與人類思維方式相近的系統(強 AI)

只會執行而不懂人類思維方式的系統(弱 AI)

基於人類思維方式作為模板,但最終不斷進化和發展的系統

如果從上述的概念看,現階段的智能音箱應該是屬於第二種弱 AI 的範疇內,它們不具備獨立的思維,無法揣測用戶的想法,並且只會執行預設的指令。

蘋果 HomePod

對於這種程度的 AI 智能音箱,其實指望它能像 Jarvis、人型電腦那樣知你懂你,是不現實的。不過,回歸到實際需求上來看,用戶希望從智能音箱中獲得什麼呢?如果將上面列出的這些問題歸納總結起來,大致能得出兩個方面的需求,一個是要足夠智能,另一個是技能和服務要多。

要足夠智能

這裡又可以拆分為兩部分:一個是智能音箱要「知你懂你」,另一個是儘可能地想你所想。

「知你懂你」這裡所說的含義,是指音箱能夠知道你說的指令,並懂你想表達的意思。簡單來說,就是語音識別準確率和句意理解能力。

之前在我體驗渡鴉 Raven H 智能音箱的時候,它的語音識別準確率就讓我滿意:即便是用 80% 的音量播放音樂、離 Raven H 相距 3 米左右的距離時,它都能響應到,並準確識別出語音指令。

而說到句意理解能力這一塊,目前大多數智能音箱仍然限制在預設句式的條條框框之中。

但實際上「知你懂你」這個問題,已經隨著專用語音晶元的逐步成熟以及語音交互生態的支持,能夠從根本改善這個方面的體驗。

至於想你所想,其實就是通過了解用戶的使用習慣來,來提前預知用戶的需求。現在大多數智能音箱還不具備這樣的能力,那麼有沒有解決的方法?渡鴉使用了一種「非智能」的方式來解決這個問題。

在 Raven H 上,渡鴉提供了一個 Flow 的功能,通過用戶手動預先設置後, Raven H 會在每天鬧鐘提醒後,自動播報當天的天氣、路況、限行以及你的日程安排。

儘管這離真正的想你所想還有蠻大的差距,但起碼在 AI 技術還不夠成熟的時候,這也算是一種折中的方案。

技能和服務要儘可能多

在使用各種不同的智能音箱後,它們留給我印象最深的並不是那些像播放音樂、查天氣、講笑話等基礎功能,而是它們的技能與服務所帶來的延伸功能。

例如,我就記住了天貓精靈 X1 可以點外賣、充話費;小米 AI 音箱和渡鴉 Raven H 能夠查找手機…

儘管這當中某些技能和服務,未必是每個用戶最需要、最實用的功能,但在基礎功能體驗拉不開較大差距的智能音箱領域,這些小技能和服務,反而是一款智能音箱相較於其他競品獨有的小優勢。

實際上,作為參照對象的亞馬遜 Echo 智能音箱,它在剛開始面世的時候音質一般智能不足,但是隨著亞馬遜不斷讓其學習更多的技能,於是它終成標杆。

其中 Echo 利用技能和服務所做到了的一個優勢,便是將功能延伸到更多的智能家居設備上,並與它們建立起聯動性。

而在聯動智能家居這方面,愛范兒(ID:ifanr)此前體驗蘋果的樣板房時,就已經感受到這方面的便利性。當時,蘋果還未推出智能音箱 HomePod,覆蓋了不少 HomeKit 設備的樣板房仍以 Apple TV 或 iPad 作為智能家居的中樞。

但使用 Apple TV 控制又有些繁瑣,iPad 又因隨身攜帶的幾率高而容易失去對智能家居中樞的遠程控制。這個時候,音箱就是這個場景下最佳的解決方案。

畢竟,用戶面對的都是一些邏輯簡單的操作,如控制設備開關和調整溫度。這些通過語音就能夠操控,中間也不需要屏幕的參與。在這個狀態下,用戶只需要一個可聯網、帶智能助手的音箱就能夠解決問題。

因此,儘可能多地擴展智能音箱的技能和服務,也是智能音箱一個關鍵的點。

總的來說,作為一種基於弱 AI 形態的產品,智能音箱的本質其實還只是生活中的一種「輔助」工具,但這也不是說,它就沒有成為生活必需品的潛質。隨著 AI 技術的不斷發展,硬體晶元的功能逐漸完善、語音識別等核心技術取得突破以及智能家居的普及,可以預見的是,像智能音箱這樣的產品將會慢慢變得成熟、可靠,並且更好地為我們的生活服務。

指不準,未來的智能音箱形態就真的會變成一個無處不在的 Jarvis,或是一位人型電腦呢?

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 愛范兒 的精彩文章:

中國出手還擊!對特朗普發起的「貿易戰」奉陪到底
早報:iOS 11.3 正式版發布/愛奇藝赴美上市首日大跌 13%

TAG:愛范兒 |