當前位置:
首頁 > 科技 > 谷歌、亞馬遜、蘋果三大語音助手發展現狀 誰被甩在身後了?

谷歌、亞馬遜、蘋果三大語音助手發展現狀 誰被甩在身後了?

本文由騰訊數碼獨家發布

無論是亞馬遜Alexa、谷歌Assistant還是蘋果Siri,都已經不是幾年前剛剛推出時那般「青澀」的模樣。三家科技巨頭會定位對自己的人工智慧語音助手進行更新和完善,並且彼此之間區別越來越大。而正是這種區別,讓我們這些關注人工智慧助手的人,對這種競爭持續充滿了興趣。

谷歌I/O大會,是這家搜索巨頭每年5月都會舉辦的開發者大會,並且出現了很多關於智能家居的新聞。而蘋果的WWDC年度開發者大會也也剛剛開始。至於亞馬遜的RE:MARS會議目前也正在進行中。這使得智能家居和語音助手領域最近的新聞讓人應接不暇,尤其是與Alexa、谷歌Assistant和蘋果Siri相關的新產品發布。

那麼不妨讓我們來探索一下最近三大語音助手的變化,以便更好地的了解每位助手的優勢,以及他們各自最需要對哪方面進行完善,當然還有我們希望在未來看到哪些變化。

Alexa

自從2014年推出首款Echo智能音箱以來,亞馬遜一直是智能家居領域的領導者。現在亞馬遜旗下共有7款智能音箱和智能顯示屏可供選擇,並且都內置了由亞馬遜的人工智慧助手Alexa。用戶需要說出「Alexa」來喚醒自己的語音助手,然後Alexa就可以幫助我們導航、指路、點菜,甚至開燈或調節恆溫器的溫度。

Alexa目前已經是一位功能相當強大的語音助手,但是它每次都需要喚醒詞才能發起一場新的對話。例如,如果我問:「Alexa,走廊恆溫器的當前溫度是多少?」之後,又要求Alexa把走廊恆溫器溫度進行調整之前,我必須再說一遍「Alexa」。

當然,其實換成另外一說說法會更自然,也就是:「Alexa,走廊恆溫器的當前溫度是多少?」然後簡單地說「將我的走廊恆溫器設置為24度」,這樣的說法更自然,而且不需要再次使用喚醒詞。

幸運的是,亞馬遜最近更新了兩項新功能,可以讓Alexa的自然語言能力更加智能。

首先,Alexa變得可以迅速處理多個相關的請求,而無需我們重複說出「Alexa」。我們預計該功能將於2019年晚些時候向美國用戶推出,但是具體的計劃目前還不得而知。我的同事本·福克斯·魯賓(Ben Fox Rubin)在亞馬遜re:MARS大會上已經看到了這一功能。在視頻演示中,有人向Alexa詢問當地電影院的電影播放時間、購買電影票、餐廳預訂以及預訂了一輛Uber汽車,過程中無需多次提到Alexa。

另外,亞馬遜還舉辦了一場名為Alexa Prize Socialbot Grand Challenge的競賽,鼓勵大學生們設計社交機器人,並且幫助開發Alexa的自然語言能力。目前這項比賽已經進入到了第三個年頭,加州大學戴維斯分校去年獲得了第一名,其中包括一張50萬美元的支票獎勵,可以用來支持他們的社交機器人項目。亞馬遜之前在一篇宣布2018年獲獎者的博客中表示,這位機器人的平均通話時長為9分59秒。

2017年,西雅圖華盛頓大學得到了這項嘉獎,而他們的社交機器人平均連續交談時間為10分22秒。亞馬遜希望通過幫助更多開發者開發出能夠進行更長時間自然對話的機器人,讓這些這些學生小組能夠幫助亞馬遜和Alexa找到保持更長時間自然對話的最佳方式。

谷歌Assistant

谷歌Assistant目前主要出現在五款谷歌Home系列智能音箱中,而谷歌Assistant則是這些設備背後的大腦。與Alexa不同的是,Alexa既是語音助手的名稱,也是啟用Alexa智能音箱的默認喚醒詞,但谷歌Assistant則會響應包括「OK,谷歌」和「Hey,谷歌」等不同的喚醒詞。

就像Alexa(當然下面的Siri也是如此)一樣,你可以向谷歌Assistant諮詢當地的天氣、交通狀況等信息,還可以讓它幫助我們調整智能照明系統,當然它能做的還有更多。

谷歌Assistant在自然語言會話方面功能也相當強大。我特別喜歡使用谷歌Assistant與谷歌Nest Hub智能顯示屏配合來指導我製作晚餐。這位語音助手在我執行這些步驟的時候可以非常耐心:比如我可以要求它立刻返回到上一個步驟,或者重複當前步驟,甚至詢問下一步應該如何準備、需要多少原材料、以及如何進行烹飪等等(如果有的話)。

此外,在谷歌2019年的I/O年度開發者大會上,還推出了一項新功能,那就是我們可以直接說「停止」來關閉鬧鐘,而不必在每天早上迷迷糊糊的狀態下還得先說一句「嘿,谷歌,停止」。

這家搜索巨頭還在I/O大會上推出了一款名為「Duplex on The Web」的產品,這是Duplex軟體的後續版本,該系統可以在電話線的另一端準備好一位人工智慧語音助手,幫助你完成預約和預訂等操作。因為聽起來相當真實,對方甚至不一定能聽出來自己正在與一位人工智慧語音助手對話。

Duplex on The Web是基於文本而不是基於語音技術的系統,這讓谷歌Assistant可以幫助我們預訂晚餐,而且它會使用自己所擁有所有關於用戶的信息來自動填寫在不同網站上的詳細信息。這個想法從理論上來說是合理的:讓科技為我們租賃汽車以及完成其他基本信息的輸入任務,但我實際上並不知道它實際上的工作原理是什麼。不管怎麼說,我個人來說肯定更喜歡基於文本系統的Duplex系統,而不是基於語音的人工智慧技術。

蘋果Siri

與亞馬遜以及谷歌相比,蘋果在推出智能家居產品方面行動比較緩慢,但它仍然是該領域一個最主要的競爭對手。目前蘋果只有一款智能家居設備,既不是iPhone、iPad和Mac,而是HomePod,我們可以用蘋果Siri語音助手來控制它。

通過Siri的語音命令(以及iOS系統中的Home應用),我們可以控制與蘋果HomeKit平台兼容的智能家居產品。與亞馬遜Alexa和谷歌Assistant一樣,你同樣可以說:「嘿,Siri,把我的走廊恆溫器調到24度」這樣的命令,或者詢問一些比較基本的問題。

雖然Siri大部分情況下能夠很好的與兼容HomeKit的第三方智能家居設備進行交互,但在回答普通問題和理解自然語言的能力方面,要稍稍落後於亞馬遜和谷歌。

幸運的是,在2019年的WWDC上,HomePod已經得到了一些改進,而這將有助於提供一些新功能,包括多種聲音識別、將音頻從iPhone傳輸到HomePod,以及在iHeart radio、TuneIn和Radio.com上播放實時廣播等。

Alexa和谷歌Assistant目前已經具備了多用戶語音識別能力,這意味著它們可以區分不同用戶之間的不同聲音(至少在某些時候如此)。因此,讓Siri能夠分辨出不同說話人的身份,是我們一直都在期待的事情,畢竟這是一項非常受歡迎的功能。這也意味著Siri可以在提醒、音樂推薦和其它專屬定製的功能方面發揮作用。

另外,蘋果還在WWDC上發布了一種名為「Neural Text to Speech」的系統,該系統應該能讓Siri的聲音聽起來更像普通人而不是人工智慧助手。我們將在今年晚些正式發布的iOS 13系統中體驗到它的實際效果。

三大語音助手現狀

顯然,亞馬遜Alexa在不需要每次都說喚醒詞的情況下實現多個請求,這是一個巨大的進步,即使目前該計劃還處於剛剛開啟的狀態。而谷歌的「無需喚醒詞直接停止」的功能也顯示了該技術的發展趨勢。這讓我們減少了對喚醒詞或短語的依賴,讓對話顯得更加自然生動。

雖然我們在今年的I/O開發者大會上沒有聽到更多關於基於語音的Duplex軟體介紹,但是Duplex功能在網路上已經可以大幅簡化冗雜的網路辭彙,這對提升用戶體驗來說相當具有吸引力。

另外一方面,就連蘋果也在加快自己的步伐,努力推出新的語音識別功能以及語音神經文本軟體,希望讓Siri聽起來更人性化。

如果仔細看看,其實三家公司彼此之間都有一些共同之處,那就是都與簡化對話過程有關,使它們聽起來更像人與人之間自然的對話。我完全贊成丟掉一些重複的喚醒詞來簡化對話的做法,但是讓人工智慧聽起來如此人性化和自然,以至於我們甚至無法區分語音助手和人類本身,這個想法讓我有點感到恐懼。詳細一定不止我有個人有這樣的想法。

對於智能家庭語音控制市場來說,這是一個非常有趣的時代,整個市場形成了「三足鼎立」的局面。根據2018年的一項研究顯示,儘管亞馬遜Echo的銷量更大,但谷歌Assistant是目前最聰明的語音助理,不過亞馬遜Alexa正在不斷縮小差距。

我們可能正在進入一個更加深入的階段,也就是對語音助手不斷改進的時代,而不是像我們在該技術問世最初幾年所看到的那樣。而這些循序漸漸式的改進和提升,最終會讓智能語音助手在我們的生活中扮演越來越重要的角色。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 米可 的精彩文章:

WWDC2019蘋果是否會帶來新一代Mac Pro「垃圾桶」
如何應對AMD?關於英特爾Ice Lake我們需要了解的一切

TAG:米可 |