當前位置:
首頁 > 最新 > 語音助手能像真人打預約電話,谷歌是如何做到的

語音助手能像真人打預約電話,谷歌是如何做到的

(原標題:Exclusive: Google"s Duplex could make Assistant the most lifelike AI yet)

網易科技訊 5月9日消息,據國外媒體報道,在2018年度谷歌開發者大會Google I/O上,谷歌發布了升級版的數字助理Google Assistant。谷歌介紹稱,Assistant的「持續性對話」功能讓對話更自然,而「多重行動」功能讓用戶在一次對話中可以提出多個問題。此外Pretty Please功能能夠讓用戶的措辭更加禮貌規範。在發布會之前,CNET造訪了山景城,探究了谷歌Assistant背後的Duplex技術以及其他人工智慧。

起初談話看起來並無二樣。

加利福尼亞州山景城的谷歌園區中,作者被邀請收聽一段預訂晚餐的電話錄音,只有短短的51秒。

第一個人:晚上好。

第二個人:你好?

第一個人:你好。

第二個人:嗨,呃,我想為三號星期五預訂一個位子。

第一個人:好的,堅持一會兒。

第二個人:嗯。

第一個人:好的......請稍等。

第二個人:嗯。

第一個人:所以時間是星期五,十一月三號。多少人?

第二個人:對...兩個人。

第一個人:兩個人?

第二個人:是的。

當我聽到一個男人和一個女人在對話的時候,谷歌負責數字助理業務的高管正密切關注我的反應。谷歌於當地時間周二2018年度開發者大會Google I/O,現在他們正在演示谷歌助理的新功能。

結果證明這個特別的演示非常瘋狂。

那是因為聽起來像一個男人的第二個人根本不是一個人。這是谷歌數字助理Assistant。而發音聽起來完全不像通常從谷歌家庭智能揚聲器聽到的那種半機器人的聲音。當其中的數字助理向你提供天氣的最新信息或告訴你到達工作地點需要多長時間時,通常是一種毫無生氣的電子擬人聲。

作為亞馬遜Alexa,蘋果Siri和微軟Cortana的競爭對手,這可能是谷歌數字助理Assistant的下一個演變。這聽起來很明顯——甚至是怪異的——只有人類自己會在回答問題前停頓一下,使用諸如「嗯」和「呃」等口頭禪。它說「嗯嗯」,好似在點頭同意;它拉長了某些詞的發音,好像它正在花時間去思考一個問題的答案,當然它的反應是由編程演算法即時實現的。

(圖示:在2016年度谷歌開發者大會上,谷歌首席執行官皮查伊在介紹谷歌數字助理Assistant之前表示,「把它看作開發你自己的谷歌。」)

其背後是谷歌稱之為「Duplex」的技術,由紐約、特拉維夫和山景城的谷歌工程師和產品設計師聯合開發 ,聽起來好像語音助手的未來已經到來。

嗯,差不多已經到來。

這個演示是谷歌計劃在今年夏天發布的「實驗」計劃的一部分。通過Duplex技術,一小部分人可以完成預訂餐廳、查看假日時間等通常通過電話進行的活動。所有這些交互都發生在後端——谷歌數字助理Assistant和餐廳之間。你甚至不會聽到發生的對話。它將來自一個未指定的電話號碼,而不需要使用用戶自己的號碼。

谷歌對部署Duplex技術的規模很小心,但表示它會受到限制。公司強調,並不是目前所有使用谷歌數字助理Assistant的用戶都能夠體驗Duplex技術。負責谷歌助理和搜索產品設計的副總裁尼克·福克斯(Nick Fox)以及谷歌工程副總裁尤西·馬蒂亞斯(Yossi Matias)均表示,由於Duplex是一項新技術,因此搜索巨頭希望「謹慎行事」。

谷歌也不會說,它的目標是在以後將這個自然發聲的助理帶進更多的產品——比如從智能揚聲器Google Home中聽到它的發音。

(圖示:谷歌一直在擴大其智能家居產品線,搭載數字助理Assistant的家用高端音響Home Max售價400美元)

以下是預訂功能的工作原理:假設您想預約理髮。只需通過Google Home詢問谷歌助理Assistant,或從Android手機或iPhone應用程序中發信息告訴它什麼時候去哪裡。如果您在星期天中午想要吃點東西,那麼Assistant會問你是否有備選,以防萬一時間不夠用——它清楚中午到下午2點之間的時間範圍更合適。

如果此前用戶使用過像OpenTable這樣的自動在線預訂服務,Assistant將默認使用該系統進行預約。但是,如果不以這種方式進行自動預訂——而且許多小業務不會這樣做——谷歌助理Assistant將會替你打電話。預定成功後,Assistant將會和你確認此次行程,並將其添加到日曆中。

在另一段對話錄音中,我聽到兩個女聲在討論預約理髮。其中一個依舊是採用了Duplex技術的谷歌助理Assistant。 「她」聽起來像是真正的人類。她甚至會迴避問題,同時在句子的末尾調高語調,聽起來甚至會讓一些人惱火。

「我們對它的思考是,『什麼是完美的助理?』」在谷歌供職已經15年的福克斯表示, 「當我想要一個助理時,它就在那裡,隨時準備提供幫助,我不擔心『我的助手能不能做到。』我的助手可以做任何我想做的事情。」

大部分時間福克斯都在谷歌從事搜索廣告業務,目前負責谷歌這個標誌性項目之一的產品。谷歌在2016年度的開發者大會Google I/O上發布了數字助理Assistant,距今已經有兩年時間。當時谷歌首席執行官桑達爾·皮查伊(Sundar Pichai)解釋了他的願景:Assistant是谷歌的精髓。

皮查伊和團隊的目標是讓谷歌的人工智慧與用戶一道完成一天的工作:如今在Assistant的幫助下,用戶可以從智能揚聲器Google Home中獲取早間新聞,通過將手機攝像頭對準花朵得知物種名稱,在回家之前打開房間內的恆溫器等等。

但是如果谷歌的實驗成為現實,Assistant將真正成為用戶的數字助理。 「把它想像成開發屬於你自己的谷歌,」皮查伊在兩年前如是指出。

(圖示:負責谷歌助理和搜索產品設計的副總裁尼克·福克斯(Nick Fox)表示,「我們不想強迫人們接受,『數字助理聽起來本應如此』。」)

與此同時,谷歌正試圖用更新後的Assistant贏得更多用戶。除了一種男性發音和女性發音之外,這個助手還可以用六個新聲音說話。 谷歌還使用戶能夠更輕鬆地提出後續問題,並在開車並使用谷歌地圖時自動向某些人發送你的預計抵達時間。

人的感覺

如果谷歌的目標是讓Assistant成為擬人化的谷歌,那麼仍有很多事情要做。實事求是講,到目前為止谷歌的競爭對手Alexa,Siri和Cortana都沒有兌現他們的承諾。如果谷歌決定將Duplex技術擴展到Google Home以及其他面向消費者的產品,那麼這種情況可能會發生變化。根據我聽到的簡短對話,可以感覺到似乎用戶正在與辦公室的行政助理交談,或者可以說像是與斯派克·瓊斯(Spike Jonze)科幻電影《她》(Her)中的操作系統Samantha進行對話。

當然,谷歌並不是第一個進入數字助理市場的公司。亞馬遜在2014年發布了它的Echo智能揚聲器,同時用Alexa軟體提供語音功能,這讓人震驚。就目前而言,智能揚聲器仍然是與數字助理互動的最普遍方式,而亞馬遜在美國市場佔有69%的市場份額。根據研究公司CIRP的數據,2016年發布的Google Home佔有31%的市場份額。

谷歌和亞馬遜都在加強他們的產品線。去年,谷歌推出了40美元的家用迷你音響Home Mini和400美元的家用高端音響Home Max。相比之下,目前亞馬遜有10款Echo產品,價格從40美元到230美元不等。 2月份蘋果帶著售價350美元的HomePod加入了這場戰鬥。

但是當數字助理與物聯網設備連接時,可以控制從汽車中控、洗衣機到電燈等所有設備時,可能會賺更多的錢。根據市場研究公司Gartner的數據,到2020年人們將在物聯網設備上花費1萬億美元。

這就是為什麼谷歌一直在努力追趕的原因。今天,該公司宣布已經向全球發送了搭載數字助理Assistant的5億台設備,其中包括揚聲器,電話和電視機。 谷歌還表示,Assistant支持多達30種語言發言,並將在今年年底之前支持80個國家的語言,其中包括7個新國家,分別是丹麥,韓國,墨西哥,荷蘭,挪威,西班牙和瑞典。同樣,亞馬遜的Echo能夠在80多個國家使用。

(圖示:谷歌工程副總裁尤西·馬蒂亞斯(Yossi Matias)指出,「多年來谷歌一直在致力於自然語音技術的研究。」)

谷歌上周表示,兼容谷歌助理Assistant的家庭互聯網設備數量從1月份的1500款增長到現在的5000款。這對於谷歌來說是一項巨大的進步,但不及兼容Alexa設備的一半。目前全球有12000款設備支持亞馬遜Alexa。

谷歌的福克斯一直在試圖淡化與亞馬遜的競爭。

「我們很少用競爭的方式來看待它,」福克斯說,「更大的機會是那些還沒有使用任何東西的人。」

儘管如此,兩家科技巨頭都沒有害怕硬碰硬,並且為了智能家居設備的銷售而相互出手。今年1月份,谷歌切斷了亞馬遜Echo和Fire TV訪問YouTube的渠道。亞馬遜的電商平台也不會出售谷歌以及其收購的智能家庭製造商Nest出品的一些小工具。

「我們並不知道所有的答案」

特拉維夫谷歌研發中心負責人馬蒂亞斯則表示,谷歌多年來一直致力於開發新的自然語音技術。該公司表示,這不是一種適用於各種電話任務的通用人工智慧技術,相反它是為特定任務(比如預約業務)而量身定製的。馬蒂亞斯欣然承認,這項技術並不完美,谷歌正在謹慎行事,因為有更多人性化的人工智慧會帶來更多棘手的問題。

比如說如果軟體開始胡言亂語該怎麼辦?馬蒂亞斯告訴我,技術不會完全失控。他說,當這項功能真正發布時,軟體可能會告訴另一端的人正在與數字助理進行對話。當然在我聽到的錄音中,Assistant並沒有這樣做。

馬蒂亞斯說:「我們需要仔細考慮如何在實驗中進行這種互動。我們相信用透明度做到這一點是正確的。」

如果對話確實出錯,軟體將會退回到他所謂的「實時監督培訓」。在這種情況下,軟體會將對話權轉交給人來完成通話。由於對話通常不會受到人的監控,因此他們必須從頭開始。 谷歌並沒有明確這個人是否會記錄此前通話中已經討論過的內容。

Duplex技術有些類似於科幻。這就為我們帶來了一些既有實際意義,又有哲理的問題:一個人應該如何對待像人一樣的人工智慧?人類於機器人之間的正確禮儀是什麼?在不打斷對話的情況下,人工智慧在與人交談時表明自己是機器人的最佳方式是什麼?

當被問到這些問題時,福克斯承認谷歌工作人員正在思考這些事情。

「我們需要為每個人設定正確的期望,」他說,「這些都是技術實現的問題,我會虛心地說,我們並沒有完全知道所有的答案,並且需要根據我們在現實世界中看到的情況來加深理解。」

現在在斯坦福大學工作的矽谷未來學家保羅·薩弗(Paul Saffo)對這種情況有自己的看法。他說,任何現實人工智慧的創造者都有義務向與其交互的任何人透露他們正在與機器對話。

但是隨著這種技術的應用越來越廣泛,他認為人們會開始意識到與機器人談話中的「告知」。薩弗指出:「隨著我們的機器不斷發展,人們希望自己一開始就知道他們是否正在與機器人交談。」

助理無處不在

儘管目前Duplex技術仍然是一個實驗,但谷歌的數字助理Assistant一直在不斷發展,有些新功能會即刻上線。

其中包括更多的發音。Assistant有六個新的男性和女性美語發音,。一個女性的聲音柔和舒緩。一個新的男性的聲音稍微低沉。

「我的妻子討厭那個聲音,她說』把它從我的房間里拿走",」福克斯說,他播放的是一個像主持人一樣興高采烈的男性聲音。名為WaveNet的技術使聲音的擴展庫成為可能,該技術大大縮短了錄音員錄製每種發音所需的時間和音頻樣本。

這些發音沒有標明特定名稱。相反,每個都用一種顏色來指定,如紅色,橙色或綠色。您可以通過滑動手機設置來選擇所需的一種。當你連接到Google Home時,只需選擇您最喜歡的語音設置,揚聲器就會識別你的聲音,並用所選擇的助理髮音回復。

谷歌還調侃說,它也會將歌手約翰·萊金(John Legend)的聲音賦予Assistan。

與大多數更新一樣,這個想法是為了讓助理更加個性化。 「我們不想強迫人們接受,」一個數字助理聽起來本應如此,「福克斯說。

將於今年夏天發布的另一個更新是叫做Pretty Please的說話模式,其要求你在向助理下命令時要有禮貌。這個模式的目標是鼓勵孩子們說「請」和「謝謝」,讓孩子更有禮貌。當然對於成年人也是如此。

亞馬遜上個月發布了一項類似的功能,用於為孩子們設計的新一代Echo Dot揚聲器。 Alexa的兒童友好型版本提供了正面強化,對一個說「請」回應的孩子,Alexa會回應「謝謝你的問候。」

在亞馬遜發布這項功能時,谷歌表示已經研究Pretty Please有一段時間。 「所有這些都是新生事物,」Assistant產品管理總監莉蓮·雷蒙(Lilian Rincon)表示, 「我們都在努力解決這些問題,這並不奇怪。」

還有很多其他新東西:你現在可以一次提出兩個問題,Assistant將作出連續回答。 (例如:肯德里克·拉瑪多大年紀,他最新專輯的名字是什麼?)。你也可以在不說出「嗨谷歌」的情況下提出後續問題,或是重複你的問題。在對話結束之前,麥克風會保持8秒鐘的激活狀態。在此之前,麥克風在用戶提出問題後就暫停拾音。

開車過程中,Assistant可以在你使用谷歌地圖進行導航時向某人發送預定到達時間。當你在手機上訪問Assistant時,它會顯示更多視覺內容,例如關於最近航班信息和待辦事項的提醒。你還可以設置一個「自定義常式」,在關閉早上鬧鈴後立即觸發一組操作。這意味著可以自動開始早間新聞播放,交通狀況更新以及最喜歡的歌曲。

這一切都很有用。但這也意味著谷歌智能助理會更深入地了解用戶。

這值得討論,因為用戶隱私是科技領域討論的主要話題。自從Facebook於3月份開始與劍橋分析公司(Cambridge Analytica)發生醜聞以來,矽谷大科技企業的數據收集方法在數周內都受到了額外的審查。一家數字諮詢公司可以在完全不知情的情況下從多達8700萬Facebook用戶那裡獲取個人信息,這種醜聞引發了關於科技巨頭如何保護用戶數據以及如何賺錢的爭論。大多數情況下,谷歌,Facebook和其他公司業務都依賴他們收集的有關用戶喜歡什麼,不喜歡什麼,購物偏好,生活方式等個人信息,以便於營銷人員可以投放特定廣告。

谷歌去年的廣告銷售額達到954億美元,而Facebook的廣告銷售額則達到了400億美元。

「我們的原則一直是讓用戶控制這些信息,」福克斯說, 「在過去幾周時間裡強調這一點非常重要,但我們一直都知道這很重要,對我們來說這種強化是有益的。」

他說,Assistant查詢的處理方式與常規搜索查詢完全相同,並具有相同的用戶設置。這意味著用戶可以清除搜索記錄,但這可能會影響到所看到的廣告。

所有這一切都是我們討論Assistant的真正原因。正如皮查伊在2016年提到的那樣,這是谷歌搜索的下一次發展,人們花在台式電腦上的時間更少,更多的時間都用在手機和智能揚聲器以及汽車等互聯網設備上。

當福克斯被問及他是否認為Assistant現在是谷歌最重要的項目時,他停頓了13秒。

「Assistant是谷歌一項重要業務,」福克斯說, 「做正確的事真的很重要。」(晗冰)

本文來自網易科技報道,創業家系授權發布,略經編輯修改,版權歸作者所有,內容僅代表作者獨立觀點。[ 下載創業家APP,讀懂中國最賺錢的7000種生意 ]

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 創業家 的精彩文章:

外媒:收購高通失敗後 博通潛在併購對象是這三家公司
滴滴上海宣布取消常態化補貼;阿里影業巨虧17億元

TAG:創業家 |