當前位置:
首頁 > 科技 > 打Call就驚艷了?換個場景,谷歌或許都不敢拿出來

打Call就驚艷了?換個場景,谷歌或許都不敢拿出來

小場景有限話題模擬對話不是什麼新鮮事,針對demo優化到流暢也不難,但和真人對話能力是兩碼事。

鎂客注

Google Duplex的應變能力讓人驚艷,甚至有人說,以後,我們將分不清電話對面是人還是狗。

但換個場景試試?

可以看到,谷歌此次展示的是在特定場景下,其語音助手「真人式」的表演。作為「宣傳者」,Google Duplex是成功的。然而,「表演」都是讓人驚艷的,實際落地、應用的過程中問題也是很多的,包括谷歌。

本文基於Google Duplex展現的功能,從歷年來人工智慧技術發展進程及落地的脫節或者進步情況出發,探討AI技術未來的普及之路。

本文轉自尋找中國創客;作者:蔡浩爽,編輯:魏佳;作者公眾號:尋找中國創客(ID:xjbmaker)

正文:

人工智慧距離「成精」又近一步。

北京時間5月9日凌晨,2018谷歌 I/O大會上,谷歌助手Google Assistant為社交恐懼症患者帶來福音:

有了這個人工智慧助理,你再也不用自己打電話去點外賣、預約理髮店、餐廳、美容院、家政服務……

只要告訴Google Assistant你的需求,它就會像真人助理一樣,幫你在後台打電話搞定這些事,並且及時反饋給你預約結果。

這個名為Google Duplex的技術驚艷了整箇舊金山山景城。

谷歌首席執行官皮查伊(Sundar Pichai)在谷歌園區的圓頂露天劇場里展示谷歌助手打電話的兩個場景時,Google Assistant對話的流暢及模擬程度引起台下諸多科技媒體一陣陣驚呼:你根本無法辨別電話對面的是真人還是機器。

搞混時間和人數都沒能干擾它

「我能幫你做點什麼?」理髮店客服在電話里問。

「我想幫一位客戶預約女士理髮,嗯…我想預約5月3日的時間。」電話這頭,谷歌語音助手流暢地說明自己打電話的意圖,甚至還在對話中模仿人類口語,加上了「emmmm」 這種表示思考的停頓。其語調的抑揚頓挫,完全不同於常見語音助手的機械音。

當理髮店客服表示「稍等,我查詢一下」後,Google Assistant停頓了一秒——它可能在理解這句話的意圖——隨後說出了「嗯哼」,俏皮的語氣引得台下哄堂大笑。

值得注意的是,在理髮店客服表示Google Assistant 預約的12點已經約滿,建議預約下午1點15分的時間時,Google Assistant並未直接接受,而是詢問上午10點到12點是否有可預約的時間,隨後挑選合適時間並順利完成預約。

皮查伊表示,這是Google Assistant 打電話給理髮店完成預約的真實場景。

在整個預約過程中,Google Assistant發音自然,語調、語速並不讓人感到怪異,就連停頓、「嗯…」等表示思考的小細節都考慮到了。

在皮查伊展示的第二個場景中,Google Assistant的應變能力更是讓人驚艷。

第二個場景是預定餐位,從口音判斷,餐廳接線員不是native speaker,對英文的理解並不準確。接線員數次搞混 Google Assistant表達的時間、人數等信息,比如把「預定本月7號」聽成「有7個人用餐」。Google Assistant一次次糾正信息,並且在干擾下牢記核心任務。

讓皮查伊更感到驕傲的是,當餐廳接線員表示,四人在工作日就餐不需預約時,Google Assistant並沒有選擇結束對話,而是自發追問了一句:「通常等位要多久?」

「我們遇到過很多這種發展方向跟預想不同的對話,但神奇的是,Google Assistant可以理解上下文情景和對話的細微差別。在這段對話中,它知道要問等位時間,非常得體地完成了對話。」皮查伊說。

「在美國,60%小商戶都沒有在線預約系統。」Google Assistant瞄準這一痛點,在後台幫用戶完成預約等服務,節省用戶時間。

兩年前的谷歌 I/O 開發者大會上,Google Assistant 第一次亮相。兩年後的今天,據負責谷歌助理和搜索產品設計的副總裁尼克·福克斯(Nick Fox)表示,Google Assistant 已經是谷歌一項非常重要的業務。

圖 | 負責谷歌助理和搜索產品設計的副總裁尼克·福克斯(Nick Fox)

皮查伊同樣表示,這項名為Google Duplex的技術,谷歌內部已研究多年。Duplex翻譯過來,可以叫「語音雙攻技術」。使用這一技術,用戶只要提出需求,Google Assistant就可以直接在後台完成,然後把結果通知給用戶。它將谷歌這些年來各種投資研發項目融會貫通,比如自然語言理解、深度學習、文字和語音轉換等。

而Google Duplex只是Google Assistant升級的一個方面。Google Assistant還對交互聲音進行了全新升級優化,增加了六個新的聲音;支持持續多輪對話,讓對話更加自然;支持多重任務處理,把一句話中的多個任務拆解並完成,比如「把卧室和客廳的空調打開。

目前,谷歌語音助手已經支持全球80個國家和地區,約30種語言,但遺憾的是,全球使用人口數量最多的漢語卻不在其中。


真的等於擁有真人助理?

Google Assistant新功能一經展示,有網友在社交媒體留言稱:「這下真分不清電話對面是人是狗了。」

今年的開發者大會上,Google Assistant力壓Android P,成為皮查伊展示的重頭戲。但皮查伊在開發者大會上展示的demo距離落地還有多遠?Google Assistant是否真的如此驚艷?

有觀點認為,Google Assistant能做到打電話訂餐,其中最難突破的是要「理解一個真人的對話」,即理解自然場景中的對話。因為在現實中,餐廳的接線員並不知道電話那一頭是一個機器人,而是把對方當作真人,兩個真人之間即便是簡單的交流,對機器來說也會是複雜的,語速、口音、省略詞甚至是嘈雜的背景音,可能都會影響機器的識別。

不過,從更多場景的角度上來講,Google Assistant可能還很局限。至少現在,人們不用擔心一個機器人打來的詐騙電話。

人工智慧用戶體驗公司Rokid創始人祝銘明坦言:「小場景有限話題模擬對話不是什麼新鮮事,針對demo優化到流暢也不難,和吹捧的什麼真人對話能力是兩碼事。」

有資深科技評論員認為,谷歌展示的如此智能的語音助手距離落地遙遙無期,但來自語音交互獨角獸思必馳的資深產品架構專家戴中原認為,在特定應用場景,經過大量訓練,實現Google Assistant在demo中展示出的效果並不遙遠,「今年年底國內一些廠家的產品上就可能實現。」

「Google今天所展示的功能,涉及語音識別、自然語言理解和會話管理的三大技術領域,我們內部也已經在研究。Google厲害之處可能在於,別人也能做到的事,它可以比別人做得更快。」

以TTS(Text To Speech,從文本到語音)技術為例,過去採用的是聲音素材拼接的方法,導致拼接出來的句子語調平平,沒有抑揚頓挫和語音語調,自然也感受不到像真人對話一樣的情感情緒。而谷歌旗下的DeepMind訓練出了一個深度神經網路模型WaveNet,採用自然生成的方法,以少量的語料輔以強大的計算,生成原始語音,不僅更貼近真人,而且製作時長也從幾個月降低到幾百小時。

「這一方面的技術我們也早已開始研究,今年下半年預計會推出新場景下的應用。」 戴中原表示。

那麼,這一技術一旦搭載到智能手機等硬體中,是不是等同於每人都擁有了個人真人助理?事情恐怕沒那麼簡單。

戴中原表示,從自然語言訓練的方法角度看,通過充分的數據梳理,藉助機器學習在某個單一領域窮舉各種情況,繼而達到Google在今天所展示的效果尚有可能。但目前沒有公司可以做到全方位理解各種場景。也就是說,Google Assistant所擅長的也是針對特定場景的,例如預訂餐位和理髮。

「谷歌今天所展示的技術並未驚艷到我,但它作為宣傳者,在教育用戶方面的努力是很厲害的。」谷歌推出阿爾法狗,第一次將人工智慧普及到普羅大眾。在戴中原看來,此次谷歌開發者大會,最大的意義依然在於教育用戶。


識別機器打call教你一招

多年前,技術公司們就意識到智能語音互動會成為下一代技術產品最核心的用戶入口。

作為人類與機器交互的方式之一,語音助手在物聯網領域的入口性地位使得其成為兵家必爭之地,亞馬遜、蘋果、谷歌、微軟以及國內BAT相繼推出智能音箱等搭載語音助手的硬體產品。

2014年11月,亞馬遜Echo面市,成了第一個智能音箱的爆款。一組對比大概可以直觀表現出Echo的成功:Echo面市後,兩周內銷量即達100萬。而iPhone用了70天才達到同樣的訂單數。據調查機構此前預計,2017年Echo銷量將突破1100萬台。

圖 | 亞馬遜Echo

察覺到市場變化,谷歌、蘋果和微軟也於兩年後在智能音箱領域逐步有所行動。但相較於早早布局的亞馬遜,谷歌在語音助手方面失了先機。根據市場諮詢公司eMarketer發布的報告,美國智能音箱用戶約70.6%是亞馬遜用戶,谷歌只佔了23.8%。

Google Duplex是否會幫助Google Assistant翻盤,一舉成為中國市場外應用最廣的語音交互產品?

可見的是,谷歌和亞馬遜都在加強自己的音箱產品線。

2017年,谷歌又推出價位分別為40美元和400美元的智能音箱產品Home Mini和Home Max,而亞馬遜也已經推出了價格從40美元到230美元不等的10款音箱產品。

物聯網時代,智能音箱作為較為成熟的交互手段,在現階段承載起人工智慧家居、車載場景入口的厚望。從汽車中控、IoT 再到企業智能客服,語音助手市場上瀰漫著搶佔山頭的硝煙味兒。

Google Assistant 的演示已經在C端吊足了消費者的胃口,人們在期待Google Assistant 帶來更多可能性的同時,也擔憂著由此帶來的電話詐騙等風險的提高。

戴中原表示,這是技術發展造成的矛與盾的問題,但這一困擾也不是沒有辦法解決。「比如你接到推銷保險的人工智慧電話,你可以跳出保險圈子,跟他聊其他方面的事兒。因為目前的人工智慧只能比較好地解決一個場景的對話。」


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 鎂客網 的精彩文章:

鎂客網一周硬科技領域投融資事件匯總(4.9-4.14)
物聯網+區塊鏈的落地,萬加鏈選擇從硬體的「去中心化」開始

TAG:鎂客網 |