當前位置:
首頁 > 最新 > 谷歌助手點餐,微軟小娜下單:AI 橫行的未來世界裡,沒有人類什麼事

谷歌助手點餐,微軟小娜下單:AI 橫行的未來世界裡,沒有人類什麼事

本文首發於百家號

原創文章未經授權請勿轉載

航通社(ID:lifeissohappy)

微博@lishuhang

國內用戶基本上已經熟悉了在手機上下單訂餐。不過很多美國人依然習慣直接給餐廳打電話訂位或訂餐。

不過,如果有人對自己的手機說,想吃什麼地方的什麼菜,這個手機能夠代替你,自動給餐廳打一個電話,用電腦合成的語音跟餐廳服務員點餐,那該是何等令人驚悚的景象呢?

這個時候如果我告訴你,餐廳接電話的服務員也是一個機器人,只要兩個機器人之間語音通話,就能把餐送到你的面前,你這個時候又會怎麼想呢?

1 |谷歌替用戶點餐

當地時間 5 月 8 日,2018 年穀歌 I/O 開發者大會在谷歌園區召開,會上演示的最驚悚的一項技術,大概就是使用谷歌助手(Google Assistant)生成一段就像真人一樣打電話的語音。

這個 AI 助手能夠用自動生成的語音與真人理髮店店員,或快餐廳接線員進行對話。甚至,谷歌助手還在對話中展現出了強大的糾錯能力。

圖 / Google

在後一個演示的例子中,接線員英文不太好,沒有聽懂谷歌助手的訴求,對話過程是零散而混亂的。然而接線員的每一次理解失誤,都能夠被谷歌助手一一發現並糾正。

谷歌助手:我想定一個位置,在下周三,7 號。

餐廳接線員:7 個人嗎?

谷歌助手:4 個人。

餐廳接線員:4 個人的話,哪一天,今晚還是明晚?

谷歌助手:下周三。

親自負責演示的谷歌 CEO 桑達爾·皮查伊(Sundar Pichai)說:「令人驚訝的是,谷歌助手能夠理解對話里的細節之處。」

皮查伊將這一融合了語音-文字互轉、語義理解、深度學習三大技術的功能稱為「Google Duplex」(Duplex 有電信技術中的「雙工傳輸」之意),計劃今年夏天提供給谷歌助手用戶測試。

2 |小娜做餐廳員工

無獨有偶,航通社(ID:lifeissohappy)曾在2016年11月參加過微軟中國的一次技術交流會,微軟展示的一個技術原型,則是讓店員和顧客之間的對話過程轉換為文字,同時即時抽取出菜單細節。

在一家麥當勞「得來速」(Drive Thru)汽車餐廳(司機不用下車即可點餐),服務員與顧客之間的對話,立即被語音識別轉換成精準的文字,並且通過 AI 運算提取了客戶描述的關鍵信息,不需服務員操作即可自動生成訂單。

圖 / 航通社(ID:lifeissohappy)

顧客:我想要兩份快樂兒童餐,一個是吉士漢堡的,一個是雞米花的,這倆都要加薯條和蘋果片,一個配巧克力牛奶,另一個配小橙汁。

系統訂單:1 快樂兒童餐(主食:吉士漢堡包,小食:薯條、蘋果片,飲料:巧克力牛奶)+ 1 快樂兒童餐(主食:雞米花,小食:薯條、蘋果片,飲料:橙汁)

服務員:嗯。

顧客:再來單點兩個吉士漢堡,這倆都不要洋蔥,其中一個也不要番茄醬。

系統訂單:1 快樂兒童餐(主食:吉士漢堡包,小食:薯條、蘋果片,飲料:巧克力牛奶)+ 1 快樂兒童餐(主食:雞米花,小食:薯條、蘋果片,飲料:橙汁)+ 1 吉士漢堡包(特殊要求:不要洋蔥)+ 1 吉士漢堡包(特殊要求:不要洋蔥,不要番茄醬)

顧客:還有……一個薯條,一杯大杯咖啡,要兩個咖啡伴侶,三包糖。

系統訂單:1 快樂兒童餐(主食:吉士漢堡包,小食:薯條、蘋果片,飲料:巧克力牛奶)+ 1 快樂兒童餐(主食:雞米花,小食:薯條、蘋果片,飲料:橙汁)+ 1 吉士漢堡包(特殊要求:不要洋蔥)+ 1 吉士漢堡包(特殊要求:不要洋蔥,不要番茄醬)+ 1 薯條(尺寸:大)+ 1 咖啡(尺寸:大,特殊要求:2 植脂末,3 糖包)

服務員:好的,謝謝。

在屏幕左側生成對話語音轉文字記錄的同時,屏幕右側結構化提取的訂單信息也在即時改變。

如果顧客臨時新增或修改了對某個產品的要求,那麼也會把結果及時的顯示在屏幕上。服務員不需要按動手指去選擇所點的產品,就可以生成一份訂單。

當語音合成技術足夠成熟之後,像案例中這位人工服務員跟顧客交互的過程,就可以轉換為電腦語音實現。這樣,一家無人值守的麥當勞汽車餐廳就初具雛形了。

而更值得注意的是,這段演示的技術是 2016 年就已經達到的水平。

3 |除了生產,消費也將由 AI 代勞?

很顯然,如果把自動詢問和自動應答的方式結合起來,那麼不僅點餐員可以由機器取代,就連去點餐的顧客這個角色,也有語音助手來取代了。

當谷歌助手所代表的顧客,向微軟小娜(準確的說法是 Bot Framework)所代表的店家來點餐的,就會出現這樣一幅無比戲劇性的場面:

一個機器人向另外一個機器人點餐,最終把點好的餐送給主人。

——在整個過程當中,沒有人類什麼事情。

兩個例子之間僅僅相隔 2 年多,語音助手的巨大進步令人吃驚。其中,最值得注意的突破,自然就是讓助手記住上下文,進行連貫的,首尾相關的對話。

到現在,谷歌助手所演示的對話已經難以和真人在同一場景下能說的話區分。

或許今後唯一能夠區分的線索就是,機器所生成的對話非常完美,不會有任何的停頓與錯別字之類的東西,就像念稿子一樣,完整而不間斷的準確表達。

但我相信,如果人類想要的話,讓機器再附加上一些人類才有的中斷,卡殼現象也是不難的。

實際上,一旦 AI 理解了一個來自主人的訂單需求之後,將其標準化,並直接使用數字表單的方式提交訂單,當然是更簡便,也更容易被機器理解的做法。似乎把它轉換成語音實在是多此一舉。

不過這種技術目前還是有一定用武之地的,主要是因為不能期望所有飯館和小商販,都有可適配的在線訂餐系統,也許只是打電話給一個路邊攤什麼的,總還是需要與真正的人類打交道。

但是比起實用價值,無論如何都不能抹殺的,是這種語音交互所體現出來的強烈的符號意義。

機器人和機器人之間的交流,摒棄了任何人類的從中參與。而沒有人類的參與,也就同時意味著,這當中的任何一個過程都不由人類來創造價值。

根據樸素的「多勞多得,按勞分配」的理念,如果不能為社會創造價值,一般來說,又沒有什麼理財或經營手段的話,人們就會沒有收入來源,因而陷入貧困。

傳統意義上,拯救這些窮人的方法,是讓他們達到所謂的「自食其力」。然而,越是最基層的工作,就越會加速由機器人替代。

其實,機器人替代人類勞動之後,最大的問題,並不是人類不能工作了,而是生產出來的東西,沒有那麼多的家庭買得起,消費得起了。

也就是說,在消費者是誰這個問題上產生了麻煩。做出來的東西大家都享受不起,而唯一能享受的只有機器人。

最終,可能如同佔有生產資料的資本家和普通老百姓之間的差異一樣,是不是買得起一個機器人,或者簡單點,買得起幫自己提高生產力的 AI 程序,一開始只是個小小的差異,最終卻可能影響到不同人和家庭的社會分層。

機器人替我們說話,幫我們跑腿,他們為什麼不能得到應有的回報,非要把勞動成果拱手讓人呢?

而由這些機器人平白無故創造出來的財富,是理應屬於它的所有者,還是屬於溢出的剩餘價值,要合理分配給社會大眾呢?

這都是人們將不得不思考的問題。

谷歌和微軟分別進行的兩項技術測試,只是在告訴人類的倫理學家和政策制定者們,留給他們思考的時間不太多了。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 航通社 的精彩文章:

內涵段子的死因不只有低俗

TAG:航通社 |