在追逐人工智慧技術的道路上,Google 需要你拉它一把
本月初(10 月 5 號),Google 舉行了自己的硬體發布會。除了硬體,整場最大的亮點非 Google Assistant 莫屬。究竟互聯網巨頭自己是怎麼看人工智慧的?又是如何來推進人工智慧的?
BackChannel 作者 Steven Levy 就在採訪了 Google 內部的科學家之後為我們貢獻了一個極度貼近而又鮮活的「視角」。原文標題為《The Google Assistant needs you》。本文為整體編譯,在盡量保持作者原貌的情況下,做了部分刪減。
Google 的科學家認為基於人工智慧的「虛擬私人助理」,將成為「搜索功能」之後最重要的東西。歡迎你加入到這次變革中來。
時間回到 Google 在美國舊金山那場重要硬體發布會的第二天(10 月 5 號,歡迎點擊查看愛范兒當時的相關報道)。在昨天的發布會上, Google 剛剛正式發布了一台新手機 Google Pixel(針對 iPhone)和一個通過語音指令激活的音箱 Google Home(對 Amazon Echo 的一記重擊)。目前來看他們都口碑都很好,對於即將來到的 Pixel 手機評測,已經有人表示出的熱愛。
但在 Google 山景城大本營的一間會議室里,我見到了 Google 內部領導自然語言識別的 Fernando Pereira。他對著些新設備並不像其他人那麼激動,反倒是更期待人們在使用它們之後會產生什麼變化。他對我說:
讓我告訴你一些正在發生的變革。
本文的主要採訪對象:Fernando Pereira
Pereira 在 Google 內部同樣也是「傑出科學家」。2008 年加入 Google 之前,他是賓夕法尼亞大學計算機與信息科學系主任。而他在 Google 一直嘗試解決的核心問題是:「我們應該如何通過數據來了解文字的意思?」換句話說,就是「機器怎樣才能真正理解人類輸入搜索框的文字、又或是語音命令?」
Google 內部以及外部的研究者已經將大體答案確定——通過機器學習(machine learning)。詳細點說,就是利用人工智慧領域的神經網路技術。通過模仿大腦的工作方式來建立一套電腦自我組織系統。這些系統通過複雜的演算法和大量的數據來訓練自己。順其自然的,數據越多效果越好。
Pereira 還告訴我,一旦成千上萬的用戶開始使用擁有 Google Assistant 的新旗艦硬體設備,它的團隊以及其他科學家就會收到數量及其龐大的數據。這,就是他所提及的變革。
並且 Google Assistant 這一獨立的軟體系統還將嵌入 Google 的眾多平台當中,包括 Pixel 手機 和 Google Home 設備。最終的目標是想 Siri 一樣容易控制,同時像 Amazon Alexa 一樣提供服務,同時在聊天上達到「藝妓」的水平,最終再把 Facebook Messenger 中的聊天機器人羞辱一番。
儘管 Google 已經在語音搜索、Google Now 這樣的產品中嵌入了語音命令,但 Google Assistant 跟他們還是略有不同。在 Google 自己眼中,他是回答問題和執行任務的最佳代表。同時,他們還將 Google Assistant 視為旗下眾多軟體的一次升級,包括搜索、地圖、相冊以及 Google Now。之前他們也專門做了幾次演示:「給我看海灘的照片」、「在電視上播放舞曲」、「告訴我今天預定的行程」。Google Assistant 同時還被設置為通過語音、人機交互來完成大部分任務。假如你先問「最近的義大利餐廳在哪裡?」,然後命令 Google Assistant 把你帶到那裡,它就會直接開始指路。
正如有點異樣,Pereira 也非常清楚 Google Assistant 的缺點所在。最令人的沮喪的是,Assistant 目前對複雜任務的理解只是 Google 漫長征程的開始。因為目前 Assistant 在理解用戶方面失敗率還是很高。但 Pereira 還是要讓 Assistant 真正理解人類的命令,從另一個角度來說這也反映出了對複雜的通信以及整個物理世界運作的掌握。
但想要做到上面這兩點肯定很困難,尤其是因為 Google 目前還沒有能夠拿來訓練其神經網路的數據,因此 Assistant 的表現也無法達到他們的期望。Pereira 表示:
當你建造一個理解自然語言的系統,你會發現並沒有很多能夠建立理解的例子。所以你只能自己建立規則,你必須親自教愈發,以便系統能夠理解。這種教學實在太費勁。
不過 Pereira 也將現在詩蔚一個臨界點。在經過公司內部長達 10 年以上的長期學習之後,Google Assistant 現在已經能夠滿足部分想要試用它的消費者。他也相信 Google Assistant 能夠很好的回應消費者所發出的語音指令。
上圖:這次 2016-2017 年的「變革」將把我們的系統從「明面上學習」變成「暗地裡學習」。
這次變革的過程將在這兩天發生。當數以百萬記的人開始通過 Assistant 與 Google 對話,原來無窮無盡的困難也就被分解開來(通過 Google Home,你只能通過對話使用它,因為沒有鍵盤)。Pereira 繼續說到:
你現在已經可以開始做機器學習。你也會因此跑的更快,能夠更快的獲得更深、更廣泛的學習認識。這次 2016-2017 年的「變革」將把我們的系統從「明面上學習」變成「暗地裡學習」。您甚至可以把它當成一次迷你版的「奇點」。
當然,在這兩年變革的過程中,數據的流入並不會停止(在這裡我也需要澄清一點,Pereira 和其他 Google 員工談到的這種轉變是指匯總數據,包括偏好、軌跡、過錯的收集,而不是用戶對話的收集。)。Pereira 認為這會催生出下一個更好的 Google Assistant,然後換來更高的使用率、更多的用戶對話、更多的數據然後再次轉變為更多提升,形成良性循環。
也許再過 10 年,這個良性循環就會最終孕育出一個能夠理解我們說出的任何東西的機器人。
發布 Google Assistant 幾乎和當初 Google 在成立之初發布搜索一樣,在那時候,搜索是個非常棒的東西,但現在,我們對它的理解增加了很多。
我們將把從現在開始 10 年以後的 Google Assistant 和今天的 Google Assistant 做比較。它的影響力將會大很多,幫助實現你的需求的能力也更強,對交談內容的理解也會更透徹,將來源不同的信息整合起來的能力也更強大。
Google CEO 桑德拉·皮猜在本月初發布會上談及 Google Assistant 的照片(來自 Bloomberg)
Pereira 這段話有個先例可供產考。2007 年的時候,Google 開通了一個名為 1–800-GOOG-411 的服務。
在那仿似蒸汽時代仍依賴打電話的日子裡,如果你旋轉電話鍵盤以撥打 411,你會被連接到一個叫做 「信息」 的服務(這個名字現在看來有點怪),並且會有真人接線員聽電話,並告訴你你想要找的人或公司的名字以及地址。然後他/她就會提供相關的電話號碼。從某個時間點開始,電話公司開始針對該項服務進行收費。
但 Google 提供了一項免費且自動化的替代服務,它可以記下你的語音需求並即時把你轉接到你想要聯繫的公司。那時候,這一舉措不是為了討好人或是擴大搜索。Google 其實是在收集龐大的可數字化以及分析的語音數據。
正如 Google 當時其中一位副總裁 Marissa Mayer 解釋道,
我們所聘請的語音識別專家說,『如果你們想我們打造一個真正強悍的語音模型,我們需要大量音素』。音素是由特定聲音,以特定的語調,說出的一個音節……
1–800-GOOG-411 存在的真正目的在於:獲取大量不同的對話樣本,然後我們就可以…… 在我們在嘗試從視頻(或是其它需要語音識別的任務)中將聲音提取出來時,獲得更高的準確率。
三年之後,Google 獲取的語素材料足夠他們開始做語音聽寫了。所以他們停止了該項目。
這次變革也有著一個相似的目的:在不同的情境下為 Google Assistant 收集數百萬(如果不是數億的話)條需求 —— 在路上拿著手機的時候;在家裡使用 Google Home 的時候 —— 為的是公司可以訓練其深度學習神經網路,並最終深刻理解要怎樣才能創造出一個可以明白你需求的機器人,並且還可以和你持續溝通直至需求得到滿足為止。
Google 需要這些,即使在過去 18 年裡已經從搜索收集了大量數據。首先,人們在搜索的時候,並不會以對話的形式和引擎交互。谷歌的一位副總裁 Scott Huffman 曾表示:
人們對搜索的期望非常高。就像,『噢,這裡有個框框。我理應在輸入 2.5 個字之後就會獲得公開信息』。如果你告訴人們他們可以對那個框框隨便說什麼都可以,『打電話給我甜心』,他們的反應應該會是,『什麼情況?我才不要對著框框說這個,永遠都不!
但如果換成了 Google Assistant ,他們應該會更加樂意這樣做,而 Google Assistant 經過機器學習後,現在也懂得應該怎樣去理解「甜心」是什麼,而且也通過打給他/她的電話頻次,以及其它數據來判別出那個人指的是誰。
當人們要求 Google Assistant 做事的時候,其它重要的信息也會出現。Pereira 也用現實中的例子做了進一步解釋:
在搜索記錄中,我們找不到人們要求以下這類事情的記錄,例如:『幫我在 CasCal 訂個兩個人的桌子,晚上七點。』沒有人會對 Google 搜索說這個對不?因為那是個搜索引擎。
事實上,Google 搜索其實是可以實現訂位,但還是會有例外:一般情況下,Google 搜索可以向你提供答案,但不能夠落地完成。因此人們是不會要求它去做事情的,因此 Google 無法獲取與協助性相關的數據。
直到現在,我們才正開始獲取足夠的流量和互動,以開始探尋我們怎樣才能夠使得(一個助手)成長以及變得更厲害,更通用,更靈活。這將是一段很長的路,從由搜索引擎為代表的信息層面去到實現層面 —— 成為無處不在的助手。
Fernando Pereira,圖片來自 Talia Herman
Google Assistant 首次亮相於公司今年 9 月發布的 「智能」 通訊 app,名為 Allo;到現在伴隨著 Pixel 手機才獲得了大量關注。(Google Home 將於 11 月 4 日 出貨)評論稱, Google Assistant 理解任務以及操作任務的能力都比蘋果的 Siri 強。
它的短期記憶使得它可以保留部分信息,所以如果當你問了附近有什麼電影看,要完成購票動作,你可以通過說 「幫我買《會計師》(The Accountant)的電影票,要下午四點的」 來完成,而 Google Assistant 也會知道你所指的電影院是哪家。但如果想要通過提出一個合理的需求來揭露 Google Assistant 對世界理解的膚淺的話,也並不困難。
Huffman 是一位經驗豐富的搜索執行官,現負責 Google Assistant 的發展,向大家提供了一個例子。現在,如果你讓 Google Assistant 在就近墨西哥餐廳訂個位置的話,它的表現不會讓人失望。但如果你要求它在 「我的其中一個老地方」 訂位的話,這實際上是一個無法完成的難題。與其瞎猜,Assistant 會直接跟你說:
對不起,我真的幫不上忙。
通過這個例子,你一定會覺得 Google 助手太差勁了。可是 Google 不是這麼認為的,他們反而把這些視作一個機會,是一個「變革」。
Google 助手每一次向用戶說出「Sorry」,都是給那些遠在山景城的研究人員一次提醒,同時也是一次被記錄的數據點。當相同的數據點積累到一定程度時,就是研發人員該做些什麼去調整或改變的時候了。
像是上文提到的「經常去的地方」,就是讓研究人員改進助手的提示,幫助助手理解這一概念並加入其網路的人造神經元中。具體怎麼改進呢?Huffman 解釋道:
我們會先從人們經常訪問的地方入手,然後會做出一些限制和過濾,以便我們定義「經常」這個概念。接下來工程師就會對定義了的概念進行測試,例如,過去六個月內訪問超過三次的位置,而且車程不超過 10 分鐘。
不過這些都是打比方,制定一個定義規則很重要,這樣就可以進行接下來的機器學習步驟。
所以如果現在你想去第三街的 Joe』s Diner 吃飯,它會說你六個月都沒去過了那兒了,你一定不會喜歡的,去試試 Suzy』s Diner 吧,很不錯的。接下來就可以開發一個自己的機器學習完全模型了。Pereira 又繼續說到:
一旦這種情況發生,Google 的神經網路就能達到跨越式的進步,那麼公司網路中非結構化數據,以及現有的龐大資料庫也能夠被全面地利用起來(Google擁有一個超700億信息的資料庫),就能為用戶更好地解釋這些地方或事物的意思。
由此,Google Assistant 就能藉助來自四面八方的數據來完成更加複雜的任務。
Google 用這樣的一個例子來為我們描繪了這一夢想藍圖:
如果你家裡有熱水器壞了需要更換,需要先為用戶找到一款合適的熱水器,這之中就包括衡量定價、綜合用戶反饋數據,接著下訂單購買,最後聯繫安裝人員,並為用戶安排一個滿意的安裝時間。
現在要完成這個任務,還需要使用常識、消息和一系列在線目錄來組合不同的信息碎片。不過在 Google 的想像中,一旦升級版的 Google Assistant 開發完成,發現了熱水器故障,你只需要依靠那個簡單小巧的 Google Home,跟它說一句「OK,Google!」,說明一下情況,接下來只需要玩兒自己的,它都能幫你搞定。正如 Pereira 所說:
有關熱水器、性能參數、安裝日程安排等一切的信息都在電腦文件上,雖然我們還無法到達那個地步,但這是我們對Google助手最完美的願景。
如果用戶和 Google 助手不怎麼保持交流,那麼以上都是空談,只有良好的聯繫才足以使助手不斷改進,推動它向前發展。最後,Huffman 說道:
現在最大的挑戰就是需要充足的對話數據,我們得不斷說服用戶和助手進行對話。很顯然,我們的確還不夠完美,但是有努力讓用戶保持溝通的信心,這可以讓我們做的更好。
轉變還需要等待,不過,先來一句「OK,Google!」和助手聊聊天吧。
註:本文由李賡、文敏柔、方嘉文共同編譯。
※亞馬遜 CEO 貝索斯:太空即將進入一個黃金時代
※中國長征火箭公司揭牌,太空旅遊、「拼」火箭運貨都能實現了
※中國成全球最大 iOS 營收市場/Android Pay 登陸香港/亞馬遜的蘋果配件 90% 是假貨
※《黑鏡》主創談論第三季劇情:有些故事更為樂觀,但整體的黑暗風格不會改變
※PS VR 首發遊戲《Wayward Sky》:虛擬世界裡的一場輕鬆冒險
TAG:愛范兒 |
※Mrs. T | 在追逐野心的道路上,你要战胜的只有自己
※Facebook在人工智慧的道路上走了多遠?
※無人駕駛汽車讓道路更擁堵?Hyperlane可解決這一問題
※Burberry 的未來會怎樣?堅持做一個高端奢侈品牌,還是踏上輕奢的道路?
※給你一份Sneaker趨勢分析,讓你在潮流的道路上順利「吃雞」!
※黑客才是無人駕駛道路上的最大阻礙——AI Daily
※和iPhone很像的一加手機也是走了一條不平凡的道路
※Angelababy開走自黑道路,雙下巴真有這麼難去么?
※看看鋒友們是怎麼走上用iPad Pro學習畫畫的道路的
※安心了,iPhone老款全面大降價,為iPhoneX的銷售讓開道路!
※李宇春走上設計道路,楊冪美腿Bling Bling,她們的秘訣芭姐一次全奉上!
※NVIDIA推出用於視頻分析的Metropolis端到雲平台,為人工智慧城市建設鋪平道路
※突發!Hurstville道路被淹沒!目前道路被封!下班高峰期的朋友要注意了!
※Wanna:WannaOne不尋常的出道路 化妝品海報熱銷+雜誌供不應求
※瑞銀報告:iPhone將為蘋果AR眼鏡iGlass鋪平道路
※格鬥遊戲如何自救 《Brawlhalla》走上的非硬核格鬥道路
※發力企業級市場,微軟Hololens開闢了一條VR新道路
※Snapchat的人生道路真坎坷:AR藝術網站被黑、藝術家抵制
※Google地圖再加新功能 道路流量實時監控