少了AI First那類口號的谷歌I/O大會，似乎也少了行業風向標式的新意

最新 05-09

AI 繼續滲透到既有產品方陣中，不乏精彩亮點，對於中國用戶來說，更多的是似曾相識。如何讓人機對話更加流暢自然，以及軟硬生態的搭建，仍是重頭戲。

撰文 | 編輯部

「人們對有用信息的獲取需求，與 20 年前谷歌成立時一樣緊迫。」谷歌 CEO 桑德爾·皮查伊說，「但最重要的改變在於，我們組織信息和解決世界的複雜現實問題的能力，而這要歸功於人工智慧技術。」

在去年大會主題「Mobile first to AI first」之下，AI 是 I/O 的絕對主角，現場大約要聽到上百次 AI 。今年，AI 不再是一個單獨強調的方向，伴隨 AI 技術深度滲透到谷歌旗下所有產品並逐步布局到雲端向外輸出，谷歌要讓 AI 影響每個人。

「我們正處於計算的一個重要轉折點，推動技術向前是令人興奮的。很明顯，技術是可以是一種積極的力量，可以提高全世界數十億人的生活質量。」桑德爾·皮查伊說。

不過，願景之下，超過 7000 名開發者在現場所能聽到可稱為行業「風向標」的亮點卻不算太多，反而越發感覺到巨頭們在 AI 商業化上從產品到路徑上的趨同。

顯然，谷歌相當看好 AI 在醫療領域的應用

拿漢堡 emoji 調侃之後，桑德爾·皮查伊用醫療應用作為開場重點，某種程度上也呼應了他所提及推進 AI 技術最終要改變更多人的生活質量。

兩年前，谷歌開發了一種深度學習演算法，可以通過眼部醫學影像檢測到糖尿病引發視網膜病變的癥狀。今年二月，人工智慧團隊又成功利用機器學習來預測病人心臟病發作或中風的風險。

「而且準確度高得驚人。」桑德爾·皮查伊說。

他還介紹了一項最新研究，谷歌用深度學習模型分析識別健康檔案的信息進行大量與病人相關的預測。技術上值得一提的是，谷歌能夠使用原始數據，不需要人工提取、清潔、轉換病歷中的相關變數。

從實際應用來看，這相當於可以幫助醫院進行更精確的病人管理，比如病人重新入院和住院時間等。

谷歌還把機器學習應用在莫爾斯密碼設備上，殘疾人士可以用演算法鍵盤 Gboard 輸入摩爾斯碼重新獲得語言交流的能力。

谷歌發了一款帶屏的智能硬體……

兩年前的谷歌I/O大會上宣布 Google Assistant 的願景，今年它已經被部署在超過 5 億台設備上，覆蓋 5000 種不同設備，汽車品牌就有 40 多個。

而下一階段的目標，則是進一步優化助手式服務，讓它能在視覺能力輔助下用更自然的對話方式幫助用戶完成更多事情。

桑德爾·皮查伊在 Keynote 中展示了語言交互的重要性，並正式介紹了一種進行自然語言對話的新技術 Google Duplex。這種技術旨在完成預約等特定任務，並使系統儘可能自然流暢地實現對話，使用戶能像與人對話那樣便捷。

比如，你不需要再重複說「Hey,Google」，它就能理解每一個後續需求；當你在和別人交談時，它也會理解你的意思並作出相應的反應。

Google Assistant 新增的6 種語音，背後也有 DeepMind 的身影。

2016 年 9 月，DeepMind 公布了其在語音合成領域的最新成果 WaveNet，這是一種原始音頻波形深度生成模型，能夠模仿人類的聲音，生成的原始音頻質量優於目前常用的語音合成方法。

不過，當時這個模型還只處於雛形階段，對於消費級產品而言，模型的計算消耗量太大。經過 12 個月的努力，DeepMind 大大提升了模型運行的速度和質量並推出 WaveNet 的更新版本，可以在所有平台上生成美式英語和日語的 Google Assistant 語音。

為了讓對話更自然，Google Assistant 還多了「multiple actions」的本事，意思即可以在同一句說話內容之內，可以包括多個要向 Google Assistant 下達的指令，像是「告訴我紐約市和舊金山的天氣」或「關燈和打開微波爐」。

如何自然持續性對話，正是當下語音助手研究的難點和熱點。

前不久，亞馬遜推出了三個針對 Alexa 的改進方案（上下文轉攜、記憶提醒和搜索執行），並表示要在 5 月底之前實現這些功能。其中一個非常重要的功能就叫做「context carryover」（上下文轉攜）：當語音請求從一個轉向另外一個時，Alexa 可以「回憶」起之前的信息。也就是說，當用戶連續問幾個問題時，不需要在第二次發問時重複同一個信息點。

如今，亞馬遜 Alexa 的 Skills 數量也已經超過 2.7 萬項。而 Google Assistants 支持的 Actions 數量已經超過 100 萬。

今天的大會上，Google Assistant 越發像一位真助理了，可以預約做頭髮、預定餐廳等任務。而在此之前，Google Assistant已經可以用語音來向好友收付款，還會訂電影票。

在語言方面，Google Assistant 將會「學會」印度語、泰語、印尼語、丹麥語、挪威語、瑞典語及荷蘭語等語言，並支持這些語言背景下的 Actions 開發工作；到今年年底，Google Assistant 支持的語言更是將會攀升至 30 多種。

最後，平常和語音助手對話一般只用 Hey Google 發命令，但這樣會讓小孩學不到有禮貌的語音習慣，怎麼辦呢？谷歌這次特別推出新功能，讓語音助手理解對話中的敬語。

在 Google Assistant 的生態搭建上，基於家庭場景下的遊戲、活動等應用方向，谷歌也開拓了很多內容合作夥伴，比如迪士尼。僅在過去兩個月，家庭用戶就聽了超過 13 萬小時的兒童故事。

而硬體上，當一個帶屏幕的智能顯示器出場，瞬間又「齣戲」想起了亞馬遜的 Echo Show 和百度的小度在家。當然，谷歌並沒有稱它為智能音箱。

不過，在 Google 的設想里，智能顯示器的使用場景也是在家裡，用戶主要通過語音來實現指令，比如找菜譜、控制智能家居設備（沒錯，我們也看到了 Nest ）、在 YouTube 上看直播、和家人進行遠程視頻通話等，當然其中也集成了所有谷歌在其他終端提供的基本服務。

據說，第一批產品會在 7 月份開始銷售。

AI 繼續滲透到谷歌產品

首當其衝的，自然是最近改版的GMail。

自從 2004 年 Gmail 上線以來，就只有在 2011 年時進行過一次大改版，之後雖然不時地增添一點小東西，但界面本質上並沒有太大的變動，如果有新功能的話，Google 也是先在 Inbox 推出居多。

大會上，我們看到Gmail 又引入機器學習能力，帶來了一個名為 Smart Compose (智能創作)的新功能。Gmail可以根據收件人、郵件主題、幾個內容關鍵字等簡單因素，直接替你寫郵件。當你輸入內容的時候，Gmail會智能預測你接下來要說的話，替你補完。如果覺得合適，你可以直接按下Tab鍵，根據建議內容完成一句話。它設置會根據郵件內容，建議會議或會面的地址、時間。該功能會在本月開放給Gmail用戶。

GIF