當前位置:
首頁 > 最新 > 少了AI First那類口號的谷歌I/O大會,似乎也少了行業風向標式的新意

少了AI First那類口號的谷歌I/O大會,似乎也少了行業風向標式的新意

AI 繼續滲透到既有產品方陣中,不乏精彩亮點,對於中國用戶來說,更多的是似曾相識。如何讓人機對話更加流暢自然,以及軟硬生態的搭建,仍是重頭戲。

撰文 | 編輯部

「人們對有用信息的獲取需求,與 20 年前谷歌成立時一樣緊迫。」谷歌 CEO 桑德爾·皮查伊說,「但最重要的改變在於,我們組織信息和解決世界的複雜現實問題的能力,而這要歸功於人工智慧技術。」

在去年大會主題「Mobile first to AI first」之下,AI 是 I/O 的絕對主角,現場大約要聽到上百次 AI 。今年,AI 不再是一個單獨強調的方向,伴隨 AI 技術深度滲透到谷歌旗下所有產品並逐步布局到雲端向外輸出,谷歌要讓 AI 影響每個人。

「我們正處於計算的一個重要轉折點,推動技術向前是 令人興奮的。很明顯,技術是可以是一種積極的力量,可以提高全世界數十億人的生活質量。」桑德爾·皮查伊說。

不過,願景之下,超過 7000 名開發者在現場所能聽到可稱為行業「風向標」的亮點卻不算太多,反而越發感覺到巨頭們在 AI 商業化上從產品到路徑上的趨同。

顯然,谷歌相當看好 AI 在醫療領域的應用

拿漢堡 emoji 調侃之後,桑德爾·皮查伊用醫療應用作為開場重點,某種程度上也呼應了他所提及推進 AI 技術最終要改變更多人的生活質量。

兩年前,谷歌開發了一種深度學習演算法,可以通過眼部醫學影像檢測到糖尿病引發視網膜病變的癥狀。今年二月,人工智慧團隊又成功利用機器學習來預測病人心臟病發作或中風的風險。

「而且準確度高得驚人。」桑德爾·皮查伊說。

他還介紹了一項最新研究,谷歌用深度學習模型分析識別健康檔案的信息進行大量與病人相關的預測。技術上值得一提的是,谷歌能夠使用原始數據,不需要人工提取、清潔、轉換病歷中的相關變數。

從實際應用來看,這相當於可以幫助醫院進行更精確的病人管理,比如病人重新入院和住院時間等。

谷歌還把機器學習應用在莫爾斯密碼設備上,殘疾人士可以用演算法鍵盤 Gboard 輸入摩爾斯碼重新獲得語言交流的能力。

谷歌發了一款帶屏的智能硬體……

兩年前的谷歌I/O大會上宣布 Google Assistant 的願景,今年它已經被部署在超過 5 億台設備上,覆蓋 5000 種不同設備,汽車品牌就有 40 多個。

而下一階段的目標,則是進一步優化助手式服務,讓它能在視覺能力輔助下用更自然的對話方式幫助用戶完成更多事情。

桑德爾·皮查伊在 Keynote 中展示了語言交互的重要性,並正式介紹了一種進行自然語言對話的新技術 Google Duplex。這種技術旨在完成預約等特定任務,並使系統儘可能自然流暢地實現對話,使用戶能像與人對話那樣便捷。

比如,你不需要再重複說「Hey,Google」,它就能理解每一個後續需求;當你在和別人交談時,它也會理解你的意思並作出相應的反應。

Google Assistant 新增的6 種語音,背後也有 DeepMind 的身影。

2016 年 9 月,DeepMind 公布了其在語音合成領域的最新成果 WaveNet,這是一種原始音頻波形深度生成模型,能夠模仿人類的聲音,生成的原始音頻質量優於目前常用的語音合成方法。

不過,當時這個模型還只處於雛形階段,對於消費級產品而言,模型的計算消耗量太大。經過 12 個月的努力,DeepMind 大大提升了模型運行的速度和質量並推出 WaveNet 的更新版本,可以在所有平台上生成美式英語和日語的 Google Assistant 語音。

為了讓對話更自然,Google Assistant 還多了「multiple actions」的本事,意思即可以在同一句說話內容之內,可以包括多個要向 Google Assistant 下達的指令,像是「告訴我紐約市和舊金山的天氣」或「關燈和打開微波爐」。

如何自然持續性對話,正是當下語音助手研究的難點和熱點。

前不久,亞馬遜推出了三個針對 Alexa 的改進方案(上下文轉攜、記憶提醒和搜索執行),並表示要在 5 月底之前實現這些功能。其中一個非常重要的功能就叫做「context carryover」(上下文轉攜):當語音請求從一個轉向另外一個時,Alexa 可以「回憶」起之前的信息。也就是說,當用戶連續問幾個問題時,不需要在第二次發問時重複同一個信息點。

如今,亞馬遜 Alexa 的 Skills 數量也已經超過 2.7 萬項。而 Google Assistants 支持的 Actions 數量已經超過 100 萬。

今天的大會上,Google Assistant 越發像一位真助理了,可以預約做頭髮、預定餐廳等任務。而在此之前,Google Assistant已經可以用語音來向好友收付款,還會訂電影票。

在語言方面,Google Assistant 將會「學會」印度語、泰語、印尼語、丹麥語、挪威語、瑞典語及荷蘭語等語言,並支持這些語言背景下的 Actions 開發工作;到今年年底 ,Google Assistant 支持的語言更是將會攀升至 30 多種。

最後,平常和語音助手對話一般只用 Hey Google 發命令,但這樣會讓小孩學不到有禮貌的語音習慣,怎麼辦呢?谷歌這次特別推出新功能,讓語音助手理解對話中的敬語。

在 Google Assistant 的生態搭建上,基於家庭場景下的遊戲、活動等應用方向,谷歌也開拓了很多內容合作夥伴,比如迪士尼。僅在過去兩個月,家庭用戶就聽了超過 13 萬小時的兒童故事。

而硬體上,當一個帶屏幕的智能顯示器出場,瞬間又「齣戲」想起了亞馬遜的 Echo Show 和百度的小度在家。當然,谷歌並沒有稱它為智能音箱。

不過,在 Google 的設想里,智能顯示器的使用場景也是在家裡,用戶主要通過語音來實現指令,比如找菜譜、控制智能家居設備(沒錯, 我們也看到了 Nest )、在 YouTube 上看直播、和家人進行遠程視頻通話等,當然其中也集成了所有谷歌在其他終端提供的基本服務。

據說,第一批產品會在 7 月份開始銷售。

AI 繼續滲透到谷歌產品

首當其衝的,自然是最近改版的GMail。

自從 2004 年 Gmail 上線以來,就只有在 2011 年時進行過一次大改版,之後雖然不時地增添一點小東西,但界面本質上並沒有太大的變動,如果有新功能的話,Google 也是先在 Inbox 推出居多。

大會上,我們看到Gmail 又引入機器學習能力,帶來了一個名為 Smart Compose (智能創作)的新功能。Gmail可以根據收件人、郵件主題、幾個內容關鍵字等簡單因素,直接替你寫郵件。當你輸入內容的時候,Gmail會智能預測你接下來要說的話,替你補完。如果覺得合適,你可以直接按下Tab鍵,根據建議內容完成一句話。它設置會根據郵件內容,建議會議或會面的地址、時間。該功能會在本月開放給Gmail用戶。

GIF

除了 Google Assistant ,代表谷歌計算機視覺服務的 Google Lens 也公布了不斷演進的新功能。

Google Lens 並不是一個硬體,而是一個可以根據圖片或拍照識別出文本和物體的軟體內部功能,能實時分析圖像並迅速共享信息。

通過 Google Lens 的技術,系統可以判斷相機鏡頭對著的影像信息內容。

比如對著傳單上的 Email ,會自動在手機上顯示問你是要創建聯繫人、傳送信件或只是單純複製文字。Google Lens 還可以判斷藝術作品、唱片或者書本封面信息,快速幫你搜索出相關信息。剛到一個新城市旅遊的 Google Lens 用戶,只需要用手機攝像頭環掃四周,就再也不怕地圖導航指錯路了。

今年大會展示的新技能里,還包括拍照片自動識別圖片中的建築物。

另外還有一個大多數中國用戶都很熟悉的應用:拍下美美衣服,系統會自動彈出網購渠道。沒錯,這儼然是中國的「拍立淘」。

相冊還自帶調色功能,融合了很多專業圖片處理軟體的功能。但是,當Pichai 的PPT上顯示出一張黑白老照片時,騰訊優圖實驗室可能會笑出來。

今年過年期間,騰訊優圖實驗室就推出過類似的應用:老照片還原技術。效果是這樣的:

由於黑白照片已經完全損失了最重要的色彩信息,利用人工智慧演算法,可以在對照片進行圖像分割,區分出標誌性物體後,利用標誌性物體的圖像中的語義信息填充顏色。

比如,一個訓練良好的神經網路模型,可以很輕易地識別出圖像中的各種語義元素,如天空、草地、建築、人臉等,而且神經網路本身也可以自動記憶,如天空為藍色,草地為綠色,人臉為膚色等。

再次,當谷歌拿出使用機器學習演算法的 Google News 應用之後,又出現了「今日頭條」的既視感。系統推送的新聞內容具有三個主要特點:

首先,它會讓你與自己關注的新聞同步;

其次,為了避免一葉障目的問題,系統會就你感興趣的新聞提供多渠道、多角度的報道內容,並借用機器學習技術標註出新聞源的價值所在處。

最後,不斷增加與你所喜愛的傳統報業媒體合作。

Andriod P 來了

「 Android P 是 Google 將移動和人工智慧整合的重要支柱。」Android 工程主管 Dave Burke 在發布Android P 時說道,「智能手機應該更聰明,它應該向用戶學習並適應你。」

更聰明的一項改變是,用 AI 來管理電池壽命——自適應電池管理以及自適應亮度調節, DeepMind 提供了技術支持。

具體來說,自適應電池管理系統通過機器學習預測用戶即將使用的應用程序,提供更可靠的電池體驗。在應用程序被喚醒時, CPU 的耗電量能夠降低 30%。

稍等一下,有沒有感覺很熟悉?

沒錯,華為 Matte 10 內置麒麟 970 AI 晶元,而這款手機之所以能被稱為「續航王」,也是因為它能根據用戶使用習慣建模,利用機器學習預測用戶使用行為,分配相應的手機資源。

而對於 DeepMind 來說,利用機器學習技術省電已經不是第一次了,阿爾法狗最初的商用方式就是給數據中心省電。但是,針對移動終端,這還是第一次。

自動駕駛?Waymo 沒有帶來多少驚喜

谷歌把最後亮相的時間交給了 Alphabet 旗下自動駕駛明星公司 Waymo,然而,也僅僅來了一次走過場式的演講。

身著綠色上衣、牛仔褲的 Waymo CEO John Krafcik ,上台簡單科普了公司的無人車「追夢」史,並再次預告了今年將上線自主品牌的共享出行服務 passenger-pickup ,鳳凰城是第一站。很顯然,這樣的場合也不會刻意提及前些日子的事故。

通過視頻展示,我們看到了鳳凰城的部分居民參與其 EarlyRider 項目的場景,這是一個 Waymo 自動駕駛技術的體驗項目。

另一位公司成員講述了 Waymo 如何使用 Google 的機器學習演算法讓這位「司機」更聰明。

其中,一張圖片讓與會人士驚訝不已。

沒有使用機器學習之前,汽車看到的雪景中的道路和汽車是這樣的:

使用機器學習後,是這樣的:

如今,Alphabet 已經成為一家年營收超過千億的公司。上一季度財報顯示,谷歌最賺錢的業務依舊是廣告,儘管谷歌雄心勃勃地做自己的硬體。桑德爾·皮查伊曾於去年表示,接下來五年,硬體業務會成為公司財務的一大爆發亮點。

而這個突破點,或許就是 Waymo 。

機器之能開年對話

8位AI行業局內人講述對過去、對未來的看法

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之能 的精彩文章:

這家活躍投資人達2萬名的AI投融資平台,優勢與挑戰是同樣的東西
特斯拉迎來強勁對手!Waymo剛剛發布全球首輛全自動駕駛電動汽車I-PACE

TAG:機器之能 |