谷歌CEO Pichai:希望AI從根本上改變每一台設備的本質
撰寫| 微胖
「谷歌不僅僅要將 AI 功能融入每一款產品,而是要在 AI 的啟發下去打造產品。沒有 AI,相應的產品也無法想像。」谷歌 CEO Pichai 在谷歌硬體發布會期間接受媒體採訪時說道。
今天凌晨(北京時間),谷歌在加州舉辦活動,推出新手機 Google Pixel 2(以及 XL)、新智能音箱 Google Home Mini(以及 Max)、新無線藍牙耳機、新 Chromebook 等全新硬體產品。
谷歌一直善於巧用 AI 解決一些其他廠商訴諸硬體才能解決的問題。本次發布會上的 Dual-Pixel 技術,再次展示出谷歌的精巧心思。
當前熱門的「人像模式」的主流解決方案需要雙攝像頭。Google Pixel 2 單攝像頭即可處理景深信息,拍出不輸雙攝的人像模式。在 Dual-Pixel 幫助下,像素點由左右兩個子像素組成,一個記錄顏色,另一個記錄景深,機器學習演算法配合多張照片合成後,即可實現背景虛化的效果。Pixel 2/2 XL 用單鏡頭實現了雙攝功能,可謂「四兩撥千斤」。
一、Clips:真正的谷歌 AI 之道
不過在 Pichai 看來,本次發布會首次推出的 Clips 最能體現谷歌的硬體 AI 之道。
Google Clips 是谷歌推出的一款新相機。內部人工智慧引擎會引導相機尋找它感覺有趣的東西:微笑、你關心的人、追逐尾巴的狗,並自動捕捉這一刻。隨著時間的推移,這款相機會更加智能化。小巧相機幾乎可以夾在任何東西上,完成許多角度的拍攝。照片和視頻可以被單獨保存到谷歌相冊中。
谷歌不僅僅要將 AI 功能融入每一款產品,而是要在 AI 的啟發下去打造產品,沒有 AI,相應的產品也無法想像。Clips 可謂適例,它以新的方式重新定義攝影,利用谷歌技術完成了許多不同任務:面部識別、識別「不好」的照片和有趣的內容。
「我有意給一款硬體產品起了個軟體名字,因為這款產品更加激動人心的部分是機器學習,幕後的計算機視覺任務。」Pichai 說。它也是 Pichai 希望谷歌能涉及更多的產品範例。
製造硬體並不僅僅是為了賣產品,也是在學習掌握硬體如何融入 AI。「如果不能『軟硬兼施』地去思考這些東西,很難將計算技術推向未來。」Pichai 表示。每一款硬體產品,也可以說是「如何利用 AI 反思我們的產品」。他不想讓 AI 停留在某個新增功能的層面,而是希望 AI 從根本上改變每一台設備的本質。
值得一提的是,谷歌特意將這款相機設計成完全在本地執行任務,內容不會被送往雲端。
兩種 AI 的任務方式(雲、邊緣)是必須的,Pichai 在接受採訪時表示,「這種綜合的方式,絕對有意義。」他說,「對兩種方式,我們都會審慎地進行投資。這取決於語境、你要解決什麼問題以及以不同的方式部署是否有意義。」
二、Pixel Buds : 重新想像的 Her 與巴別魚
本次大會上,首次亮相的另一款智能硬體 Pixel Buds,也是谷歌第一款無線藍牙耳機。有點類似 Her 與巴別魚的合體,這款其貌不揚、設計甚至有點滑稽的耳機,其真實目的是為了用戶可以更快、更簡便地接入 Google Assistant 和 Google 翻譯。
僅需將右手放在右耳部分開始說話,即可激活助手。耳機可以立刻將你的語音傳輸給收音機,無需等待任何提示音。舉起手指,語音助手即可進行回復。
Google 翻譯的驚艷效果已無需多言。這款藍牙耳機不僅能夠讀取信息,還支持實時翻譯,支持的互譯語種達到 40 種。「help me speak English」,然後說一個短語,當你的手離開耳機時,翻譯結果即刻出來。你的對話對象按住手機按鍵說出他們的回復後,你即可從耳機中聽到譯後版本。
三、傳統智能硬體之爭,仍離不開演進中的 AI 技術
除了這兩款全新設計的智能硬體,手機、音箱仍然是傳統競賽項目。總的說來,想要贏得硬體之戰,谷歌手機還需要寄希望於服務和軟體,特別是 AI 和機器學習。不斷演進的 Google Lens 和 Google Assistant 有望幫助谷歌硬體更加出類拔萃。
1、技術壁壘之聲紋識別。
在智能音箱的對陣中,除了發布兩大型號智能音箱對標 HomePod 與 Echo Dot 之外,谷歌將彎道超車的另一法寶押在了對方暫時沒有的技術壁壘上:聲紋識別。
微信用戶對聲紋識別並不陌生。聲紋識別的最直接的用途是識別說話人身份。
其實,早在幾個月前,Google Home 就進行了一次重大升級,谷歌成為第一家商用化音箱支持多用戶聲紋識別的公司。Google Home 可以根據提問的人的不同身份提供不同的信息,根據每個人的聲音執行指令。
本次大會最大的亮點之一 正是「Voice Match」。藉助這一功能,Google Assistant 能區分不同用戶的聲音,並且根據辨別用戶,從而對同一個指令做出不同的應對。
例如:你和伴侶都對 Google Home 說「打電話給媽媽」,Google Assistant 就會根據識別出的聲音,調取你和伴侶各自的通訊錄,然後打給各自的媽媽。
關於語音助手,還有一個值得注意的細節。在這次發布會上,Google 為 Pixel 2 兩款新機加入了一項名為「Active Edge」的功能,可以利用握持動作喚醒一些快捷方式(默認是呼出 Google Assistant 和來電時靜音)。也就是說,無需喚醒詞,通過把握行為即可喚醒語音助手。
2、Lens 從底層技術實現 AR 玩法,戰略意義不容忽視
「多點觸控是一個很大的進步。」Pichai 說,「但是,未來的交互將會更多地以對話形式、感官方式進行,比如語音、視覺。」和 Bixby 一樣,它可以識別真實世界目標並搜索。
2017 年穀歌 I/O 大會上,Google Lens 首次登台亮相即成為當時最大亮點。Google Lens 並不是一個硬體,而是一個可以根據圖片或拍照識別出文本和物體的軟體內部功能,能實時分析圖像並迅速共享信息。
它可以幫助用戶快速識別物體(植物 、古迹等)、自動聯網和了解附近地區。這項新技術會最先應用在 Google Assistant 和 Google Photos 上。
在這次發布會上,Google Lens 進一步展示了 AI 在圖像識別中取得的全新進展。比如,即使在干擾項非常多的情況下,它也可以很好地工作。
AI 可以判斷相機鏡頭對著的影像信息內容,比如傳單上 Email 信箱位址,並會自動在手機上顯示問你是要創建聯繫人、傳送信件或只是單純複製文字。Google Lens 還可以判斷藝術作品、唱片或者書本封面信息,快速幫你搜索出相關信息。剛到一個新城市旅遊的 Google Lens 用戶,只需要四周掃掃,即可遊刃有餘地在城市中旅行。
其實,Google Lens 的這些應用也是手機鏡頭+AR 的完美組合,可以輕鬆實現便捷和廣泛的 AR 應用。想像一下隨手掃描一家餐廳的照片,眼前就會出現各式菜品的 AR 效果影像。
不過,谷歌是從系統底層技術入手,實現 AR 應用。雖然 Snapchat、蘋果都把帶有 AR 濾鏡的手機攝像頭功能當成最核心的產品功能(iPhone X 手機豪賭 AI+AR),但有分析認為,與 Google Lens 能實現的 AI+AR 的搜索相比,他們仍然只是淺表意義上的應用。娛樂畢竟只是 AR 廣闊市場中一個小的領域。基於 AR 的搜索才是擁有巨大潛力的主流應用未來。前段時間,谷歌公布的 ARCore 也將在 Google Pixel 2 中預載。
3、語音合成技術終於產品化。
最後,值得一提的是 DeepMind 的演算法終於產品化,被用於 Google Assistant。去年 9 月,DeepMind 公布了其在語音合成領域的最新成果 WaveNet,一種原始音頻波形深度生成模型,能夠模仿人類的聲音,生成的原始音頻質量優於目前常用的語音合成方法。
不過,當時這個模型還只處於雛形階段,對於消費性產品而言,模型的計算消耗量太大。經過 12 個月的努力,DeepMind 大大提升了模型運行的速度和質量,目前已經推出 WaveNet 的更新版本,可以在所有平台上生成美式英語和日語的 Google Assistant 語音。
四、在線消費者產品的 AI 創新仍然步履沉重
儘管谷歌雄心勃勃地做自己的硬體,但較之在線業務營收,仍然是九牛一毛。在接受媒體採訪時,Pichai 表示接下來五年,硬體業務會成為公司財務的一大爆發亮點。
目前,在線搜索業務仍然是谷歌的重要營收來源。每天,谷歌需要應對的各種錯誤、被操縱的信息與日俱增。就在這次發布會的前幾天,谷歌(和 Facebook)再度被捲入輿論漩渦。谷歌的推送演算法給出有關駭人聽聞的拉斯維加斯槍擊案的政治化虛假新聞。
谷歌搜索結果中包含了來自有爭議的 4Chan 的「頭條新聞」,但該文章包含了錯誤猜測的槍手名字(誤指為 Geary Daniel)。對此,谷歌歸咎於演算法錯誤(執法部門後來確認了槍手的身份為 Stephen Paddock)。錯誤的鏈接存在了數小時。
「我們有責任糾正這一錯誤」,谷歌 CEO Pichai 最近在接受媒體採訪時表示,「但是,每一次跌倒,會感覺到疼,也應該承擔起責任。」後來谷歌在一份聲明中稱,為避免未來發生同樣的尷尬,他們會對軟體作出調整。
谷歌用 AI 來創新硬體與在線消費者產品的能力,並非並駕齊驅。人們仍然會質疑,谷歌演算法系統是否能夠做出正確決定,而不是僅僅是讓決定更容易?
今年 7 月,谷歌推出自己的新聞推送服務 Google Feed,該服務將通過谷歌應用向 iPhone 用戶和 Android 用戶提供包括新聞報道、視頻以及為個人用戶定製的其他內容在內的各種內容。
「這不是你的朋友感興趣的東西,也跟其他的新聞推送服務不同。」谷歌工程副總裁 Shashi Khakur 說。谷歌使用的是自己的搜索歷史。
谷歌的基本搜索辦法也可以用於提供好的、值得信賴的內容。Pichai 說,「我們仍然使用相同的核心原則,就像在 Ranking 中使用的那樣。原則可以平等地加以應用。我感到欣慰的是,同樣一套東西是起作用的。」
但在有關事實王國之外,怎麼處理真誠的意見,Pichai 也沒有把握。「我們所有人都要努力克服的問題是,怎麼處理人們不同意的地方?」在推送意見時,Pichai 很好奇谷歌是否可以「帶來更好的觀點,而不是單純的排名.... 這是我們早期勘探領域,但我認為,我們可以做的更好。」
谷歌用 AI 來創新硬體與在線消費者產品的能力,並非並駕齊驅。但是,當請谷歌為我們做出更多決定時,Pichai 不得不展示他們的 AI 具有判斷力,而不僅僅是一套演算法。


※面對三星的「反叛」與亞馬遜的「圍剿」,谷歌正賭上全部做硬體
※還在擔心自己的崗位會被 AI 取代嗎?Gartner 說你可能有新的機會
※可口可樂說它的配方來源於大數據分析
※谷歌無人駕駛部門人事架構:這是「保守派」與「空降兵」的鬥爭?
※Facebook在人工智慧的道路上走了多遠?
TAG:機器之心 |