Google 程序員都是怎麼研究 AI 的？

知識 10-15

作者 | 趙敏

責編 | 郭芮

9 月 20 日-10 月 7 日，谷歌AI體驗展在上海龍美術館（西岸館）展出。谷歌總共展出了 17 個互動項目，和九月底人工智慧大會上谷歌介紹的項目有一些重疊，也有一些區別。這次體驗展沒有背後的技術原理介紹，是純粹的成果體驗，所以不需要有專業知識即可參觀。

事實上，場館裡隨處可見組團而來的中小學生。展出的項目中，有些比較前沿，讓人可以深刻體會到谷歌領跑於世界的創新能力和強大的平台實力，但也有一些小項目，僅僅是工程師們利用業餘時間開發完成的。這個現象也非常符合谷歌公司文化（插句題外話，關於谷歌文化介紹，推薦一本書《重新定義公司-谷歌是如何運營的》）。

這些項目都有一個共同點，就是使用了AI技術。

谷歌在2010年初退出中國搜索領域市場後，2016年在北京首次召開中國開發者大會，17、18年則在上海召開，大會的主題也從安卓慢慢向人工智慧轉變。本次體驗展也是與2018開發者大會同期進行。可以看出，雖然已經過去了8年，但是隨著AI浪潮的到來，谷歌對中國的熱情不減反增。

近年來，作為一家 AI First 的公司，Google 在人工智慧領域已經開發出了非常多的應用，比如 Google Photos、Google Lens、猜畫小歌小程序等。在本次展覽體驗上，許多新奇的 AI 應用場景都得以展現，包括以色搜圖、3D作畫、AI手影識別、智能化生成皮影戲、AI二重唱等等。

本文就用一些圖片和視頻對這次展覽做下記錄。

Google 程序員都是怎麼研究 AI 的？

入口歡迎PPT

Google 程序員都是怎麼研究 AI 的？

以色搜圖項目

用戶可以在旁邊的面板上任意選擇五個不同顏色，AI程序會自動搜索主色調符合這五個顏色的藝術品。

對這個項目背後的技術不太了解。現場體驗來看，AI程序並不是在體驗者一開始彈奏時就插入音符，而是自動學習幾秒之後才會開始伴奏。另外背後是基於什麼模型標準去添加音符也不太清楚。

如果各位看官有了解的可以在評論區留言。

Google 程序員都是怎麼研究 AI 的？

VR的發展從12年Oculus Rift開始眾籌算起，13年推出開發者版本，至今已經商用了五六年，現在也不能算什麼新鮮事物了。如果對VR的技術感興趣可以去維基百科搜索Palmer Luckey與Steve M. Lavalle。他倆是OculusVR的創始人和早期核心員工，一位主攻3D視覺方向，另外一位主要解決感測器數據融合、頭部姿態預測跟蹤等問題。

這些都是VR產品需要解決最基本核心的問題。

Google 程序員都是怎麼研究 AI 的？

這個項目展出的AR就是一個靜止的2D效果，簡單地在體驗者背景里添加一張畫作。從技術角度看這個AR的項目的難度遠低於下邊的谷歌AR翻譯。

Google 程序員都是怎麼研究 AI 的？

AI識別人體動作

程序實時地識別體驗者的四肢姿勢，並且從圖片庫里找到和你擺出同樣造型的照片。事實上，識別人體骨架這個功能很早就實現了，包括微軟kinect的體感遊戲，也已經商用了很多年。

Google 程序員都是怎麼研究 AI 的？

谷歌AR翻譯

識別並且翻譯語言，並且將翻譯的結果以AR的效果實時地貼在相機預覽界面中。這個使用了OCR技術，並且依賴谷歌翻譯。

其強大之處有四點：一，可以在一個界面中跟蹤多個需要翻譯的對象，互不干擾。二，所有工作可以在手機端側完成，脫離谷歌雲服務完全不受影響。只要用戶事先下載好對應的語言包，斷網之後依然可以完成翻譯及渲染工作。三. 支持翻譯的語言超過百種。國內百度翻譯只支持三十種左右，且不支持AR翻譯。有道翻譯支持AR翻譯，但僅限部分手機機型，即使是支持AR翻譯的機型，語言也只支持三十幾種。這樣一對比大家就能體會到谷歌實力的恐怖之處。四，除了AR翻譯，谷歌翻譯還支持語音翻譯，以及在其他安卓應用界面直接選中文字翻譯。

大家可以去應用市場下載谷歌翻譯進行體驗。這個項目的完成也依靠了谷歌長期技術積累的兩大平台能力，翻譯能力與安卓操作系統。

Google 程序員都是怎麼研究 AI 的？