當前位置:
首頁 > 知識 > Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

作者 | 趙敏

責編 | 郭芮

9 月 20 日-10 月 7 日,谷歌AI體驗展在上海龍美術館(西岸館)展出。谷歌總共展出了 17 個互動項目,和九月底人工智慧大會上谷歌介紹的項目有一些重疊,也有一些區別。這次體驗展沒有背後的技術原理介紹,是純粹的成果體驗,所以不需要有專業知識即可參觀。

事實上,場館裡隨處可見組團而來的中小學生。展出的項目中,有些比較前沿,讓人可以深刻體會到谷歌領跑於世界的創新能力和強大的平台實力,但也有一些小項目,僅僅是工程師們利用業餘時間開發完成的。這個現象也非常符合谷歌公司文化(插句題外話,關於谷歌文化介紹,推薦一本書《重新定義公司-谷歌是如何運營的》)。

這些項目都有一個共同點,就是使用了AI技術。

谷歌在2010年初退出中國搜索領域市場後,2016年在北京首次召開中國開發者大會,17、18年則在上海召開,大會的主題也從安卓慢慢向人工智慧轉變。本次體驗展也是與2018開發者大會同期進行。可以看出,雖然已經過去了8年,但是隨著AI浪潮的到來,谷歌對中國的熱情不減反增。

近年來,作為一家 AI First 的公司,Google 在人工智慧領域已經開發出了非常多的應用,比如 Google Photos、Google Lens、猜畫小歌小程序等。在本次展覽體驗上,許多新奇的 AI 應用場景都得以展現,包括以色搜圖、3D作畫、AI手影識別、智能化生成皮影戲、AI二重唱等等。

本文就用一些圖片和視頻對這次展覽做下記錄。

Google 程序員都是怎麼研究 AI 的?

入口歡迎PPT

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

以色搜圖項目

用戶可以在旁邊的面板上任意選擇五個不同顏色,AI程序會自動搜索主色調符合這五個顏色的藝術品。

對這個項目背後的技術不太了解。現場體驗來看,AI程序並不是在體驗者一開始彈奏時就插入音符,而是自動學習幾秒之後才會開始伴奏。另外背後是基於什麼模型標準去添加音符也不太清楚。

如果各位看官有了解的可以在評論區留言。

Google 程序員都是怎麼研究 AI 的?

VR

VR的發展從12年Oculus Rift開始眾籌算起,13年推出開發者版本,至今已經商用了五六年,現在也不能算什麼新鮮事物了。如果對VR的技術感興趣可以去維基百科搜索Palmer Luckey與Steve M. Lavalle。他倆是OculusVR的創始人和早期核心員工,一位主攻3D視覺方向,另外一位主要解決感測器數據融合、頭部姿態預測跟蹤等問題。

這些都是VR產品需要解決最基本核心的問題。

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

AR

這個項目展出的AR就是一個靜止的2D效果,簡單地在體驗者背景里添加一張畫作。從技術角度看這個AR的項目的難度遠低於下邊的谷歌AR翻譯。

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

AI識別人體動作

程序實時地識別體驗者的四肢姿勢,並且從圖片庫里找到和你擺出同樣造型的照片。事實上,識別人體骨架這個功能很早就實現了,包括微軟kinect的體感遊戲,也已經商用了很多年。

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

谷歌AR翻譯

識別並且翻譯語言,並且將翻譯的結果以AR的效果實時地貼在相機預覽界面中。這個使用了OCR技術,並且依賴谷歌翻譯。

其強大之處有四點:一,可以在一個界面中跟蹤多個需要翻譯的對象,互不干擾。二,所有工作可以在手機端側完成,脫離谷歌雲服務完全不受影響。只要用戶事先下載好對應的語言包,斷網之後依然可以完成翻譯及渲染工作。三. 支持翻譯的語言超過百種。國內百度翻譯只支持三十種左右,且不支持AR翻譯。有道翻譯支持AR翻譯,但僅限部分手機機型,即使是支持AR翻譯的機型,語言也只支持三十幾種。這樣一對比大家就能體會到谷歌實力的恐怖之處。四,除了AR翻譯,谷歌翻譯還支持語音翻譯,以及在其他安卓應用界面直接選中文字翻譯。

大家可以去應用市場下載谷歌翻譯進行體驗。這個項目的完成也依靠了谷歌長期技術積累的兩大平台能力,翻譯能力與安卓操作系統。

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

藝術品之間的關聯性

體驗者可以隨機任選兩幅完全沒有關聯的畫作,AI程序可以搜索藝術品資料庫,通過幾幅作品將兩幅完全沒有關係的畫作聯繫起來。

如下圖,體驗者隨機選擇了最左邊的人像A和最右邊的藝術品B,AI程序可以搜索出一些其他畫作,實現從A過渡到B的效果。從效果看這個與神經網路各層之間實現的過渡比較相似。

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

AI創作歌詞與曲調

通過拍一張照片,AI自動識別裡邊的元素,比如「眼鏡」、「棒球帽」,然後將這些關鍵字串聯為歌詞,通過RAP配上音樂說唱出來。

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

EMOJI表情

根據提示的表情包,在現實生活中找到對應的物體。如手錶,手機AI程序會自動判別你找到的物品是否與表情包對應,如果對應那麼就會提示你成功。

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?

猜畫小歌

根據提示的詞語,繪製簡筆畫,手機AI程序會自動判斷你繪製的簡筆畫是否符合要求,比如狗、手錶、紅綠燈、鯊魚等。

Google 程序員都是怎麼研究 AI 的?

這是個微信小程序,大家用手機就可以體驗,直接在微信搜索小程序「猜畫小歌」即可。

Google 程序員都是怎麼研究 AI 的?

放大細觀世界珍寶

這個就是用三面巨屏展示藝術畫作,和AI沒什麼關係,給人感覺是為了契合「科技與藝術」主題而拿來湊數的項目。

Google 程序員都是怎麼研究 AI 的?

總之,所展出的項目大多是使用了2D圖像處理技術。包括AR翻譯,其實也是對每一幀圖像進行物體識別跟蹤。相比而言,語言聲音類與3D圖像類比較少。

Google 程序員都是怎麼研究 AI 的?

後記

09年李開復先生的離開使谷歌缺少了中國本土化的潤滑劑,直接或者間接導致了當年的退出內地事件。而今年9月份AI女神李飛飛宣布離職,重複的故事又在上演,這距她17年加入谷歌都未滿兩年。雖然從這次展覽的項目可以看出谷歌已經在小心翼翼地收斂著自己的鋒芒,但是入華進程依然道阻且長。

最後附幾張場館外的風景照。

Google 程序員都是怎麼研究 AI 的?

Google 程序員都是怎麼研究 AI 的?


作者:趙敏,安卓軟體開發工程師,現就職於上海華為消費者BG。個人知乎號:米開朗基羅趙。

聲明:本文為作者投稿,版權歸作者個人所有。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 CSDN 的精彩文章:

Linux 之父道歉了,卻被程序員威脅撤銷貢獻代碼!
Vue 3.0 將從頭開始重寫!

TAG:CSDN |