當前位置:
首頁 > 新聞 > 從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

機器之心原創

記者:CZ、Tony Peng

當地時間 5 月 17 日,谷歌在山景城開啟了本年度的谷歌 I/O 開發者大會。昨日機器之心對此次大會上將出現的有關人工智慧和機器學習的內容進行了梳理。機器之心作為谷歌官方受邀媒體來到現場,近距離為大家報道谷歌人工智慧的最新進展。

從大會主題演講可以看出,谷歌人工智慧主要體現在以下五大方面:

  • AI First 的整體戰略;

  • TPU 的升級與雲服務;

  • 集研究、工具、應用於一體的 Google.ai ;

  • 人工智慧技術的產品落地;

  • 基於安卓和 TensorFlow 的移動開發者生態。

重申 AI First

去年 10 月的谷歌新品發布會期間,谷歌 CEO Sundar Pichai 曾撰文解讀谷歌從 Mobile First 向 AI First 的戰略轉變。他認為在接下來 10 年中,谷歌將轉向建立 AI First 的世界。

Pichai 在本屆大會上再次強調了谷歌 AI First 戰略的重要性,他表示,機器學習已經在谷歌的諸多產品中得到了廣泛應用,其中包括搜索排序、街景、圖片搜索、智能回復、YouTube 推薦等。

在具體技術方面,Pichai 說:「聲音和視覺是一種新的計算形式。我們正在見證計算機視覺和語音領域的諸多偉大進步。」

谷歌的語音識別技術的詞錯率逐年下降,僅從去年 7 月到現在就實現了 8.5% 到 4.9% 的極大改進;而且即使在有噪音存在的情況下也能表現良好。在 Google Home 剛發布時,原本需要 8 個麥克風才能準確定位周圍的說話人,「而藉助深度學習,我們最後能夠推出僅有 2 個麥克風的產品,而且達到了同樣質量。」現在 Google Home 已經能識別 6 個不同的說話人並為他們定製個性化體驗。

在處理某些任務時,圖像識別的準確度也超過了人類水平,並且應用到了 Pixel 系列手機的相機應用中,來自動清除圖像中的噪點,實現高質量的夜間成像效果;不久之後甚至還可以自動移除照片上的遮擋物,比如擋在相機前的棒球場圍網。

在這些計算機視覺技術的基礎上,谷歌又發布了 Google Lens 。這個功能將首先出現在 Google Assistant 和 Photos 中,用戶可以使用 Google Lens 來識別花的品種、掃描設置好的條形碼來連接 WiFi 、在大街上掃描店面來了解網上評價。

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

TPU 雲服務

AI First 的戰略需要 AI First 的數據中心,為此谷歌打造了為機器學習定製的硬體 TPU 。去年發布時,TPU 的速度比當時 CPU 和 GPU 的速度快 15 到 30 倍,功耗效率高 30 到 80 倍。如今的 TPU 已經在為谷歌的各種機器學習應用提供支持,包括之前戰勝李世石的 AlphaGo 。

Pichai 介紹道,深度學習分為兩個階段:訓練(training)和推理(inference)。其中訓練階段是非常計算密集型的,比如,谷歌的一個機器翻譯模型每周就要處理至少 30 億詞的訓練數據,需要數百個 GPU,去年的 TPU 就是專門為推理階段優化的;而在今年的 I/O 大會上,Pichai 宣布了下一代 TPU——Cloud TPU——其既為推理階段進行了優化,也為訓練階段進行了優化。在現場展示的一塊 Cloud TPU 板圖片上有 4 塊晶元,其處理速度可達 180 teraflops(每秒萬億次浮點運算)。

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

此外,Cloud TPU 還可以輕鬆實現集成組合,你可以將 64 塊 TPU 組合成一個「超級計算機」,即一個 pod ,每個 pod 的速度可達 11.5 petaflops(每秒千萬億次浮點運算);另外,Pichai 還宣布將 Cloud TPU 應用到了 Google Compute Engine 中。

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

一個 Cloud TPU Pod 示意圖,包含 64 塊 Cloud TPU

正如 Pichai 所言,「我們希望谷歌雲是最好的機器學習雲,並為用戶提供 CPU 、GPU 和 TPU 等更廣泛的硬體支持。」

在下午的開發者 Keynote 中,谷歌雲機器學習與人工智慧首席科學家李飛飛也表示,每個人都可通過谷歌的雲平台使用雲 TPU,不久之後將會開放租借。

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

李飛飛在下午的開發者 Keynote 演講

Google.ai 與 AutoML

為推動使用人工智慧解決實際問題,Pichai 宣布將谷歌人工智慧方面的工作綜合到 Google.ai 下。總體而言,Google.ai 將專註於三個領域:研究、工具和應用。

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

在研究方面,深度學習模型方面的進步令人振奮,但設計和開發卻很耗費時間,只有少量工程師和科學家願意去研究它們。為了讓更多開發者使用機器學習,谷歌提出了 AutoML——讓神經網路來設計神經網路。

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

AutoML 是一種「learning to learn」的方法。在此方法中,一種控制器神經網路能夠提議一個「子」模型架構,然後針對特定任務進行訓練與質量評估;而反饋給控制器的信息則會被用來改進下一輪的提議。谷歌在技術博客中表示,他們已經將此過程重複了上千次,從而來生成新架構,然後經過測試和反饋,讓控制器進行學習。最終,控制器將學會為好的架構分配高的概率。

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

AutoML 流程圖

AutoML 會產生什麼樣的神經網路?以循環架構為例(用來在 Penn Treebank 數據集上預測下一單詞),如下圖所示:

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

左邊為人類專家設計的神經網路,右邊為 AutoML 方法創造的循環架構,兩個架構有著共同的設計特徵。

Pichai 認為,AutoML 具有很大的潛力,並且,谷歌已經在圖像識別基準數據集 CIFAR-10 上取得了頂尖成果。雖然過程很難,但云 TPU 的存在使這種方法成為了可能。

有了這些前沿的研究,接下來就是應用的問題。Pichai 列舉了谷歌應用機器學習的幾個案例:比如在醫療領域診斷癌症的應用和在基礎科學領域的應用(比如在生物學上,谷歌通過訓練神經網路來改進 DNA 測序的準確率;在化學領域,谷歌通過使用機器學習了預測分子性質)。

四、產品及應用

谷歌 AI First 戰略不僅體現在研究上,還體現在眾多人工智慧技術的應用上——將谷歌的各項人工智慧技術在產品層面統一起來。Pichai 提到:「計算機仍在不斷地進化,從 Mobile First 的世界進化到 AI First 的世界。我們也在重新思考我們所有的產品。」

1. Google Assistant

谷歌正將人工智慧應用於所有產品中,Pichai 表示,其中最重要的就是谷歌搜索和 Google Assistant 。自去年 I/O 大會發布以來,Google Assistant 已經可以在上億台設備上使用。今天 Google Assistant 工程副總裁 Scott Huffman 又介紹了 Google Assistant 三大進步。

1)更自然的對話

Google Assistant 上 70% 的請求都是通過自然語言的方式進行的,而非鍵盤輸入。而谷歌要做的就是結合語音識別、自然語言處理以及語境意義方面的技術來解決用戶雙手,實現更加自然的人機交流。「Google Assistant 可以通過聆聽學會區分不同家庭成員的聲音。」他說。除了語音識別和自然語言處理,Google Assistant 還使用了 Google Lens 功能,通過圖像信息來實現更加自然的「對話」。

2)更廣泛的應用

Huffman 表示,Google Assistant 正變得更加廣泛可用,除了之前的安卓系統,Google Assistant 已經可以在 iPhone 上使用。而隨著 Google Assistant SDK 的發布,任何設備生產商都能簡單輕鬆地將 Google Assistant 部署在音響、玩具和機器人等設備上;此外,今年夏天,Google Assistant 也開始將支持法語、德語、葡萄牙語和日語,並將在年底新增義大利語、韓語和西班牙語等語言。

3)更觸手可及的服務

用戶使用 Google Assistant 不僅僅是搜索信息,還希望獲取所有服務,比如 Gmail 、Google Photos 、谷歌地圖和 YouTube 等。因此,谷歌將 Google Assistant 開放給了第三方開發者,以實現產品間更加有用的融合。據 Google Assistant 產品經理 Valerie Nygaard 介紹,Google Assistant 將支持交易,從而為第三方提供端到端的完整解決方案。

Google Assistant 的進步也使得智能家居產品 Google Home 新增了 50 項新功能——用戶可以通過語音去調用各種服務,包括免費電話、免費聽音樂,以及在電視上觀看視頻等。

同時,基於本次大會上多次提及的「語音加圖像」的多模態交互,此前缺乏視覺交互 Google Home 現在也可以藉助手機和電視的屏幕與用戶進行更好的互動,比如,用戶可以通過語音命令讓 Google Home 把你的日程在電視上顯示。就像 Nygaard 所說的那樣,用戶可以 hands-free 的做任何事情。如今 Google Assistant 已經開始支持交易並集成到智能家居設備中,目前擁有超過 70 家智能家居合作者。

2. Google Photos

Google Photos 目前擁有十億月度活躍用戶,每天上傳的照片和視頻達到 12 億次。藉助於谷歌的核心人工智慧技術,如今 Google Photos 使用了全新的圖像處理方法。這從此次發布的三個新功能可以看出:

  • Suggest Sharing 可以藉助機器學習將照片中的人物和場景識別出來,然後給用戶提供分享建議——是否應該分享以及分享給誰。

  • Shared Libraries 基於用戶識別的相片庫分享。

  • Photo Books 自動幫助用戶篩選出某一場景下的高質量照片並生成相冊。

另外,除了 Google Assistant ,Google Lens 也被集成到了 Google Photos 中。通過這個功能,你可以識別相冊裡面的地標建築、檢索藝術作品背後的故事、識別照片內的文本內容和信息,這項功能將於今年晚些時候發布。

五、用 TensorFlowLite 構建移動開發者生態

機器學習在移動端的應用至關重要,而在討論安卓的未來時,谷歌工程副總裁 Dave Burke 宣布了一個為移動端優化的 TensorFlow 版本——TensorFlowLite 。TensorFlowLite 能讓更多的開發者建立在安卓手機上運行的深度學習模型。而 TensorFlowLite 就是谷歌在移動端部署人工智慧的一個著力點。首先,TensorFlowLite 很小很快,但依然可以使用最先進的技術,包括卷積神經網路、LSTM 等;其次,Dave Burke 還宣布在安卓上推出了一個新的框架來進行硬體加速,期待看到為神經網路的訓練和推理特別定製的 DSP 。這些新能力將促進新一代設備上(on-device)語音識別、視覺搜索和增強現實的發展。

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

去年,Facebook 公開了 Caffe2Go ,今年更是開源了可在手機與樹莓派上訓練和部署神經網路模型的 Caffe2 。在移動端部署機器學習成為了一項新的挑戰。但不幸的是,手機上訓練神經網路仍是計算密集型任務。即便忽略訓練,預訓練模型仍舊艱難。但如果能在邊緣設備運行模型,就能避免雲和網路,在任何環境中有更可靠的表現。

谷歌表示他們會開源該項工作,並計劃在今年晚些時候發布 API 。

谷歌首日 Keynote ,讓我們看到了谷歌圍繞機器學習研究、開源工具、基礎設施和人工智慧應用開發的 AI First 戰略。Cloud TPU 是加速人工智慧部署的基礎設施;AutoML 代表著機器學習研究層面的前沿方向;TensorFlowLite 將促進人工智慧在移動端的部署;語音和圖像的結合代表著對多模態人機交互的探索;而應用了各種人工智慧技術的產品更新則是極大推動了將 AI 真正融入生活的進程。

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

讀者福利:即日起至 GMIS 2017 大會前一天,讀者在頭條文章下留言,機器之心會在次日選出最專業或最有見解的一條評論贈送 GMIS 2017 雙日票一張!

請點擊「了解更多」查看全部嘉賓陣容,並報名參與機器之心 GMIS 2017。

從新一代TPU到谷歌AI,詳解谷歌I/O首日人工智慧五大亮點

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

2017年最流行的15個數據科學Python庫
谷歌I/O開發者大會推出 Cloud TPU:兼顧訓練和推理
OpenAI推出機器人新系統:可通過VR演示自主學習新任務
微軟小冰全球項目負責人李笛揭秘:小冰如何成為寫詩達人?
服務四萬行業用戶後,美團雲將開放深度學習平台

TAG:機器之心 |

您可能感興趣

Intel新AI晶元發布:對標谷歌第三代TPU
英特爾AI開發者大會:推新版AI晶元,對標谷歌第三代TPU
谷歌I/O大會的六大看點:AI、AR、安卓P……亮點滿滿
搭載谷歌系統 MICHAEL KORS推全新ACCESS RUNWAY智
TPU V3、全新NLP類AutoML產品,這是李飛飛在谷歌雲大會上的新聲音
2018谷歌I/O大會新技術 第三代AI晶元TPU
谷歌I/O大會召開,AI和AR成最大亮點,新功能堪稱懶人神器
AI早報:谷歌I/O大會昨夜召開 拋出8大AI更新
谷歌最強 NLP 模型 BERT 解讀
谷歌 AI 發布 BERT 模型,打破十一項 NLP 記錄,會開啟 NLP 新時代嗎?
VR教育Immersive VR首次公開IPO;谷歌5月發布世界最高清OLED VR顯示屏
HTTP 3.0將TCP 協議更換為基於 UDP 的谷歌 QUIC
谷歌I/O大會第二天:AI語音導盲、多人共享AR,期待三星的Chromebook
谷歌展示1443 PPI OLED顯示屏,為AR/VR一體機研發
侃哥:OPPO FINDX正式發布 谷歌和Uer分手!
谷歌宣布新Wear OS版本H,內含四大更新
谷歌I/O大會進行時:AR/VR、AI愈發高冷?谷歌決定把他們low下來
1443PPI 谷歌與LG推出全新OLED顯示屏
Oracle二號人物將出任谷歌雲CEO,或首拿AWS開刀!
谷歌研發出1443 PPI OLED顯示屏,為AR/VR一體機服務