終於能用Google的TPU跑代碼了，每小時6.5美元

最新 02-14

AI科技大本營消息，北京時間周一（2月12日）晚間，Google 宣布，在 Google Cloud Platform（GCP）上正式推出Cloud TPUs 測試版服務，幫助研究人員更快地訓練和運行機器學習模型。目前的收費標準為 6.5美元/Cloud TPU/小時，而且供應有限，需要提前申請。

TPU（Tensor Processing Unit）的全名為張量處理單元，是 Google 專為機器學習而定製的一款晶元。在去年 5 月 18 日的Google I/O 大會上，Google 正式推出第二代 TPU —— Cloud TPU，相比第一代，第二代對推理和訓練都進行了優化。

然而，Google 的 TPU 一直只在內部使用，此次 Google 首次對外全面開放自家的 TPU，這或許意味著谷歌正式向英偉達的 GPU 開炮，加速 TPU 的商業化進程，在 AI 基礎設施領域搶佔地盤。

以下是 Google Cloud 的官方博客內容：

Cloud TPUs 是 Google 設計的一系列硬體加速器，專門針對加速和擴大使用 TensorFlow 編程的機器學習工作負載進行了優化。每個 Cloud TPU 由四個定製的 ASIC 構成，單個 Cloud TPU 的浮點計算能力可以達到 180 teraflops（萬億次每秒），內存寬頻 64GB。

這些板卡可以單獨使用，也可以通過超快的專用網路連接在一起，共同構建成 multi-petaflop（幾千萬億次每秒）的機器學習超級計算機，我們稱之為「TPU pods」。今年晚些時候，我們將在 GCP 上提供這些大型的「超級計算機」。

我們設計 Cloud TPUs 的目的是為了給 TensorFlow 工作負載提供差異化的性能，讓機器學習工程師和研究人員能夠更快地迭代（機器學習模型）。比如：

從此以後，你不用再等待共享計算機集群的調度，只需通過可以控制並自定義的 Google 計算引擎虛擬機，就可以獨佔聯網的 Cloud TPU。

以前訓練商用機器學習模型可能要等上幾天甚至幾周，現在只需要一個晚上，你就可以在 Cloud TPUs 機群上訓練出統一模型的不同變體，第二天就可以將準確率最高的訓練模型部署到生產活動中去。

使用單個 Cloud TPU，並遵循該教程（https://cloud.google.com/tpu/docs/tutorials/resnet），你就可以在不到一天的時間內訓練出符合你期望的 ResNet-50 網路，使其在 ImageNet 基準挑戰上達到你所期望的準確率，而且花費不超過 200 美元。

傳統上，為定製的 ASIC 和超級計算機編寫程序需要深入的專業知識，但是對於 Cloud TPU 而言，你可以使用高級的 TensorFlow APIs 進行編程。我們開源了一系列高性能 Cloud TPU 模型實現，幫助你快速上手：

ResNet-50（https://cloud.google.com/tpu/docs/tutorials/resnet），其他常用的圖像分類模型（https://github.com/tensorflow/tpu/tree/master/models/official）。

用於機器翻譯和語言建模的 Transformer（https://cloud.google.com/tpu/docs/tutorials/transformer (https://research.googleblog.com/2017/08/transformer-novel-neural-network.html)）

用於目標檢測的 RetinaNet（https://github.com/tensorflow/tpu/blob/master/models/official/retinanet/README.md）

為了節約你的時間和精力，我們將持續測試這些模型實現在標準數據集上的性能和收斂至期望準確率的情況。

之後，我們還將開源更多的模型實現。熱愛探索的機器學習專家可以使用我們提供的文檔（https://cloud.google.com/tpu/docs/）和工具（https://cloud.google.com/tpu/docs/cloud-tpu-tools），優化其他在 Cloud TPUs 運行的 TensorFlow 模型。

如果你現在就開始使用 Cloud TPU，那麼在今年晚些時候我們推出 TPU pod 時，你將會從訓練時間到準確率的大幅提升中收益。正如我們在 NIPS 2017 上宣布的那樣，在一個完整的 TPU pod 上，ResNet-50 和 Transformer 的訓練時間將從大半天將至 30 分鐘以內，而且無需修改任何代碼。

Cloud TPU 同樣簡化了機器學習計算資源的規劃和管理過程：

你可以為自己的團隊提供頂尖的機器學習加速，並且根據需求的變化動態調整自己的容量；

相比於花費時間和金錢，並聘請專業的人才來設計、安裝、維護一個需要專門的功能、冷卻、網路和存儲設備的實體機器學習計算集群，你可以從 Google 持續多年專門優化過的大規模、高集成的機器學習基礎設施中受益。

不需要費力地保證各種工作站和伺服器的驅動更新升級，因為 Cloud TPU 根本不要安裝驅動。

Google Cloud 將提供同樣複雜的安全機制和實踐保護。

除了 Cloud TPUs，Google Cloud 也會提供一系列的高性能 CPU（包括英特爾 Skylake）和 GPU （包括英偉達 Tesla V100）。

目前，Cloud TPU 的供應依然受限，價格將以秒計費，大約為 6.5 美元/Cloud TPU/小時，申請地址為：https://services.google.com/fb/forms/cloud-tpu-beta-request/。

GIF