英偉達發布全球最大 GPU：性能提升 10 倍，售價 250 萬

科技 03-28

英偉達的新殺器又來了。

剛剛，在 GTC 2018 大會上，黃仁勛發布全球最大 GPU。

他說的是 DGX-2。

DGX-2 能夠實現每秒 2 千萬億次浮點運算（2 PFLOPS），性能比去年 9 月推出的 DGX-1 性能提高了 10 倍，售價 39.9 萬美元（人民幣 250 萬元）。

英偉達發布全球最大 GPU：性能提升 10 倍，售價 250 萬

這次的 GTC 2018 大會在美國加州聖何塞舉行，黃仁勛照例身著皮衣登台演講。（官方還特別提示：這次是一件全新的皮衣）

而老黃這次的演講主題，是四個 Amazing：amazing graphics、amazing science、amazing AI、amazing robots。

首先，從不可思議的圖像開始。

在這個環節里，黃仁勛介紹了英偉達在圖像實時光線追蹤處理方面的最新進展，展示了細膩的反射效果。

英偉達發布全球最大 GPU：性能提升 10 倍，售價 250 萬

這項技術，稱為 RTX。它面向圖形領域，藉助深度學習技術，實現了實時光線追蹤。

英偉達發布全球最大 GPU：性能提升 10 倍，售價 250 萬

然後黃仁勛發布了首款基於 Volta 架構的工作站 GPU：Quadro GV100。

它支持英偉達 RTX 技術，支持 NVLink 2，32GB 容量 HBM2 顯存。兩個 GV100 相連，可以提供 10000 多個 CUDA 核心，236 teraflops 的 TensorFlow 核心。

說著說著，老黃又開始講這句：買得越多，省得越多。（The more GPUs to buy, the more money you save.）

「來 GTC，學習如何節省百萬美元。」老黃髮出誠懇的建議。

然後進入不可思議的科學環節。

我們正處在 GPU 計算的關鍵點，黃仁勛表示。這部分他還介紹 TESLA V100 等產品的多快好省，也談到一些 GPU 在計算和醫療影像方面的貢獻。

比如醫療影像超級計算機 CLARA。

英偉達發布全球最大 GPU：性能提升 10 倍，售價 250 萬

深度學習給醫療影響的識別帶來了諸多變革，但投入到實際使用中卻很難。醫院用著十幾年前生產的超聲儀，黑白渣畫質成了醫療進步的阻礙。

要等所有醫院升級設備，可能要花上 30 年。

CLARA 是一款醫療影像的超級計算機，讓醫院可以升級那些已有的系統。醫生可以仍然用原有的超聲、CT 等設備，然後將圖像輸入超級計算機，推理出更清晰的圖像。

在這個項目上，英偉達聯合了一大群醫療行業的合作夥伴：

英偉達發布全球最大 GPU：性能提升 10 倍，售價 250 萬

以及在這個環節，黃仁勛又引導全場跟他念：買得越多，省得越多。

來到不可思議的 AI 環節。

這個環節的主題是「全球最大的 GPU」。

首先，英偉達把 Volta V100m 每張卡的內存擴大到 32GB。適用於內存密集型的深度學習和高性能計算，還能將內存受限的 HPC 應用性能提升高達 50%。

其次，是全新發布的互聯結構 NVSwitch，帶寬比最好的 PCIe 交換機高出 5 倍，最高支持 16 個 Tesla V100 同時以 2.4TB/秒的速度進行通信。

英偉達發布全球最大 GPU：性能提升 10 倍，售價 250 萬

最後，一個全新的 DGX 伺服器發布了。

黃仁勛說這個現在是全球最大的 GPU 了：新的 DGX-2，包括 20 億個晶體管，12 個交換機。每個 GPU 都可以通過光纖交換機互相通信，比 PCIe 介面快 20 倍。

英偉達發布全球最大 GPU：性能提升 10 倍，售價 250 萬

DGX-2 的算力可達 2 千萬億次浮點運算，功耗 10 千瓦。這台機器內部是 NVLink 連接的兩組 Tesla V100 陣列。

與 6 個月前發布的 DGX-1 相比，DGX-2 提速 10 倍。

五年前，在兩塊 GTX 580 上進行 Alexnet 訓練耗時六天，現在使用 DGX-2，可以在 18 分鐘以內完成。

這款產品將於今年三季度發售，每台價格 39.9 萬美元（人民幣 250 萬元）。

DGX-2 具有 300 台伺服器的深度學習處理能力，佔用 15 個數據中心機架空間，而體積則縮小 60 倍，能效提升 18 倍。

此外，英偉達還更新了 CUDA、TensorRT、NCCL、cuDNN 等深度學習和 HPC 軟體堆棧。

新版的 TensorRT 能快速優化、驗證和部署在超大規模的數據中心，針對更廣泛的應用加速深度學習推理。它最高可以將深度學習推理的速度加快 190 倍，降低 70% 的數據中心成本。

TensorRT 4 還集成到了谷歌 TensorFlow 1.7 版本中，更易於使用。

另外，NVIDIA 還宣布和 ARM 合作，將英偉達深度學習加速器架構集成到 Arm 的 Project Trillium 上，在手機、智能家居等設備上實現深度學習推理。

以及英偉達 GPU 現在支持 Kubernetes 了。這是一個基於容器技術的分散式架構方案。這個技術讓英偉達的 GPU 進一步加速。

還有一事，英偉達驕傲的宣布，TITAN V 仍然斷貨中。

最後是不可思議的機器人環節。

發布了機器人開發工具包 Issac SDK 之後，話題轉向了自動駕駛。

「我們正試圖從頭到尾了解這個系統，這其中包含四個最重要的方面：數據收集、模型訓練、模擬和駕駛。」老黃說，這個了解過程，大約花了 5 到 7 年。

老黃在現場，又展示了一把雲代駕。

英偉達發布全球最大 GPU：性能提升 10 倍，售價 250 萬

他把 VR 和自動駕駛結合起來。通過一個 VR 眼鏡和方向盤，就能啟動自動駕駛汽車。

雲代駕所用的平台，是新鮮發布的 NVIDIA DRIVETM Constellation，基於兩台伺服器。

第一台伺服器運行 NVIDIA DRIVE Sim 軟體，用以模擬自動駕駛汽車的感測器，如攝像頭、激光雷達和雷達。第二台伺服器搭載 NVIDIA DRIVE PegasusTM AI 汽車計算平台，可運行完整的自動駕駛汽車軟體堆棧，並能夠處理模擬數據，這些模擬數據如同來自路面行駛汽車上的感測器。

老黃又詳細介紹了英偉達的感知基礎架構。

每輛汽車都在收集 PB 級的數據，每個月有 1500 人大概標註 100 萬件物品。

老黃表示，英偉達並沒有試圖建立一個基於軟體定義的計算機的自主車輛系統，確切的說是在研究一個架構。

英偉達以 Drive PX Parker 單晶元架構為基礎創建 DRIVE Xavier。這是一個四晶元系統，包含兩個 Xaviers 和兩個 Voltas。

這台耗能 300 瓦的電腦正在用於機器人汽車，將於今年晚些時候投入生產。

對了，這項技術英偉達擁有全部產權。

BTW，英偉達今天還宣布暫停了自動駕駛測試。

可能是受此影響，發布會一開始，英偉達股價就同步下跌，至發布會結束，英偉達股價累積下跌 6.64%。

英偉達發布全球最大 GPU：性能提升 10 倍，售價 250 萬

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 動點科技 的精彩文章:

※家樂福運用區塊鏈進行食品安全溯源
※極米推出 1080p 無屏電視 Z6，售價 3000 元內｜CES 2018

TAG:動點科技 |