英偉達剛剛發布全球最大GPU：全新的GPU互聯結構，售價39.9萬美元

知識 03-28

昨天，第九屆年度 GPU 技術大會（GTC）在加州聖何塞 McEnery 會議中心正式開幕。在剛剛結束的 Keynote 演講中，英偉達創始人兼首席執行官黃仁勛宣布了該公司在晶元、AI 平台、自動駕駛上的一系列新動作。在本文中，機器之心對其演講的核心內容做了梳理。

正如黃仁勛所說的，今天的發布會有關於：「Amazing science, amazing graphics, amazing products and amazing AI.」

核心內容：

新一代伺服器級 GPU：搭載英偉達 RTX 技術的 GPU Quadro GV100，以及「世界最大的 GPU」

NVIDIA AI 平台：TensorRT 4 等技術，多種重大改進

推出 DRIVE Constellation 自動駕駛模擬系統

圖註：黃仁勛 Keynote 演講總結

搭載英偉達 RTX 技術的 GPU Quadro GV100

在今天的 GTC 大會 Keynote 中，黃仁勛首先宣布推出搭載 NVIDIA RTX 技術的 Quadro GV100 GPU，首次向數以百萬計的藝術家和設計師提供實時光線追蹤技術。

黃仁勛表示，結合強大的 Quadro GV100 GPU，NVIDIA RTX 能夠在運行專業設計及內容創作類應用程序的同時，實現實時的計算密集型光線追蹤。

Quadro GV100 具有 32GB 內存，且可藉助 NVIDIA NVLink 2 互聯技術，通過並聯兩塊 Quadro GPU 擴展至 64GB，在所有適用於此類應用的平台中其性能最高。

在性能方面，GV100 基於 NVIDIA Volta GPU 架構，可提供每秒 7.4 萬億次浮點運算的雙精度性能、每秒 14.8 萬億次浮點運算的單精度性能、以及每秒 118.5 萬億次浮點運算的深度學習性能。NVIDIA RTX 內置的 NVIDIA OptiX AI-denoiser 可實現實時的 AI 去噪，英偉達表示且其性能相當於採用 CPU 時的 100 倍。

NVIDIA AI 平台：多項重大改進

而後，如同往屆，黃仁勛對英偉達 AI 平台做了介紹，公布了其中的一系列重要進展，包括全新 Tesla V100 32GB GPU 的 2 倍內存、革命性的 NVSwitch 結構、以及全面的軟體堆棧推動性能提升、深度學習工作站 DGX-2 成為首款性能高達每秒 2 千萬億次浮點運算的深度學習系統、發布深度學習引擎 TensorRT 4 等。英偉達表示，相較於六個月前發布的上一代產品 DGX-1，其深度學習工作負載性能實現了 10 倍提升。

在大會上，黃仁勛宣布，新版的 Tesla V100 內存擴容了一倍。「5 年前 AlexNet 在 ImageNet 上展示了突破性的能力，」黃仁勛說道，「它有 8 層，數百個參數。而今天我們能夠看到數百層的神經網路，內含數十億參數，深度學習模型經過五年的發展，體量擴大了 500 倍。」

而這樣的計算需求可由「世界上最大的 GPU」DGX-2 進行處理，它是由 16 塊 32GB 內存的 Tesla V100 計算卡通過 NVSwitch 進行連接（顯卡間的通信速度是 PCI 的 20 倍，每秒 300Gbyte）所組成的，共擁有 2000TFPLOS 的 Tensor Core 算力，售價 39.9 萬美元。NVSwitch 是今天黃仁勛宣布的全新的 GPU 互聯結構。

DGX-2 是首款能夠提供每秒兩千萬億次浮點運算能力的單點伺服器，具有 300 台伺服器的深度學習處理能力，佔用 15 個數據中心機架空間，而體積則縮小 60 倍，能效提升 18 倍。

而後，黃仁勛宣布了英偉達在 AI 推理上的一系列動作。黃仁勛表示，基於在數據中心、汽車應用、以及包括機器人和無人機等嵌入式設備領域中，諸如語音識別、自然語言處理、推薦系統、以及圖像識別等新功能的支持，面向深度學習推理的 GPU 加速正在獲得越來越多的關注。

「我們需要超級計算機來幫助自己尋找更高效的能源存儲方法，探索地球的內部，預測未來的自然災害，以及模擬微觀世界的變化。」黃仁勛說道。

英偉達宣布推出新版 TensorRT 推理軟體 TensorRT 4，並將 TensorRT 集成至谷歌的 TensorFlow 框架。

英偉達表示，TensorRT 4 可用於快速優化、驗證及部署在超大規模數據中心、嵌入式與汽車 GPU 平台中經過訓練的神經網路。相比 CPU，針對計算機視覺、神經網路機器翻譯、自動語音識別、語音合成與推薦系統等常見應用，該軟體最高可將深度學習推理的速度加快 190 倍。而且為了進一步精簡開發，英偉達與谷歌的工程師已將 TensorRT 集成至 TensorFlow 1.7，使得在 GPU 上運行深度學習推理應用更加容易。

此外，英偉達還宣布了面向 Kubernetes 的 GPU 加速，以促進企業在多雲 GPU 集群上的推理部署。英偉達將針對開源社群強化 GPU 性能，以支持 Kubernetes 生態系統。

推出 DRIVE Constellation 模擬系統

自動駕駛一直是 GTC 大會的重要部分，今天，英偉達展示了一套用於使用照片級真實感模擬，基於雲的自動駕駛汽車測試系統。

該系統被稱為 NVIDIA DRIVE Constellation，是一種基於兩種不同伺服器的計算平台。第一台伺服器運行 NVIDIA DRIVE Sim 軟體，用以模擬自動駕駛汽車的感測器，如攝像頭、激光雷達和雷達。第二台伺服器搭載了 NVIDIA DRIVE Pegasus AI 汽車計算平台，可運行完整的自動駕駛汽車軟體堆棧，並能夠處理模擬數據，這些模擬數據如同來自路面行駛汽車上的感測器。

要實現自動駕駛汽車的量產部署，我們需要一種能夠在數十億英里的行駛中進行測試和驗證的解決方案，以實現足夠安全性和可靠性。黃仁勛介紹說，DRIVE Constellation 可以將視覺計算和數據中心方面的專業知識相結合以實現這一目標。藉助虛擬現實技術，測試者可通過對數十億英里的自定義場景和極端情況進行測試，從而提高演算法的穩定性，而花費的時間和成本僅為實際道路測試的一小部分。

此外，英偉達還推出了機器人開發平台 ISSAC 等工具。同時宣布與 ARM 展開合作。兩家公司正在合作將開源的 NVIDIA 深度學習加速器 NVDLA 架構集成到 Arm 的 Project Trillium 平台上，以實現機器學習。此次合作將使物聯網晶元公司能夠輕鬆地將 AI 集成到自己的設計中，並幫助它們將智能化且價格低廉的新產品帶給全球數十億的消費者。

小結

英偉達 GTC 大會從 2009 年開辦以來，越來越受到人們的關注。而隨著人工智慧的火熱，GPU 價值也水漲船高。而本屆 GTC 相比於第一屆，參會人數增加了近 10 倍，火熱程度也超乎以往。但遺憾的是，今天的發布仍然圍繞商用計算設備進行，不像國內外眾多媒體猜測的那樣會發布新一代 Geforce 顯卡。或許，眾多玩家還要繼續等待一段時間。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

※斯坦福大學教授Christopher Manning提出全可微神經網路架構MAC：可用於機器推理
※做藍牙晶元，開放物聯協議，這是阿里AI Labs面對新挑戰做出的決定

TAG:機器之心 |