英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬
英偉達的新殺器又來了。
剛剛,在 GTC 2018 大會上,黃仁勛發布全球最大 GPU。
他說的是 DGX-2。
DGX-2 能夠實現每秒 2 千萬億次浮點運算(2 PFLOPS),性能比去年 9 月推出的 DGX-1 性能提高了 10 倍,售價 39.9 萬美元(人民幣 250 萬元)。
這次的 GTC 2018 大會在美國加州聖何塞舉行,黃仁勛照例身著皮衣登台演講。(官方還特別提示:這次是一件全新的皮衣)
而老黃這次的演講主題,是四個 Amazing:amazing graphics、amazing science、amazing AI、amazing robots。
首先,從不可思議的圖像開始。
在這個環節里,黃仁勛介紹了英偉達在圖像實時光線追蹤處理方面的最新進展,展示了細膩的反射效果。
這項技術,稱為 RTX。它面向圖形領域,藉助深度學習技術,實現了實時光線追蹤。
然後黃仁勛發布了首款基於 Volta 架構的工作站 GPU:Quadro GV100。
它支持英偉達 RTX 技術,支持 NVLink 2,32GB 容量 HBM2 顯存。兩個 GV100 相連,可以提供 10000 多個 CUDA 核心,236 teraflops 的 TensorFlow 核心。
說著說著,老黃又開始講這句:買得越多,省得越多。(The more GPUs to buy, the more money you save.)
「來 GTC,學習如何節省百萬美元。」老黃髮出誠懇的建議。
然後進入不可思議的科學環節。
我們正處在 GPU 計算的關鍵點,黃仁勛表示。這部分他還介紹 TESLA V100 等產品的多快好省,也談到一些 GPU 在計算和醫療影像方面的貢獻。
比如醫療影像超級計算機 CLARA。
深度學習給醫療影響的識別帶來了諸多變革,但投入到實際使用中卻很難。醫院用著十幾年前生產的超聲儀,黑白渣畫質成了醫療進步的阻礙。
要等所有醫院升級設備,可能要花上 30 年。
CLARA 是一款醫療影像的超級計算機,讓醫院可以升級那些已有的系統。醫生可以仍然用原有的超聲、CT 等設備,然後將圖像輸入超級計算機,推理出更清晰的圖像。
在這個項目上,英偉達聯合了一大群醫療行業的合作夥伴:
以及在這個環節,黃仁勛又引導全場跟他念:買得越多,省得越多。
來到不可思議的 AI 環節。
這個環節的主題是「全球最大的 GPU」。
首先,英偉達把 Volta V100m 每張卡的內存擴大到 32GB。適用於內存密集型的深度學習和高性能計算,還能將內存受限的 HPC 應用性能提升高達 50%。
其次,是全新發布的互聯結構 NVSwitch,帶寬比最好的 PCIe 交換機高出 5 倍,最高支持 16 個 Tesla V100 同時以 2.4TB/秒的速度進行通信。
最後,一個全新的 DGX 伺服器發布了。
黃仁勛說這個現在是全球最大的 GPU 了:新的 DGX-2,包括 20 億個晶體管,12 個交換機。每個 GPU 都可以通過光纖交換機互相通信,比 PCIe 介面快 20 倍。
DGX-2 的算力可達 2 千萬億次浮點運算,功耗 10 千瓦。這台機器內部是 NVLink 連接的兩組 Tesla V100 陣列。
與 6 個月前發布的 DGX-1 相比,DGX-2 提速 10 倍。
五年前,在兩塊 GTX 580 上進行 Alexnet 訓練耗時六天,現在使用 DGX-2,可以在 18 分鐘以內完成。
這款產品將於今年三季度發售,每台價格 39.9 萬美元(人民幣 250 萬元)。
DGX-2 具有 300 台伺服器的深度學習處理能力,佔用 15 個數據中心機架空間,而體積則縮小 60 倍,能效提升 18 倍。
此外,英偉達還更新了 CUDA、TensorRT、NCCL、cuDNN 等深度學習和 HPC 軟體堆棧。
新版的 TensorRT 能快速優化、驗證和部署在超大規模的數據中心,針對更廣泛的應用加速深度學習推理。它最高可以 將深度學習推理的速度加快 190 倍,降低 70% 的數據中心成本。
TensorRT 4 還集成到了谷歌 TensorFlow 1.7 版本中,更易於使用。
另外,NVIDIA 還宣布和 ARM 合作,將英偉達深度學習加速器架構集成到 Arm 的 Project Trillium 上,在手機、智能家居等設備上實現深度學習推理。
以及英偉達 GPU 現在支持 Kubernetes 了。這是一個基於容器技術的分散式架構方案。這個技術讓英偉達的 GPU 進一步加速。
還有一事,英偉達驕傲的宣布,TITAN V 仍然斷貨中。
最後是不可思議的機器人環節。
發布了機器人開發工具包 Issac SDK 之後,話題轉向了自動駕駛。
「我們正試圖從頭到尾了解這個系統,這其中包含四個最重要的方面:數據收集、模型訓練、模擬和駕駛。」老黃說,這個了解過程,大約花了 5 到 7 年。
老黃在現場,又展示了一把雲代駕。
他把 VR 和自動駕駛結合起來。通過一個 VR 眼鏡和方向盤,就能啟動自動駕駛汽車。
雲代駕所用的平台,是新鮮發布的 NVIDIA DRIVETM Constellation,基於兩台伺服器。
第一台伺服器運行 NVIDIA DRIVE Sim 軟體,用以模擬自動駕駛汽車的感測器,如攝像頭、激光雷達和雷達。第二台伺服器搭載 NVIDIA DRIVE PegasusTM AI 汽車計算平台,可運行完整的自動駕駛汽車軟體堆棧,並能夠處理模擬數據,這些模擬數據如同來自路面行駛汽車上的感測器。
老黃又詳細介紹了英偉達的感知基礎架構。
每輛汽車都在收集 PB 級的數據,每個月有 1500 人大概標註 100 萬件物品。
老黃表示,英偉達並沒有試圖建立一個基於軟體定義的計算機的自主車輛系統,確切的說是在研究一個架構。
英偉達以 Drive PX Parker 單晶元架構為基礎創建 DRIVE Xavier。這是一個四晶元系統,包含兩個 Xaviers 和兩個 Voltas。
這台耗能 300 瓦的電腦正在用於機器人汽車,將於今年晚些時候投入生產。
對了,這項技術英偉達擁有全部產權。
BTW,英偉達今天還宣布暫停了自動駕駛測試。
可能是受此影響,發布會一開始,英偉達股價就同步下跌,至發布會結束,英偉達股價累積下跌 6.64%。
※家樂福運用區塊鏈進行食品安全溯源
※極米推出 1080p 無屏電視 Z6,售價 3000 元內 |CES 2018
TAG:動點科技 |