當前位置:
首頁 > 科技 > 英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

英偉達的新殺器又來了。

剛剛,在 GTC 2018 大會上,黃仁勛發布全球最大 GPU。

他說的是 DGX-2。

DGX-2 能夠實現每秒 2 千萬億次浮點運算(2 PFLOPS),性能比去年 9 月推出的 DGX-1 性能提高了 10 倍,售價 39.9 萬美元(人民幣 250 萬元)。

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

這次的 GTC 2018 大會在美國加州聖何塞舉行,黃仁勛照例身著皮衣登台演講。(官方還特別提示:這次是一件全新的皮衣)

而老黃這次的演講主題,是四個 Amazing:amazing graphics、amazing science、amazing AI、amazing robots。

首先,從不可思議的圖像開始。

在這個環節里,黃仁勛介紹了英偉達在圖像實時光線追蹤處理方面的最新進展,展示了細膩的反射效果。

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

這項技術,稱為 RTX。它面向圖形領域,藉助深度學習技術,實現了實時光線追蹤。

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

然後黃仁勛發布了首款基於 Volta 架構的工作站 GPU:Quadro GV100。

它支持英偉達 RTX 技術,支持 NVLink 2,32GB 容量 HBM2 顯存。兩個 GV100 相連,可以提供 10000 多個 CUDA 核心,236 teraflops 的 TensorFlow 核心。

說著說著,老黃又開始講這句:買得越多,省得越多。(The more GPUs to buy, the more money you save.)

「來 GTC,學習如何節省百萬美元。」老黃髮出誠懇的建議。

然後進入不可思議的科學環節。

我們正處在 GPU 計算的關鍵點,黃仁勛表示。這部分他還介紹 TESLA V100 等產品的多快好省,也談到一些 GPU 在計算和醫療影像方面的貢獻。

比如醫療影像超級計算機 CLARA。

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

深度學習給醫療影響的識別帶來了諸多變革,但投入到實際使用中卻很難。醫院用著十幾年前生產的超聲儀,黑白渣畫質成了醫療進步的阻礙。

要等所有醫院升級設備,可能要花上 30 年。

CLARA 是一款醫療影像的超級計算機,讓醫院可以升級那些已有的系統。醫生可以仍然用原有的超聲、CT 等設備,然後將圖像輸入超級計算機,推理出更清晰的圖像。

在這個項目上,英偉達聯合了一大群醫療行業的合作夥伴:

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

以及在這個環節,黃仁勛又引導全場跟他念:買得越多,省得越多。

來到不可思議的 AI 環節。

這個環節的主題是「全球最大的 GPU」。

首先,英偉達把 Volta V100m 每張卡的內存擴大到 32GB。適用於內存密集型的深度學習和高性能計算,還能將內存受限的 HPC 應用性能提升高達 50%。

其次,是全新發布的互聯結構 NVSwitch,帶寬比最好的 PCIe 交換機高出 5 倍,最高支持 16 個 Tesla V100 同時以 2.4TB/秒的速度進行通信。

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

最後,一個全新的 DGX 伺服器發布了。

黃仁勛說這個現在是全球最大的 GPU 了:新的 DGX-2,包括 20 億個晶體管,12 個交換機。每個 GPU 都可以通過光纖交換機互相通信,比 PCIe 介面快 20 倍。

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

DGX-2 的算力可達 2 千萬億次浮點運算,功耗 10 千瓦。這台機器內部是 NVLink 連接的兩組 Tesla V100 陣列。

與 6 個月前發布的 DGX-1 相比,DGX-2 提速 10 倍。

五年前,在兩塊 GTX 580 上進行 Alexnet 訓練耗時六天,現在使用 DGX-2,可以在 18 分鐘以內完成。

這款產品將於今年三季度發售,每台價格 39.9 萬美元(人民幣 250 萬元)。

DGX-2 具有 300 台伺服器的深度學習處理能力,佔用 15 個數據中心機架空間,而體積則縮小 60 倍,能效提升 18 倍。

此外,英偉達還更新了 CUDA、TensorRT、NCCL、cuDNN 等深度學習和 HPC 軟體堆棧。

新版的 TensorRT 能快速優化、驗證和部署在超大規模的數據中心,針對更廣泛的應用加速深度學習推理。它最高可以 將深度學習推理的速度加快 190 倍,降低 70% 的數據中心成本。

TensorRT 4 還集成到了谷歌 TensorFlow 1.7 版本中,更易於使用。

另外,NVIDIA 還宣布和 ARM 合作,將英偉達深度學習加速器架構集成到 Arm 的 Project Trillium 上,在手機、智能家居等設備上實現深度學習推理。

以及英偉達 GPU 現在支持 Kubernetes 了。這是一個基於容器技術的分散式架構方案。這個技術讓英偉達的 GPU 進一步加速。

還有一事,英偉達驕傲的宣布,TITAN V 仍然斷貨中。

最後是不可思議的機器人環節。

發布了機器人開發工具包 Issac SDK 之後,話題轉向了自動駕駛。

「我們正試圖從頭到尾了解這個系統,這其中包含四個最重要的方面:數據收集、模型訓練、模擬和駕駛。」老黃說,這個了解過程,大約花了 5 到 7 年。

老黃在現場,又展示了一把雲代駕。

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

他把 VR 和自動駕駛結合起來。通過一個 VR 眼鏡和方向盤,就能啟動自動駕駛汽車。

雲代駕所用的平台,是新鮮發布的 NVIDIA DRIVETM Constellation,基於兩台伺服器。

第一台伺服器運行 NVIDIA DRIVE Sim 軟體,用以模擬自動駕駛汽車的感測器,如攝像頭、激光雷達和雷達。第二台伺服器搭載 NVIDIA DRIVE PegasusTM AI 汽車計算平台,可運行完整的自動駕駛汽車軟體堆棧,並能夠處理模擬數據,這些模擬數據如同來自路面行駛汽車上的感測器。

老黃又詳細介紹了英偉達的感知基礎架構。

每輛汽車都在收集 PB 級的數據,每個月有 1500 人大概標註 100 萬件物品。

老黃表示,英偉達並沒有試圖建立一個基於軟體定義的計算機的自主車輛系統,確切的說是在研究一個架構。

英偉達以 Drive PX Parker 單晶元架構為基礎創建 DRIVE Xavier。這是一個四晶元系統,包含兩個 Xaviers 和兩個 Voltas。

這台耗能 300 瓦的電腦正在用於機器人汽車,將於今年晚些時候投入生產。

對了,這項技術英偉達擁有全部產權。

BTW,英偉達今天還宣布暫停了自動駕駛測試。

可能是受此影響,發布會一開始,英偉達股價就同步下跌,至發布會結束,英偉達股價累積下跌 6.64%。

英偉達發布全球最大 GPU:性能提升 10 倍,售價 250 萬

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 動點科技 的精彩文章:

家樂福運用區塊鏈進行食品安全溯源
極米推出 1080p 無屏電視 Z6,售價 3000 元內 |CES 2018

TAG:動點科技 |