當前位置:
首頁 > 科技 > NVIDIA公開Volta顯卡秘密:完整版5376個核心,能效提升50%

NVIDIA公開Volta顯卡秘密:完整版5376個核心,能效提升50%

AMD將在8月初發布RX Vega遊戲顯卡,也將重返高性能顯卡市場,但是Vega這次面對的對手不只是16nm Pascal顯卡,還有NVIDIA新一代12nm FFN工藝的Volta顯卡。今年5月份NVIDIA率先發布了Tesla V100加速卡,用的是GV100大核心,遊戲市場的Volta顯卡問世只是時間問題,它不會像Vega顯卡那樣難產。今天NVIDIA又公開了Volta核心的架構秘密,確認了Volta完整版核心是84組SM單元,總計5376個CUDA核心,而且SM單元能效比Pascal這一代提升50%,而現在的GV100大核心只啟用了80組SM單元,5120個CUDA核心,NVIDIA還留有殺招。

NVIDIA公開Volta顯卡秘密:完整版5376個核心,能效提升50%

NVIDIA上個月發布了Volta架構首個產品Tesla V100

在5月份的GTC大會上,老黃在主題演講中已經公布了不少Volta顯卡的細節,發布會時間有限,不過可能全部講解Volta,現在NVIDIA又發布了Volta顯卡的架構白皮書(鏈接點此),詳細介紹了Volta架構的細節,技術飯可以下載收藏。

NVIDIA公開Volta顯卡秘密:完整版5376個核心,能效提升50%

NVIDIA確認Volta完整版擁有84組SM單元

我們之前在超能課堂(88):Volta顯卡架構、性能解析,頻率紅利到頭了?一文中已經介紹了Volta顯卡大部分技術內容了,不願意翻英文的玩家也可以看看這篇文章。簡單看了下這個白皮書,NVIDIA正式確認了完整版Volta顯卡是84組SM單元,每個SM單元有64組FP32浮點單元、64組INT32整數單元、32組FP64雙精度浮點單元、8個Tensor單元(用於深度學習、AI的張量處理器)、4個紋理單元,外加8組512bit顯存控制器,每個HBM 2堆棧搭配2組顯存控制器,總計有5376個CUDA核心(FP32、INT32)、2688個FP64單元、336個紋理單元、672個Tensor單元,還有4096bit等效位寬、16GB HBM 2顯存,帶寬900GB/s。

NVIDIA公開Volta顯卡秘密:完整版5376個核心,能效提升50%

Tesla V100加速卡具體規格

NVIDIA的Volta顯卡使用了TSMC與NVIDIA定製的12nm FFN工藝,而TSMC的12nm工藝實際上也是基於目前16nm工藝改良的,主要優化了能耗、核心面積,性能比16nm FFC工藝提升10%,但是核心面積可縮減20%。即便如此,GV100大核心的面積依然從目前的610mm2增加到了815mm2,主要原因就是SM單元數量大增,從60組SM單元增加到了84組。

根據NVIDIA的白皮書介紹,Volta架構的SM單元做了大幅改進,新的SM單元能效比Pascal這代提升50%,因此才能在同樣的功耗封裝下大幅提升FP32/FP64計算性能。

NVIDIA公開Volta顯卡秘密:完整版5376個核心,能效提升50%

Volta架構的SM單元設計

當然,NVIDIA在Volta顯卡上的重點除了提升傳統的FP32/FP64計算性能之外,最重要的還是提升深度計算性能,為此增加了專用的計算單元,每組SM單元有8個Tensor單元,總計640個Tensor單元,Tensor性能可達120TFLOPS,是Pascal這代的12倍多。

不過現在的GV100大核心很有可能跟去年的GP100大核心一樣專用於計算市場,真正對遊戲玩家有影響的還是後面的GV102核心,NVIDIA勢必要做些精簡,比如砍掉對遊戲沒用的Tensor單元,減少L2緩存,HBM 2顯存也沒必要,SM單元很有可能也會重組,可以預見遊戲用的GV102核心會進一步降低能耗,不過CUDA核心總數相比Pascal也會大幅提升,遊戲性能再上一個台階。

此前也有一些Volta顯卡在路上的傳聞,不過對NVIDIA來說出Volta顯卡沒什麼阻礙,只是他們如何選擇的問題,畢竟今年才發布了GTX 1080 Ti、Titan Xp以及GT 1030顯卡,布局已經很完整了,Volta顯卡並無緊迫性,除非AMD的RX Vega顯卡表現驚人,NVIDIA需要新一代產品來壓制,這時候Volta顯卡發布上市進度才會加快,大家覺得今年有這個可能嗎?來找小超哥(id:9501417)微信討論下吧。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 超能網 的精彩文章:

GAMEMAX推出6口多U充電器:獨特子母系統,眾籌價199元起
Switch上遊戲還不夠多,那你可以自己編程一個出來玩
高通是不給聯發科活路了,驍龍450也要上14nm工藝
挖礦致RX 580售價逼近4000元,AMD顯卡缺貨時間比預期更長

TAG:超能網 |

您可能感興趣

NVIDIA再發一款圖靈顯卡Tesla T4:75W TDP,2560個CUDA核心
NVIDIA發布最便宜的Quadro RTX 4000顯卡,RTX 2070同款核心
NVIDIA發布HGX-2超算:16路Volta大核心,512GB HBM2顯存
完整版TU117核心?傳聞NVIDIA要推GTX 1650 Ti顯卡
AMD 128核心VS. Intel 96核心:戰未來
英特爾的核心i7-8750H在MSI GE63 Raider RGB上的性能提升了49%
AMD 7nm Zen2良品率已達70%:兩倍於Intel 14nm 28核心
NVIDIA TU107核心曝光:難道是MX250?
AMD不放棄14/12nm:X570確認14nm IO核心升級12nm
AMD不放棄14/12nm:X570確認14nm IO核心升級12nm
14核心加速5.1GHz!Intel i9-9990XE首測:255W TDP著實猛
神秘的NVIDIA顯卡核心安培再次現身,還有GTX 2070/2080顯卡?
AMD再掀核戰爭,7nm Ryzen3000系列cpu最高16核心,5.1GHz
RTX 2070/2060 SUPER竟有三種分支型號?GPU-Z開發者認為NVIDIA在「降級」老核心
回收再利用:NVIDIA GTX 1066 GDDR5X版其實是GTX 1080殘次核心
AMD發布嵌入式EPYC、Ryzen APU:16核心功耗僅100W
AMD Ryzen 9 3800X曝光,16個核心主頻最高4.7GHz
14核心加速5.1GHz!Intel i9-9990XE性能首曝:255W功耗值了
10nm移動旗艦!Intel i7-8559U曝光:四核心/頻率2.7GHz
12nm給力!AMD RX 590顯卡核心頻率提升20%