當前位置:
首頁 > 科技 > VCZ曝光NVIDIA Turing架構秘密:SM單元大改,CUDA性能提升50%

VCZ曝光NVIDIA Turing架構秘密:SM單元大改,CUDA性能提升50%

NVIDIA第一批光線追蹤顯卡評測解禁臨近,但我們依然對其中Turing架構的細節一無所知,這與NVIDIA最近實施最強的管控措施有關,從源頭上就限制住各方提前爆料的可能性,比如說顯卡不能提前給媒體、限制驅動分發等等。所以想提前知道詳細規格、性能如何?但這難不倒VideoCardZ,他們居然曝光了Turing架構顯卡的一些秘密,比方說SM單元大改,CUDA性能提升50%,RTX 2070其實用TU106核心,還有一大堆新的著色技術引入。

由於NVIDIA尚未公布Turing架構白皮書,很多細節無法得知。但VideoCardZ不知道哪裡搞來了全套架構圖,公布的架構圖與NVIDIA官方傳統風格不一樣,可能是為了規避水印而做的高清重製版本,真實性應該可以得到確認,不然沒事誰會亂P一個架構圖呢?

我們先來看看SM單元的組成吧。除了原有的FP32單精度單元,FP64雙精度單元全都砍掉了,加入了INT32單元以及Tensor Core,底下新增加了一個相對獨立的RT Core。VCZ還提到Turing架構SM單元還將共享緩存、L1緩存、紋理緩存引入了統一架構,可以讓L1緩存更充分利用資源,這樣的設計可以使得每一個CUDA單元獲得50%的性能提升。

再回到比較大的層面上,看看RTX 2080 Ti的TU102框架圖,這可不得了非常壯觀的規格。TU102一共分為6組GPC單元,每組GPC單元又擁有12個SM單元,一共是72個SM單元,但RTX 2080 Ti也只是用了68個而已。同時按照已經RTX 2080 Ti已經公布的參數,可以計算得出,每個SM單元將會配備64個CUDA、8個Tensor Core 、1個RT Core。

完整版的TU106核心依然是6組GPC單元,不過每組GPC改為8個SM單元,一共是48個,RTX 2080的GPU核心是TU104-400,只用上了46組,還有預留有2組空缺的。VCZ給出的數據是545平方毫米,一共有136億晶體管。

原本以為RTX 2070依然會是TU104核心「閹割」下來,但是VCZ確實是全新的核心型號TU106,你可以將其視作RTX 2080 Ti規格砍半,3組GPC單元,3×12=36組SM單元,經過計算,RTX 2070是滿血版的TU104核心。VCZ給出的數據時454平方毫米,一共有106億晶體管。但是這樣算下來,RTX 2070規格並不比GTX 1080好多少,性能提升堪憂。

Turing顯卡使用了新的顯存無損壓縮技術,不過VCZ也只是簡單說明了相比於Pascal顯卡有50%帶寬增長而已,沒具體說明。

此外NVLink可以確認為RTX 2080 Ti、RTX 2080獨享,RTX 2070並不支持。此外新的Turing顯卡使用了新的視頻圖像引擎,支持Displayport 1.4標準,最高可以輸出8K@60Hz圖像,還可以一次性驅動兩台這樣的顯示器。 新編解碼引擎,可以編碼H.265 8k@30FPS視頻,或者解碼YUV 4:4:4 10/12bit HDR 8K和VP9 10/12bit HDR視頻。

還有一大堆新的著色技術,比如Mesh Shading 、Variable Rate Shading (VRS)、Texture-Space Sharing、Multi-View Rendering (MVR) 等。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 超能網 的精彩文章:

亞馬遜CPU排行榜:Core i7-8700K勇奪第一,但TOP5有4款AMD的
蘋果MacBook Pro 2018價格匯總,皇帝頂配版居然要4.45萬元!

TAG:超能網 |