當前位置:
首頁 > 科技 > 關於我們剛下單的TITAN V,你只要知道以下7點就行了

關於我們剛下單的TITAN V,你只要知道以下7點就行了

不得不說,NVIDIA CEO 黃仁勛對於非Gefore系列產品保密實在是太好了,每一次「核彈」發布都是出其不意。今天老黃在在NIPS 2017全球神經信息處理系統大會上突然就發布了全新Volta架構的NVIDIA TITAN V!CUDA流處理器暴增至5120個,配備了12GB的HBM 2顯存,單精度浮點性能高達15TFlops,而表示深度計算能力的Tensor性能高達110TFlops,相當於TITAN Xp的9倍。顯然這張TITAN V已經側重於AI人工智慧、深度計算上,與我們遊戲玩家漸行漸遠了,那麼這張TITAN V有什麼值得我們關注的亮點呢?

關於我們剛下單的TITAN V,你只要知道以下7點就行了

關於我們剛下單的TITAN V,你只要知道以下7點就行了

全新Volta架構:

雖然目前NVIDIA還沒有吹Volta架構的新特性,不過顯然已經針對HBM 2顯存做足了優化,通過新的內存控制器對超高位寬的HBM 2性能發揮到極致,以此保證比前作TITAN Xp 1.2倍的內存帶寬,在運行負載時,可以讓內存帶寬利用率提升至95%的新水平。

如果你要問目前Tesla V100以及TITAN V所採用的GV100核心是否已經「滿血」,那麼可能要大失所望了,這並不是滿血版。根據NVIDIA早前放出的Volta架構白皮書,顯示最頂級的GV100核心將會有6組GPC單元,每組GPC單元由14組SM單元構成,滿血版應該是6 x 14 = 84組SM單元,但Tesla V100/TITAN V均只有80組,每組SM單元64個CUDA單元,因此共同構成80 x 64 = 5120個CUDA單元,創下了歷史之最。但顯然,NVIDIA還留有4組SM單元殺招。

關於我們剛下單的TITAN V,你只要知道以下7點就行了

根據NVIDIA的白皮書介紹,Volta架構的SM單元做了大幅改進,新的SM單元能效比Pascal這代提升50%,因此才能在同樣的功耗封裝下大幅提升FP32/FP64計算性能。

1:2的單雙精度比:

之前的TITAN顯卡為了在遊戲性能與功耗之間做出平衡,無情地砍掉了雙精度單元,讓TITAN Xp上的單雙精度單元比將至1:32的新低水平。不過這一代TITAN V似乎不側重於遊戲方面了,不僅高達2999美元的售價,還有其雙精度單元也回來了,重新回到1:2的比例。雙精度性能由TITAN Xp可憐的0.38TFLOPS提升至6.9TFLOPS,提升幅度高達18倍。

關於我們剛下單的TITAN V,你只要知道以下7點就行了

12nm FFN工藝:

Volta顯卡使用TSMC台積電與NVIDIA定製的12nm FFN工藝是早就確認的事情,和之前的16nm相比有哪些改進?其實就是16nm的第四代改良版本,為了打敗競爭對手,不惜玩弄文字遊戲。不過提升還是有的,表現在更高的晶體管密度、更低的功耗,性能比16nm FFC工藝提升10%,但是核心面積可縮減20%。

即便如此,GV100大核心的面積依然從目前的GP100核心的610mm2增加到了815mm2。核心面積增大如此之多主要是因為42%的CUDA單元增長導致的。

12GB HBM 2顯存:

HBM 2顯存 NVIDIA也不是第一天用,只不過速度上更快一些,由Tesla P100上的700MHz提升到850MHz,供應商很大幾率還是三星,應該也是單顆粒4GB容量,3顆構成TITAN V上的3072-bit 12GB HBM 2顯存,顯存帶寬再抬升一個台階達652.8GB/s。

在架構圖上,GV100完整核心是有8組512bit顯存控制器,每個HBM 2堆棧搭配2組顯存控制器。

關於我們剛下單的TITAN V,你只要知道以下7點就行了

640個Tensor單元:

顯然NVIDIA已經將公司前景壓在了AI與深度計算上,因此開發適用於深度計算的運算單元很有必要,可以在硬體層面上快速提升深度計算能力,做到事半功倍效果。

新的 Tensor Core 是專門為深度學習設計的,為相應的浮點運算速度帶來了 12 倍的提升。並且由此擁有了獨立的、並行的整型和浮點型數據通路,Volta SM單元在負載上也更高效,混合了計算與地址運算。Volta 新的獨立線程調度能力使得並行線程之間的細粒度同步協同成為可能。

關於我們剛下單的TITAN V,你只要知道以下7點就行了

正正是特事特辦的方式,讓TITAN V擁有了640個Tensor單元,提供高達110TFLOPS的深度計算性能,是沒有Tensor單元的TITAN Xp 9倍之多。

關於我們剛下單的TITAN V,你只要知道以下7點就行了

沒有NVLink/SLI:

原本NVLink是專屬於NVIDIA計算卡一種高帶寬的互聯技術,能夠在CPU-GPU和GPU-GPU之間實現超高速的數據傳輸。誕生之初就獲得傳統PCIe 3.0(32GB/S)5-12倍的數據傳輸速度,還能大幅提升應用程序的處理速度。在最新的Volta架構中,NVIDIA將其提升至300GB/s水平,幾乎是PCI-E 3.0的10倍速度。

Telsa V100是支持使用Quadro NVLINK Bridge,而且一次用兩個,一條橋價格是599美元,約等於一張GTX 1080架構。不過你放心,TITAN V壓根就不支持這玩意,經過向NVIDIA官方求證,Quadro NVLINK Bridge僅適用於Quadro以及Telsa系列產品,TITAN V並不支持,上面的介面被背板夾住,是插不進去的,就是個樣子貨,連SLI HB橋都不能用。

關於我們剛下單的TITAN V,你只要知道以下7點就行了

看清楚,這金手指被夾住了

關於我們剛下單的TITAN V,你只要知道以下7點就行了

我就是賣那麼貴

2999美元售價:

這價格貴嗎?比起TITAN Xp的1200美元當然貴多了,我買兩張TITAN Xp 星戰典藏版還沒一張TITAN V貴呢!也難怪NVIDIA全球副總裁張建中會說,下一代遊戲卡更貴。

但是你想想這一代的TITAN顯然不是針對遊戲玩家,使用了GV100頂級核心、12GB HBM 2顯存、不砍雙精度單元,這不就是工作站卡、計算卡嗎?賣1.98萬元人民幣真的不貴。

關於我們剛下單的TITAN V,你只要知道以下7點就行了

對比起Tesla V100報價1萬美元起(6.6萬人民幣),或者是報價149000美元(98.6萬人民幣)擁有8張Telsa V100的新DGX-1售價來說,甚至說1.98萬元人民幣有點仁慈了。

在NIPS 2017大會上,NVIDIA CEO黃仁勛高興地說道「我們將會把TITAN V送到世界各地的研究人員手中,迫不及待地分享突破性發現」。是的,老黃又調皮了,現場送出了20張TITAN V。

寫在最後:

爾等都在流口水是吧,沒錯,我們也一樣,既然連NVIDIA TITAN Xp Colletor"Edition星球大戰典藏版都買了兩張,老黃不送就自己買唄。

是的,不好意思,我們小手一抖,TITAN V即將到手。用了最快的快遞,你們等著全網首發吧。

關於我們剛下單的TITAN V,你只要知道以下7點就行了

其實也不是要炫耀什麼,畢竟今年NVIDIA並有發布預料之中的Volta遊戲卡,玩家們都饑渴難耐地想知道GTX 2000系列顯卡的性能,我們寄望於通過目前能賣的TITAN V來進行必要的測試,以此管中窺豹。

儘管這一代的TITAN V並不像是遊戲卡,採用GV100大核心很可能只適用於深度計算以及工作站,對我們這些遊戲玩家有意義的是後續的GV102核心(可能,傳聞Volta架構顯卡不會有遊戲卡),精簡掉對遊戲毫無用處的Tensor、雙精度單元,在砍L2緩存,HBM 2顯存可以保留在旗艦卡皇上,普通卡可能是新的GDDR6顯存,做到提升性能同時保持/降低功耗。

能不能做到GTX 2060打敗GTX 1080這種事,我們還是先YY一下吧。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 超能網 的精彩文章:

寫在TGA前的速報:免費、打折、跳票、新遊戲
群聯E12主控早期跑分結果,讀寫均破3000MB/s,可媲美三星
小米Note 3拍照水平如何?DxoMark打出了90分!
蘋果仍不忘金屬機身,明年的6.1英寸iPhone將延續
Steam硬體和軟體調查:Coffee Lake很有吸引力,中文用戶最多

TAG:超能網 |