當前位置:
首頁 > 科技 > NVIDIA2080/2080Ti評測 12年等來了什麼?

NVIDIA2080/2080Ti評測 12年等來了什麼?

作為顯卡行業的個中翹楚,NVIDIA在這個行業里摸爬滾打十餘載,積累了想打一部分的用戶群體。雖說這兩年AMD發力在顯卡方面有了一定的聲音,但是從市場份額和用戶粘性來講的話,NVIDIA仍然可以說是整個顯卡市場的領頭羊。

但是,今年的NVIDIA卻有些「反常」。首先,在今年的顯卡發布會上,NVIDIA就推遲了3個月左右的時間,要知道基於Pascal的10系顯卡是在2016年5月份發售的,往常的顯卡一般都會選擇3~6月份發售;第二,也是最不可思議的一點,今年的NVIDIA口風極嚴,發布會開始前人們討論最多的話題居然還是「新顯卡到底是11系還是20系」、「新顯卡架構到底是Volta伏特、Ampere安培還是Turing圖靈」這種最初級的命名形式。至於性能以及重大變化幾乎沒有人討論,因為真的是一點信息都沒有,這也是令我們最為頭疼的一點。

時至今日,再看NVIDIA的這波操作,我們也不難理解是因為什麼:首先,Turing圖靈架構相比以往發生了翻天覆地的變化,RT CORE和TENSOR CORE的加入,使得SM單元整體的計算模式發生了改變,RTX光線追蹤技術的首次引入和其它一系列的變化,值得此次NVIDIA花費這麼大的力氣來保密。

Turing圖靈架構的四個基本特徵

RTX基於微軟DX12中的DXR

其實,老黃在發布會上的那句「Turing圖靈架構是NVIDIA十年磨一劍的產物」也證明了20系顯卡在NVIDIA發展過程中的重要戰略意義。那麼,時隔12年打磨終出檯面的RTX 20系顯卡究竟會為我們消費者帶來什麼樣的提升?別著急,接下來,讓我來為你們一一解答。

圖靈架構的基本組成

既然是全新一代架構,又被NVIDIA如此看重,我們自然要好好聊聊。首先從命名方式上來說,圖靈指的是人類計算機科學之父、人工智慧之父:艾倫·麥席森·圖靈(Alan Mathison Turing),其最有名的莫過於圖靈測試,人工智慧只有通過這個測試才能真正的被人們賦予「智能」二字。

Turing圖靈核心

那麼這次的圖靈架構相對於以往的Pascal架構可以說發生了翻天覆地的變化,總結的來說就是:更大的核心面積、更細緻的製程、Shading著色渲染的升級以及加入了全新的RT CORE、TENSOR CORE。接下來我們展開來講。

完整TU102架構圖

先來說說整體核心。這次的Turing圖靈核心目前已知性能最強的為RTX 2080Ti上的TU102核心。採用台積電12nm FFN工藝打造,基於16nm FF+演進而來,其集成189億個晶體管,核心面積為754平方毫米。這是目前已知第二大的核心了,第一是Volta架構的GV100核心,其擁有210億個晶體管,核心面積815平方毫米,妥妥的大型核彈。

那麼相比1080Ti上面的Pascal帕斯卡GP102核心,TU102晶體管數量增加了55%,面積增大了60%。而對於RTX 2080上的TU104來講,其晶體管數量也達到了驚人的136億,相比GTX 1080幾乎翻倍。

SM單元構成

其實從上面的SM單元構成上我們可以看出,這次核心面積的暴漲其實不是因為單純的堆砌CUDA數,而是因為引入了全新的RT CORE和TENSOR CORE造成的。

RT CORE 實時光線追蹤

這次的20系顯卡無論是在命名還是最大的賣點都毫無疑問的指向了一個詞——RTX光線追蹤技術,而老黃也強調這次的圖靈顯卡是可以支持REAL TIME實時的光線追蹤,這對於圖形影像方面具有劃時代的意義。

其實,光線追蹤(Ray Tracing)的概念在很早就已經被人所提出了。光線追蹤技術其實就是講光源產生的光線所產生的折射,反射等光線變化和對陰影產生的反應通過計算準確的反映到畫面之中,為人們帶來百分之百的光影效果。

光線追蹤的演變經歷了約半個世紀

光線追蹤這一技術本身並沒有多少的新鮮花樣,其演算法於1979年由Turner Whitted提出。那麼為什麼直到2006年,皮克斯的《Cars》才開始使用這項技術用於光線渲染呢?那就是因為其所需要的計算量實在是過於龐大,開頭提到的Turner這張512×512的渲染DEMO當時支持的計算機就要耗費上百萬美元,還是花費1.2小時才渲染完成,足見其耗費的資源算力是如何巨大。

光柵化和光線追蹤的區別

那麼NVIDIA是如何保證這龐大的算力需求的呢?前一篇我們已經講過,每一個SM單元里都擁有一個RT CORE,其是專門為光線追蹤服務的。而要了解RT CORE的工作原理,我們首先要了解光線追蹤所運用到的演算法:BVH。

BVH演算法說明

BVH演算法(Bounding Volume Hierarchy Traversal),層次包圍盒遍歷的意思。

比如渲染對象是一隻兔子,要幾算一條光線和兔子本身的交互,就把兔子所在空間劃分成N個包圍盒,計算光線和哪一個包圍盒相交,是的話就再把這個包圍盒繼續劃分成N個更小的包圍盒,再次計算相交,如此反覆,一直找到和光線相交的三角形所在的包圍盒,再對這個三角形進行最終的渲染。

BVH演算法可以大大減少計算每一條光線最近相交點所需要遍歷的三角形數量,而且只需要進行一次就能給所有光線使用,大大提高了執行效率。

RT CORE工作原理

那麼RT CORE的工作原理就是,著色器(Shaders)發出光線追蹤的請求,交給RT CORE來處理,RT CORE將進行兩種測試,分別為Box Intersection Evaluators和Triangle Intersection Evaluators。基於BVH演算法來判斷,如果是方形,那麼就返回縮小範圍繼續測試,如果是三角形,則反饋結果進行渲染。

RTX-OPS單位定位計算公式

而關於性能方面,由於是新技術,NVIDIA官方定義了一個光線追蹤的計算方式,其單位為RTX-OPS,公式如上圖所示。其中RTX 2080Ti為78T的RTX-OPS;RTX 2080則為 60T。而至於上一代的Pascal GTX 1080Ti也同樣適用於這個公式,但因為沒有RT CORE和TENSOR CORE,數值僅為11.3T,無法滿足實時光線追蹤的需求。

RTX光線追蹤技術ON/OFF對比

而從上圖中我們也可以看到,遊戲場景中開關RTX無論是從畫面表現還是場景互動上來說對遊戲性的提升是非常巨大的。(《戰地5》的開發人員曾說開啟RTX功能後甚至可以從伸出牆外的槍身上來看拐角處是否有敵人)

TENSOR CORE和DLSS

其實TENSOR CORE對於我們來說並不陌生,其最早出現在Volta架構中,Turing架構在浮點精度上對其作了大量的優化工作來保證計算的準確性。

Turing TENSOR CORE計算維度

Tensor在中文裡面的意思就是張量,區別於我們常見的標量(0維)、矢量(1維)、矩陣(2維),張量擁有3維或者更高維,本質核心上就是一個數據容器,可以包含更多維度數據。其主要應用就是目前大火的AI——深度學習,這裡面主要會用到FMA矩陣融合計算,而TENSOR CORE的工作方式天生就適用於這種計算。

TENSOR CORE是一個數列的運算方式

它可以對兩個4×4 FP16浮點矩陣進行相乘操作,然後將結果加入到另一個4×4 FP16/FP32浮點矩陣中,最終輸出新的4×4 FP16/FP32矩陣,NVIDIA將Tensor Core進行的這種運算稱為混合精度數學,因為輸入矩陣的精度為半精度,但乘積可以達到完全精度。

每個時鐘周期內,圖靈架構的Tensor核心可以執行64個FMA運算,從而大大加速矩陣運算,除了新的神經圖形功能外,還用於深度學習訓練和推理操作。

NGX

而在加入TENSOR CORE之後,NVIDIA還為其配置了一個全新的神經圖形框架:Neural Graphics Framework,簡稱NGX,其可以在遊戲中實現諸如DLSS深度學習超採樣抗鋸齒、AISuper Rez超級解析度、AI Slow-Mo慢動作、AI InPainting等等。

我們先來說說DLSS深度學習超採樣抗鋸齒。我們來詳細的了解一下抗鋸齒的原理和最早的SSAA抗鋸齒進行舉例。

由於高解析度下的來源信號或連續的模擬信號能夠存儲較多的數據,但在通過取樣(sampling)時將較多的數據以較少的數據點代替,部分的數據被忽略造成取樣結果有損,使機器把取樣後的數字信號轉換為人類可辨別的模擬信號時造成彼此交疊且有損,在聲音中,便會出現刺耳、不和諧的音調或是噪音。同樣,在3D繪圖時,每個圖形由像素組成,每段瞬間畫面由幀組成,因為屏幕上的像素有限,如果要表現出多邊形的位置時,因技術所限,使用絕對坐標定位法是無法做到的,只能使用在近似位置採樣來進行相對定位。由於沒有足夠的採樣來表現出3D世界中的所有物品的圖形,所以在最後圖像顯示上,這些現象便會造成在物品與物品中過渡的邊緣就會產生波浪狀、圓形、鋸齒和閃爍等有損現象,嚴重影響了畫面的質量。

如果沒有抗鋸齒......

超級採樣抗鋸齒(Super-Sampling Anti-aliasing,簡稱SSAA)是早期抗鋸齒方法,比較消耗資源,但簡單直接,先把圖像映射到緩存並把它放大,再用超級採樣把放大後的圖像像素進行採樣,一般選取2個或4個鄰近像素,把這些採樣混合起來後,生成的最終像素,令每個像素擁有鄰近像素的特徵,像素與像素之間的過渡色彩,就變得近似,令圖形的邊緣色彩過渡趨於平滑。再把最終像素還原回原來大小的圖像,並保存到幀緩存也就是顯存中,替代原圖像存儲起來,最後輸出到顯示器,顯示出一幀畫面。這樣就等於把一幅模糊的大圖,通過細膩化後再縮小成清晰的小圖。如果每幀都進行抗鋸齒處理,遊戲或視頻中的所有畫面都帶有抗鋸齒效果。而將圖像映射到緩存並把它放大時,放大的倍數被用於分別抗鋸齒的效果。

DLSS工作原理

但是無論是哪種抗鋸齒,玩家們都是在不影響畫面美觀度的基礎上盡量開到最低,因為這玩意太耗費顯卡的性能了。但是這一代的DLSS深度學習超採樣抗鋸齒卻完全不會這樣,簡單的來說,NVIDIA會通過收集數千個以64×超級採樣生成參考畫面,經過對像素點進行64次偏移著色合成輸出後,理論上畫面細節具有近乎完美的圖像效果。同時還會生成正常的渲染圖像,然後要求DLSS網路響應輸出對應結果,觀察與64×超級採樣畫面差異,調整網路權重,經過多次迭代以後,DLSS自行學習產生的結果將具有與64×超級採樣畫面相同質量的細節,還可以避免TAA產生的運動模糊等問題。

傳統TAA和DLSS 2×的細節對比

DLSS 2×相當於64×的超採樣抗鋸齒

而這一切的運算過程都是在NVIDIA的超算上進行的,不會消耗玩家的資源,NVIDIA會將每一次更新的結果放在顯卡驅動中,玩家們只要通過驅動的更新就可以享受到針對自己顯卡型號的最佳抗鋸齒。

後續首發帶有DLSS的遊戲

而在官方的PPT中,也提到了確定加入DLSS支持的15款遊戲,並且這個數字還在不斷的擴大中。值得一提的是,這其中有5款遊戲同時支持RTX光線追蹤和DLSS抗鋸齒技術,分別是《原子之心》、《逆水寒》、《劍網3》、《機甲戰士5:僱傭兵》、《古墓麗影:暗影》。

NVIDIA GeForce RTX 2080/2080Ti圖賞

在老黃開發布會前,我們其實一直在猜測今年的20系顯卡究竟是個什麼樣子。雖然現在對於我們來說沒什麼懸念,但是當時一旦有新顯卡外觀發布時我們的內心還是好奇的,包括那張騙了我們很長一段時間的假想圖,沒辦法,泰坦皮給我們的印象實在是太深刻了。

當時印象最深的猜想圖

因此當老黃在發布會公布新顯卡的外觀時,相信不止我一個有這種」不好看「的想法的,我們失去了泰坦皮,失去了渦輪風扇,只得到了一台被網友吐槽酷似」煤氣灶「的顯卡。

但隨著新顯卡到手日期的日益臨近,我心裡還是有一些激動的,畢竟這可是慢慢的信仰在裡面啊。

而直到我把它打開,才發現自己以前的想法是有多麼愚蠢,不為別的,那細緻的做工,邊緣過渡的順滑,甚至是顯卡散發的香氣,讓我忍不住說出一句」行家啊「(是不是表情逐漸變態...)

那麼我們廢話不多所,一起來看看這代20系顯卡是個什麼樣子吧。

測試平台環境一覽

為保證此次評測能夠發揮顯卡的最佳性能,本次測試平台採用第八代Intel六核心十二線程的i7-8700K、七彩虹iGame Z370-X RNG Edition V20主板、超頻3 超神 3200MHz 8GB×2內存、顯示器為航嘉X2772CK、鑫谷 崑崙1080W的電源、機箱為金河田 崢嶸 MUT1。測試平台詳細信息請看下圖。

在測試成績上,基準測試採用3DMARK和Unigine Superposition,遊戲性能測試使用遊戲自帶Benchmark或同場景幀數對比,數值均為越高越好。

理論性能測試:

首先進行的是用來衡量顯卡DX11理論性能的3DMARK FS套:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:

3DMARK FS套裝 GPU成績

在針對顯卡DX11性能的3DMARK FS套裝測試中,2080Ti在三種測試中均比1080Ti領先11%~15%左右,奇怪的是2080和2080Ti在FS套裝的成績差異較1080Ti更大,而實際遊戲效果卻和這次比較出入很大,後面會詳細提及。

3DMARK TS套裝 GPU成績

而在針對DX12性能的Time Spy和Time Spy Extreme測試中,2080Ti比1080Ti理論性能領先30%左右,2080比1080Ti領先10%左右。

Unigine Superposition測試

而在Unigine Superposition測試中,運行1080P High畫質,Turing顯卡性能提升也是非常巨大的。

那麼在實際遊戲中,三者的差距是否會像理論測試中表現的這樣呢?2080在DX11的表現就這麼不堪嗎?別急,馬上進入實機遊戲測試環節。

首先要說明的是,大家最關心的RTX在遊戲中的實際幀數和畫面表現目前並沒有一款在售遊戲支持,包括前兩天剛剛發布的,出現在NVIDIA官方演示中的《古墓麗影:暗影》市售版也並沒有出現RTX功能的選項,這是因為微軟的DX12當中的DXR的API還沒有正式發布,估計在DX12正式發布後支持RTX的遊戲就會如雨後春筍一般冒出來,我們也會第一時間在支持RTX遊戲發售後進行評測。

DX12遊戲性能測試

在遊戲性能測試環節,我們選用了2款DX12遊戲:《殺手6》、《古墓麗影:暗影》和3款DX11遊戲:《刺客信條起源》、《絕地求生》、《孤島驚魂5》進行測試,測試解析度為2K和4K。測試中我們把畫面特效調至各遊戲中的最高選項,關閉垂直同步,選用適當的抗鋸齒,用遊戲自帶Benchmark或同場景使用Fraps記錄平均幀數。首先是DX12遊戲,結果如下:

《殺手6》幀數對比

《古墓麗影:暗影》幀數對比

接下來是DX11遊戲

《刺客信條:起源》幀數對比

《絕地求生》幀數對比

《孤島驚魂5》幀數對比

在2K解析度下,以上三款顯卡均可以全程最高特效流暢運行,在幀數實際表現上,NVIDIA GeForce RTX 2080 Ti 顯卡表現出了新卡皇的實力,同比領先上一代GTX 1080Ti將近15%~25%,而在20系顯卡最拿手的4K解析度下,2080Ti相比1080Ti幀數增長約25%~40%,毫不誇張的說,以前那些運行在4K卡成「PPT」的遊戲現在均可最高特效流暢運行。

有意思的是,在前一頁1080Ti在FS套裝中分數是要高於2080的,而在遊戲中實際表現2080在每項遊戲中都是高於1080Ti的。看來有時候3DMARK也不能完全反應顯卡在使用中的真實情況。

溫度&功耗測試:

首先來看溫度測試。室溫25攝氏度,我們並沒有採用全封閉式的機箱,而是採用測試平台的手法,這樣做可以最大限度的保證顯卡除了自身散熱外將風道等外因減小到最低,如果是封閉式的機箱話需要在開放測試平台上加10到15攝氏度(取決於機箱風道設計的合理性)。

拷機溫度測試

當上圖的成績跑出來的時候,我還是非常驚訝的。要知道取決於這次碩大的核心面積,發熱量肯定是不低的,但是從實際來看2080Ti的發熱量是和1080Ti的表現持平的。不過筆者在更換顯卡測試的時候也會感覺到背板非常的燙,看來散熱其實還是可以有進步的空間的。

而另一點要點贊的就是這代的風扇。NVIDIA GeForce RTX2080/2080 Ti FE的做工沒的說,一等一的棒。體現在風扇上就是轉速非常均勻,同軸轉動不會產生風扇偏離。另外渦輪風扇中的雜訊大,易積灰的缺點通通不見,噪音非常小。

功耗測試

而在功耗測試中,三款顯卡的表現如上圖。在空載時,三款顯卡的功耗差不多,2080Ti高出1080Ti 8W左右,滿載後也相差不多。讓我們吃驚的是2080,具有比1080Ti性能還要突出的同時滿載瓦數明顯降低,看來是製程幫了大忙。

十二年,一段旅程的結束,另一旅程的開始

通過前面的測試數據我們可以發現,無論是從3DMark的基準理論測試,還是從實際遊戲性能出發,基於圖靈架構的NVIDIA GeForce RTX 2080 Ti顯卡所表現出來的性能和溫度表現都是極其強悍的,其遊戲性能是上一代GTX 1080Ti的1.3倍,在4K遊戲性能下的表現更是無出其右,目前市售的所有遊戲其都可以保證最高特效4k 60幀以上流暢運行。

眾多玩家的遊戲利器

當然,如果立足於純參數對比,那麼最強卡皇的存在應該是 NVIDIA Quadro RTX 8000,畢竟其擁有完整的TU102核心,顯存位寬也達到了驚人的48GB。不過因為其用途並不在遊戲行業而是渲染、工程計算等,所以並不可相提並論。

而關於這次NVIDIA在新顯卡上大肆宣傳的RTX實時光線追蹤技術,筆者苦於沒有找到任何市售支持RTX的遊戲而無法施展,究其原因前面也說過,就是因為微軟的DX12中的DXR API還沒有解禁,相信在不久的未來解禁後,RTX遊戲會像雨後春筍般冒出來。然而目前NVIDIA官方給出了一段星球大戰的支持RTX技術的演示DEMO,由於幀數測試軟體並不能運行而且自帶幀數並不能記錄,所以我只能用直觀視覺來表達我的感受。

2K下1080Ti能保證全程24幀不卡頓

我們都知道,一般電影的最高幀數是24幀,只要能夠保證這個幀數,畫面就會流暢。官方演示DEMO中解析度分別設置為2K和4K,雖然在4K下,目測平均幀數只有12幀,觀感上並不能流暢渲染,但是在2K環境下,NVIDIA GeForce RTX 2080 Ti顯卡能夠保持全程24幀實時渲染光影不卡頓,這在原來的顯卡環境上是根本不存在的。

既然性能這麼強勁,其價格自然也得對得起它的身價,目前NVIDIA GeForce RTX 2080 Ti顯卡京東預約價格9999元(我差的是那1塊錢嗎),是上代公版GTX 1080 Ti價格的1.6倍,彰顯其尊貴的身份,是眾多發燒友超高級的玩伴。

嗯,真香!

NVIDIA在本世代的顯卡中,將RTX放入了遊戲業內標準之中,並拉攏業內眾多遊戲廠商為其保駕護航,添磚加瓦,這勢必會對AMD的Vega系列造成很大的壓力。究竟AMD能不能頂住這波壓力制衡NVIDIA?還是Intel會橫亘一腳加入其中三足鼎立?NVIDIA後期依靠RTX又會有什麼技術上的延續?往後的顯卡市場戰況必將更加精彩,越發讓人期待!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 ZOL科技早報 的精彩文章:

硬體衙門:自稱銅牌妖孽妄圖燒我評測室
精緻外觀出色設計 雷柏M550&M600輕評測

TAG:ZOL科技早報 |