iGame GeForce GTX 1660 Ti首測：吃雞顯卡新高度

科技 02-23

隨著2018年8月英偉達正式發布GeForce RTX系列顯卡，高端顯卡正式全面進入光線追蹤效果的新一輪追逐。但在高昂的價格面前，不是每個玩家或者網吧業主願意投入資金為尚需遊戲支持的新技術買單。他們的要求可能很簡單，吃雞不卡，網遊組隊不掉幀，推得動高刷新率顯示器即可。

是的，2000元價位段的甜點顯卡需要一個更新，英偉達GeForce GTX 1660 Ti誕生的理由十分充足。

這一次，GeForce GTX也沒有循規漸進的使用GTX 11系列的命名方式，而是直接跳到GTX 16系列，似乎在暗示性能跨度很大。英偉達也不再為GeForce GTX 1660 Ti製造Founders Edition版本，量產成行的七彩虹iGame GeForce GTX 1660 Ti Ultra 6G成為了首發測試的第一選擇。那麼GeForce GTX 1660 Ti表現究竟如何，愛活首發評測奉上。

TU116的化繁為簡

在英偉達的官方定義中，這塊七彩虹iGame GeForce GTX 1660 Ti Ultra 6G的TU116核心仍然屬於圖靈架構體系之內，並且為了與GeForce RTX劃清界限，TU116內沒有包含可用於深度學習超採樣DLSS的Tensor Core，也沒有用於支持光線追蹤DXR的RT Core。

也就是說，TU116是建立在圖靈架構基礎上重新設計的一款GPU，它既不是TU106的閹割版，也不存在Tensor Core和RT Core被屏蔽的說法。從晶元面積上就能很輕鬆證明這一點。GeForce RTX 2060的TU106晶元面積為445mm2 ，七彩虹iGame GeForce GTX 1660 Ti Ultra 6G的TU116晶元面積為有284mm2 。

順帶一提，上一代同等定位的GeForce GTX 1060晶元面積為200mm2 ，採用的是台積電16nm製程。GeForce GTX 1660 Ti與TU104、TU106相同，使用12nm FFN，其中N表示專為英偉達定製。相對GTX 1060，GTX 1660 Ti晶元面積更大，線寬製程更小，因此GTX 1660塞進的晶體管也就越多，數量達到66億個。相比之下GTX 1060為44億個。

即便沒有Tensor Core和RT Core，圖靈架構的優勢仍然得以體現。TU116有3個GPC（Graphics Processing Clusters，圖形處理簇），每個GPC下包含4個TPC（Texture Processing Clusters，紋理處理簇），每個TPC下包含2個SM（Streaming Multiprocesor，流式多處理器），每個SM下包含64個CUDA Core。因此就有了12個TPC，24個SM，1536個CUDA Core的由來。

GeForce GTX 1660 Ti更新重點就在SM上。

圖靈架構下，SM內的整數運算單元擁有自己專門的指令發射埠，這使得浮點運算單元和整數運算單元可以並行執行任務。混合精度計算的方式最早出現在英偉達Volta架構的計算顯卡中，被應用於遊戲同樣也有著相當實際的意義。按照現在遊戲著色器程序，平均每100條浮點指令，就會伴隨38條整數流水指令和62條浮點流水指令。當兩者並行執行，指令吞吐率就會升高，遊戲速度自然得以提升。

舉個例子，當上海通往北京的高鐵只有一條，每次只能行駛一輛動車組，前往北京的和諧號和復興號都需要排隊，這就相當於GTX 1060上的浮點運算單元和整數運算單元依次排隊的尷尬。這時候如果多修一條軌道，一條專門提供給和諧號運行，另一條專門提供給復興號運行，客運效率加快。這就是GeForce GTX 1660 Ti的做法。

提升性能的手段遠不止一條。例如TU116內置了FP16半精度浮點運算單元。近些年的遊戲會大量運用到FP16單元解決不太需要高精度的畫面特效，最直接的例子就是《孤島驚魂5》的水面模擬。順帶一提，在GeForce RTX中不存在專門的FP16單元，這部分的處理工作由Tensor Core來接替。

再例如TU116中每個SM集成96KB SRAM，24個SM的SRAM總和為2306KB。SRAM可以被驅動程序或者開發人員定義分配成L1數據緩存或者Sared Memory。其中Sared Memory存在主要為了Thread Block內的CUDA Thread可以共享數據。

L1數據緩存可以根據情況被定義成32KB或者最大64KB，這意味著TU116中L1數據緩存總和可以達到1536KB，已經與L2緩存容量相當，隨機數據存取性能相比帕斯卡架構大幅提升。

GTX 1060的GP106 L2緩存容量同樣為1536KB，但TU116擁有6個32位GDDR6內存通道，總共192bit內存匯流排。GDDR6速率不僅比GDDR5快出40%，還更省電。GTX 1660 Ti內存帶寬也因此達到288.1GB/s，比GTX 1060的192GB/s高出50%。

6個內存通道與8個ROP（光柵操作處理器）單元綁定，TU116也與GP106一樣總共有48個ROP。

此外，圖靈架構內的內存壓縮引擎在帕斯卡架構基礎上獲得了升級。所謂內存壓縮引擎，就是根據畫面特徵偵測結果使用不同的無損壓縮演算法，從而有技巧的降低幀緩存寫入壓力、減少內存、L2緩存以及紋理等用戶單元的數據傳輸量。圖靈架構在遊戲中能比帕斯卡架構獲得高出50%的有效帶寬提升。

最後，TU116還有一招比率比率可變著色Varable Rate Shading，即VRS。

VRS會在一個遊戲場景中給不同區域賦予不同的著色比率，因為在大多數情況中不是每一幀的每一個細節都需要獨立著色。如下圖所示，左側代表不同著色比率的色彩示例，右側代表畫面中的不同色塊代表了該區域使用的著色比率，只有1×1的部分會被獨立著色，剩下部分會根據開發人員選擇只渲染4個像素、16個像素或者其他非正方形像素比率。

這套技術針對平面遊戲可以提供兩套演算法，分別是內容自適應著色Content Adaptive Sading和運動自適應著色Motion Adaptive。兩者分別在內容和動態效果上，通過精確分割區域，用低解析度和模糊版本替代，節省運算量。有興趣的同學可以點擊這裡跳轉到愛活的圖靈架構淺析中進一步了解。

簡單總結一下，GeForce GTX 1660 Ti的TU116，通過針對遊戲的新演算法、硬體單元、GDDR6內存，在TDP 120W和有限的資源下，讓遊戲運行效率更高。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 愛活網 的精彩文章:

※三星Galaxy S10家族如約發布！首款摺疊屏手機Galaxy Fold也一同驚艷駕到！
※情人節才剛開始福特就操心起你們床上那點事兒了

TAG:愛活網 |