Quadro等專業製圖顯卡，真的比GTX那些通用顯卡更有用嗎？

最新 08-22

Quadro和Geforce最明顯的區別是驅動程序對OpenGL的支持和顯存大小 —— 除了價格這個最明顯的因素以外。

顯存大小從顯卡參數就能看出來，這個不詳細說了。帶來的影響，其實和內存對於CPU一樣的：多了沒用，少了卡成狗。然而多少算是夠用呢？Geforce面對的應用主要是遊戲，在某個時期大部分的遊戲使用的也就是幾個特定的遊戲引擎，面對流行顯示解析度，常用的貼圖尺寸以及模型複雜度相近的情況下，只要能滿足這幾個遊戲引擎的需要就可以了。而Quadro面對的專業應用則不然，也許只是一個幾十萬多邊形的一般複雜度的零件，也許是上億多邊形組成的精密零件模型，例如航空發動機模型、汽車車身模型等，複雜度往往由現實需要決定，永遠都存在顯存不夠的場景——當然顯卡廠商也不可能無限制的提供顯存容量，總要顧及成本問題，而且GPU本身的處理能力也是有限的。另外需要提一下的是GPU運算越來越普遍的今天，很多計算應用對顯存的渴求也是隨著計算內容的不同呈現很大的差異化，有相當一部分應用在處理一些特定運算的時候，當數據量少的時候，同核心的Quadro比Geforce性能還差一點（Quadro的頻率通常比Geforce低），但數據量超過某個閾值之後，Quadro的性能會比Geforce有明顯提高。

驅動程序對OpenGL的支持，很多網上的說法是完整性。這個自己沒有做過OpenGL的開發，更不是顯卡從業人員。在沒看到可信來源的文章論證和說明之前，我個人保留意見。但很明顯並且可驗證的是幾個常見的基於OpenGL的CAD軟體的性能差距[1]：

從對比數據可以看出，同樣基於GP104晶元，2048個CUDA單元的Geforce 1070（移動版）和Quadro P5000，在SPECviewperf測試中的Solidwords、Creo、CATIA子項中，Quadro性能提升314%、269%、208%，在西門子NX項目中，更是達到了2253%的誇張差距。作為對比，使用Direct3D的Maya子項目中，平均得分P5000的性能提升只有126%，如果看最高得分的話，只有79%——還不如Geforce。

造成這個性能差距的原因，按照我看到的一些文章的解釋，很多CAD軟體使用OpenGL裡面的固定函數管線（fixed function pipeline）介面，這種介面主要用於早期頂點單元/像素單元是分離的顯卡。顯卡廠商提出統一渲染架構之後，OpenGL 從版本3.0開始廢棄相關API，歸類到Legacy OpenGL裡面[2]，但CAD軟體大部分還在使用相關介面，而Geforce不再對Legacy OpenGL提供支持。這個說法和其它回答裡面說的Geforce對OpenGL支持不完整類似，但我看到的幾篇文章都沒有給出可信來源證明，說出來作為一個參考吧。

除了這兩個明顯的差異以外，Quadro側重於穩定性和正確性，Geforce則側重於性能。穩定性方面，大體就是Quadro的工作頻率更低，原廠質量，採用ECC顯存避免可能出現的顯存數據錯誤。驅動方面，各大CAD軟體供應商都有認證驅動，也就是該版本驅動是經過嚴格而且全面測試的。說回來，穩定性是個很虛的東西，這些措施並不能保證100%不出問題，沒有這些措施的Geforce也不是經常出問題，只能說是概率大小不同而已。

正確性方面，因為GPU是並行處理，但實際情況並非所有運算都可以完全並行，總會有一些線程的計算會對其它線程的結果造成影響，但既然是並行處理，很難保證受影響的線程就一定先完成運算。舉例來說，一個場景有一朵花，上面有一隻蜜蜂。我們看到的應該是蜜蜂遮擋住後面的花，但如果渲染的時候渲染蜜蜂的線程先完成了工作，花的渲染是後完成的，就有可能在畫面上看到蜜蜂躲在花的後面。Quadro的驅動對類似這樣的情況檢查非常嚴格，會保證不出現這樣的情況。而Geforce為了遊戲性能，會有很小概率的情況忽略掉這樣的錯誤。和穩定性一樣，正確性也是個出現概率大小的問題。

Graphics Card Comparison - Head 2 Head，需要說明的是notebookcheck單個配件的成績由多個使用該配件的筆記本型號測試成績平均得出，不同筆記本使用不同的CPU，散熱能力不同可能導致某個項目成績出現比較大的性能差異。可以點開顯卡型號查看具體型號得分。

區別在於顯卡支持的驅動顯示函數不同。

遊戲卡是以DirectX標準進行渲染顯示的。而專業卡則是支持並優化以OpenGL標準進行渲染顯示的驅動。遊戲卡也支持OpenGL標準，但是沒有優化同時據說還有缺失某些函數支持的，也就是不完整的。

主要差別取決於你使用的軟體界面的實時顯示方式。像一些專業3D工程方向的製作軟體里，是支持OpenGL模式進行實時渲染顯示的。所以專業卡在這些軟體里模型顯示是可以順暢的瀏覽和顯示的。而遊戲卡對這個顯示標準沒有優化和支持，在工程方向的3D軟體里使用的時候。模型面數一旦比較多就會出現頓挫和顯示精準度的問題（當然，非工程方向的CG製作軟體早在幾年前就已經開始優化支持遊戲卡了，Autodesk旗下的Maya和3ds max都支持DX驅動進行界面實時顯示，所以藝術CG方向的軟體里專業卡的優勢驅動優勢已經沒有了，補充：C4D是否有優化支持遊戲卡還不是很清楚，因為C4D是以openGL方式顯示的。而且C4D軟體顯示上，用GTX980遊戲卡當模型面數達到100萬就會很卡了。）。在以Octane Render這種GPU渲染器出現之前，專業卡的作用也就是3D軟體操作界面里顯示優化的優勢而已，其他沒有什麼特別之處了。

除了驅動顯示方式的差異外，還有一個最明顯的差別是專業顯卡的顯存一般會比同等級同核心架構的遊戲卡要大一些，特別是高端顯卡里。當遊戲卡還在為自己是11GB顯存而感到有優越感的時候，專業卡已經在16GB或者24GB或者更高的32GB顯存的段位里進行使用了。

在以2010年左右Octane Render為代表的這種GPU渲染器出現之後。

大容量的顯存對於3D渲染製作是有很大幫助的，更容易製作複雜場景，特別是顯示GPU渲染的時候，數據會在顯存里讀取。顯存容量低，對於渲染速度就會有影響，有的時候會特別卡，有的時候會出現渲染失敗或錯誤的提示。當然，遊戲卡的優勢是主頻率高，所以在顯存和架構核心同等水平的時候，遊戲卡進行GPU渲染的時候，速度會比專業卡快。經過對比，遊戲卡一般比同核心架構級別的專業卡的3Dmark跑分高20-25%左右。但是專業卡有顯存容量優勢和穩定性優勢（廢話，頻率低當然穩定了。）

(補充一點，GPU渲染看的是單精度浮點計算，所以專業卡的雙精度浮點計算優勢沒有什麼用)

所以說，看你用專業顯卡做幹什麼了。如果是工程應用3D軟體，例如

SolidWorks，CATIA 這類工程應用方向的軟體那麼你使用專業顯卡是有意義的。

如果你是用GPU渲染的話，專業顯卡只在高端版本有一定的顯存容量和ECC糾錯優勢，但這個優勢和價格相比，不是那麼高，除非你特別重視時間成本（因為有的頂級專業卡1-1.5年後的性能就會被新一代的頂級遊戲卡超過了），否則沒必要上高端專業顯卡來進行GPU計算。當然，專業卡的顯存優勢可製作更複雜場景的優勢是遊戲卡暫時無法超越的。只能靠優化場景的技術來實現。

估計今年發布的新一代12納米工藝的1180或所謂2080遊戲卡顯存達到16GB後，應該是滿足大多數的GPU渲染需求了（就算單精度浮點計算能力和1080ti差不多，依靠顯存GDDR6技術的帶寬優勢和容量優勢，渲染速度和渲染跑分也會高不少。），只要不是電影級的超大場景就沒太多問題。也許明年7nm工藝的新一代的顯卡會達到22或24GB?看老黃的刀法了。

視頻編碼。

Geforce系列的NVENC最大隻允許 2 個 session 同時運行，而 Quadro、Tesla 則沒有限制。

以 Pascal 架構為例，單個 NVENC 單元的性能可以跑到 600fps，用來壓片的話可以 1 秒壓 600 幀，1 小時的視頻 3 分鐘就能壓完，速度比軟編快很多。但是如果是用於實時編碼，比如直播類應用，一般幀率都是 30fps，但是可能需要同時編多路流，如果是 Geforce 系列，不管是 1030 還是 1080Ti，最多只能開兩路同時編碼，也就是最多利用 60fps 的性能，剩下的都浪費了。但是 Quadro、Tesla 系列就沒有這個限制，最大性能只取決於 GPU 和 GDDR 的頻率。

國外有牛人通過改電阻、BIOS，讓驅動把 Geforce 識別成 Quadro，不過穩定性就不好說了。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 沙漠之盒 的精彩文章:

※美劇《坦克煉獄》：打的准不如打的狠？射空的炮彈表示兇狠並無多大用

TAG:沙漠之盒 |