近距離接觸英偉達專業級顯卡Quadro系列,都能幹點啥?
近日(4月12日),雷鋒網受邀參加了英偉達在北京國家會議中心舉行媒體發布會。會上英偉達展示了其發布不久的基於Pascal 架構的Quadro系列顯卡,包括:GP100、P2000、P4000、P5000、P6000 等。不同於Geforce的消費級娛樂定位,Quadro立足高端,面向專業級的需求,英偉達的願景是讓它們能夠將台式工作站轉變為具有突破性能力的超級計算機,並為不同行業的專業任務提供保障。
Quadro系列顯卡(雷鋒網現場拍攝)
Pascal 架構的全新NVIDIA Quadro產品陣容致力於為企業提供視覺計算平台,簡化設計和模擬工作流程。與上一代產品相比,新Quadro產品不僅具有超快速內存,而且速度最多可以提升兩倍(基於SPECviewperf 12 基準的計算結果)。
其中GP100為該系列的旗艦產品,被科技媒體和粉絲們稱為超當量核彈。
Quadro GP100參數及系列特點
GP100
GP100基於 Pascal 核心,匹配16GB HBM2顯存,單精度CUDA核心數 3584個,雙精度CUDA核心數 1792個,半精/單精/雙精浮點運算性能分別是20TFLOPS、10TFLOPS和5TFLOPS,帶寬高達720GB/s,功耗235W 。同其他新發布的專業卡一樣,它的性能提升也是全方面的(比如同步多重投影、VRWorks、Iray VR),同時還強化了虛擬化、Sync II、雙路NVlink等。
這也是NVlink首次在Windows系統上獲得支持,此前僅僅用於IBM Power8系統和基於Linux的DGX-1,帶寬最高80GB/s。
這個系列官方給出的特點如下:
統一模擬、HPC、渲染和設計 – GP100將前所未有的雙精度性能與16GB的高帶寬內存(HBM2)相結合,因此用戶可以在設計過程中進行模擬,並以前所未有的速度採集逼真的多物理場模擬。客戶能夠將兩個GP100 GPU與NVLink?技術相結合,並擴展到32GB的HBM2,以在單一工作站上創建龐大的可視化計算解決方案。
擴展後的Quadro P6000(雷鋒網現場拍攝)
探索深度學習 – GP100提供超過20 TFLOPS的半精度計算,可謂在Windows和Linux環境中進行深度學習的理想開發平台。
將VR集成到設計和模擬工作流程中 – VR 認證的Quadro GP100和P4000具有創建詳細、逼真、沉浸式環境的能力,能夠大規模實現更加宏大、更加複雜的設計體驗。
盡享照片級真實感設計的優勢 – 基於Pascal 架構的Quadro GPU 渲染照片級真實感圖像的速度為CPU的18倍 。
創建廣闊的可視化工作區 – 可在多達四個5K顯示器上以高解析度和HDR顏色顯示數據。
經濟高效地構建超高解析度及多顯示屏配置 – 通過將多達8個P4000 GPU和兩個Quadro Sync II顯卡相結合,可通過單一機箱實現多達32個4K顯示器的配置。
GPU在CAE上的應用
Sandeep Gupte
CAE(Computer Aided Engineering)指工程設計中的計算機輔助工程。英偉達專業可視化業務高級總監 Sandeep Gupte 表示:
對於這部分用戶,大部分是使用類似Ansys、ABAQUS等分析軟體求解複雜工程和產品的結構力學性能。大規模的數據計算往往讓設計分析的過程十分漫長,而如果使用CPU+GPU加速的方案將會大大的節省運算時間。
GPU 加速計算是指在完成應用任務時,同時利用GPU 和 CPU。由於GPU出色的並行任務處理能力,將應用程序中計算密集部分的工作負載轉移到 GPU,同時仍由 CPU 運行其餘程序代碼。這樣,從用戶的角度來看,應用程序的運行速度明顯加快。
流言終結者中有一段很有意思的視頻,為我們直觀的展示了相比於CPU,GPU的並行計算為什麼有如此令人震撼的優勢。
Sandeep舉了個實際的例子,在現場一個集成了一張GP100 的工作站里,工作人員使用ABAQUS對一個模型進行了470萬的網格劃分和計算,由於時間關係,現場並未將計算完成。這是因為類似這樣大規模的計算,往往需要運行數十個小時甚至是數十天才能完成。不過Sandeep告訴雷鋒網,相比僅使用CPU計算的方案,GPU加速可以將計算時間將縮短為原來的1/3。
GPU在真實物理渲染(PBR)上的應用也許你覺得CAE的栗子還不夠震撼,在圖形渲染方面,英偉達中國區銷售總監何猶卿表示,目前主流的渲染器都已經在做GPU加速平台,因為一幀4K的電影畫面,如果還使用CPU渲染,需要288小時,而用GPU渲染只需要3個多小時。
GPU在深度學習上的應用
在深度學習領域,也是高性能GPU大展拳腳的地方,近年來深度學習的大發展除了科學家們孜孜不倦的學術探索外,和GPU運算能力的突飛猛進也密切相關。英偉達CEO黃仁勛曾表示:
計算機科學家綜合 Yann LeCun 的卷積神經網路、Geoff Hinton 的反向傳播演算法,以及 Stochastic 的梯度下降訓練法,加上吳恩達 (Andrew Ng) 對 GPU 的大規模應用,來加快深度神經網路 (DNN) 的運算速度,才促進「深度學習」這項現代人工智慧技術出現大爆炸般的發展局面。
對於人工智慧未來將對設計工作產生的影響,Sandeep介紹了一種叫做生成式製造流程的人工智慧概念設計方法。比如設計者要設計一把椅子,一般情況下需要通過CAD軟體設計出兩三個方案,然後交由決策者選擇。而有了人工智慧參與後,設計者僅需提出邊界條件,例如承重多少,自重多少,尺寸如何等等,人工智慧就可以自動生成出上百種的設計方案供決策者挑選,這不但有助於遴選出最佳的設計方案,還能大大的縮短設計的周期。
GPU在VR上的應用在VR的應用方面,為消費級玩家所熟知的Geforce系列更多是針對個人娛樂的應用,而Quadro系列則是面向專業級的任務。如果僅僅是遊戲,即便畫面的真實感和準確性有些許偏差,也不會造成太嚴重的後果。但是如果是在工作決策中使用,那麼就要求畫面儘可能的逼真,這時候就需要Quadro系列顯卡和 Iray VR了。
據Sandeep介紹, Iray 是Nvidia的一款逼真的渲染解決方案,現已許可給 Dassault Systèmes 和 Autodesk 等軟體廠商。 利用 Iray 應用,連接至 Quadro 視覺計算設備(VCA)後,就可以享受逼真的渲染體驗。 把多個 Quadro VCA 結合到一起後,基於光場實時計算,操作模型或場景時還能夠捕捉到細微的光線和反射。
QUEST計劃Sandeep還提到英偉達首次在國內推出了QUEST計劃(Quadro Embedded System Program),即基於Quadro的嵌入式系統計劃,針對高性能嵌入式系統的開發者,開發企業可以申請加入此計劃,英偉達將和他們合作設計適用於他們解決方案的GPU。除此之外,英偉達還會提供設計包(Design Kit)、SDK、樣本代碼、訓練等。該項目免費,並且沒有設置申請數量的限制,但是由於致力於一同打造品質、可靠性和性能俱佳的高性能嵌入式解決方案,所以英偉達在合作夥伴的遴選上會比較謹慎。


※百億美元市場的倉儲機器人都有哪些知名玩家(國外篇)
※ShadowBroker放大招-多種Windows零日利用工具公布
※三大案例分享:如何用物聯網數據來構建工業智能 | 硬創公開課
TAG:雷鋒網 |
※蘋果新iPad評測:這或許是你能接觸到最接地氣的iPad
※DigitalBridge最新報告:企業若不想陷入危機,可多接觸AR技術
※Abercrombie&Fitch 也要賣掉了!股價處於17年來最低谷,目前正與兩個潛在買家接觸
※與Xbox One X近距離親密接觸 新主機暫不支持VR內容
※Samuel攜高人氣首次訪台與Garnet近距離接觸
※Keyssa 與鴻海、三星打造 Connected World 無接觸式高速傳輸智能手機生態系
※怎麼讓還不太會說話的小娃開始接觸critical thinking?我在繪本閱讀中找到了方法……
※Desigual與法國藝術大師Jean-Paul Goude的親密接觸
※DigitalBridge最新報告:如果企業不想死 可多接觸AR技術
※evleaks:Moto C/C Plus針對首次接觸智能手機的用戶
※10倍光變與ShowGirl親密接觸 帶著moto z2 play去CJ
※卡抽Cara Delevingne拍攝電影大秀長腿與賈登·史密斯親密接觸
※一顆穿鞋的珍珠-與鞋履品牌Oyster Footwear的親密接觸
※鄭雨盛:李艾爾有望簽約ArtistCompany 雙方已進行接觸
※五鼠志……接觸報告Contact Report No.373
※外星文明接觸者 Alec Newald 的故事
※觸覺手套Flex-N-Feel讓異地戀情侶也可以來一次近距離接觸
※五鼠志……接觸報告Contact Report No.143
※五鼠志……接觸報告Contact Report No.483