英偉達CUDA 10終於開放下載了
栗子 發自 凹非寺
量子位 出品 | 公眾號 QbitAI
英偉達的CUDA 10工具包,終於可以下載了。
與9字頭的前輩相比,10.0是第一次為圖靈GPU定製的版本。
英偉達新近發布的GeForce RTX 20系列和Quadro RTX系列顯卡,以及新一代GPU Tesla T4,都是基於圖靈架構。
官網的評價是,要編寫GPU加速的應用程序,CUDA 10是最強大的開發平台。
10.0是重大更新
CUDA工具包,都是為開發GPU加速的應用程序而存在。
而針對圖靈GPU定製的10.0,主要發生了以下變化:
圖靈架構
10.0支持圖靈架構,包括最新的Tesla T4 GPU(適用於超大規模的數據中心等等) 。
CUDA平台
CUDA Graphs,是新的非同步任務圖像 (Task-Graph) 編程模型,讓內核啟動和執行更高效。
另外,CUDA和圖形API之間的互操作性 (Interoperability) 增強了。
CUDA庫
許多庫的性能得到了優化。比如,做快速傅里葉變換(FFT)、線性代數以及矩陣乘法用的那些庫。
開發者工具
增加了Nsight系列產品,用來追蹤、分析、Debug。
操作系統
除此之外,CUDA 10支持的操作系統和編譯器,也比以前更多了。
操作系統:
編譯器:
CUDA庫性能大幅提升
cuFFT 10.0
做快速傅里葉變換 (FFT) 的庫,16 GPU時最高可以達到17 teraFlops(3D FFT, size 1024) 。
cuBLAS 10.0
做矩陣運算的庫,包含了圖靈優化的混合精度 (Mixed-Precision) 。做矩陣乘法 (GEMM) 時,最高可以達到90 teraFlops。
cuSOLVER 10.0
線性代數用的庫,在對稱的特徵值求解 (eigensolver) 中,速度最多提升4倍。
下載,下載
9月27日,在SIGGRAPH大會上正式發布的一個多月之後,CUDA 10的下載入口姍姍來遲。
英偉達發了一篇超長博客,事無巨細地描述了這次進化。
GPU應用開發者的各位,請速前去下載。
下載傳送門:
https://developer.nvidia.com/cuda-downloads
博客傳送門:
https://devblogs.nvidia.com/cuda-10-features-revealed/
—完—
加入社群
量子位AI社群28群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
※吳恩達新書手稿完工,現在開放免費下載
※Google數據集搜索神器上線,和搜索論文一樣簡單
TAG:量子位 |