當前位置:
首頁 > 科技 > 英偉達CUDA 10終於開放下載了

英偉達CUDA 10終於開放下載了

栗子 發自 凹非寺

量子位 出品 | 公眾號 QbitAI

英偉達的CUDA 10工具包,終於可以下載了。

與9字頭的前輩相比,10.0是第一次為圖靈GPU定製的版本。

英偉達新近發布的GeForce RTX 20系列和Quadro RTX系列顯卡,以及新一代GPU Tesla T4,都是基於圖靈架構。

官網的評價是,要編寫GPU加速的應用程序,CUDA 10是最強大的開發平台

10.0是重大更新

CUDA工具包,都是為開發GPU加速的應用程序而存在。

而針對圖靈GPU定製的10.0,主要發生了以下變化:


圖靈架構

10.0支持圖靈架構,包括最新的Tesla T4 GPU(適用於超大規模的數據中心等等) 。


CUDA平台

CUDA Graphs,是新的非同步任務圖像 (Task-Graph) 編程模型,讓內核啟動和執行更高效。

另外,CUDA和圖形API之間的互操作性 (Interoperability) 增強了。

CUDA庫

許多庫的性能得到了優化。比如,做快速傅里葉變換(FFT)、線性代數以及矩陣乘法用的那些庫。


開發者工具

增加了Nsight系列產品,用來追蹤、分析、Debug。


操作系統

除此之外,CUDA 10支持的操作系統編譯器,也比以前更多了。

操作系統:

編譯器:

CUDA庫性能大幅提升


cuFFT 10.0

做快速傅里葉變換 (FFT) 的庫,16 GPU時最高可以達到17 teraFlops(3D FFT, size 1024) 。


cuBLAS 10.0

做矩陣運算的庫,包含了圖靈優化的混合精度 (Mixed-Precision) 。做矩陣乘法 (GEMM) 時,最高可以達到90 teraFlops


cuSOLVER 10.0

線性代數用的庫,在對稱的特徵值求解 (eigensolver) 中,速度最多提升4倍

下載,下載

9月27日,在SIGGRAPH大會上正式發布的一個多月之後,CUDA 10的下載入口姍姍來遲。

英偉達發了一篇超長博客,事無巨細地描述了這次進化。

GPU應用開發者的各位,請速前去下載。

下載傳送門:

https://developer.nvidia.com/cuda-downloads

博客傳送門:

https://devblogs.nvidia.com/cuda-10-features-revealed/

加入社群

量子位AI社群28群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

吳恩達新書手稿完工,現在開放免費下載
Google數據集搜索神器上線,和搜索論文一樣簡單

TAG:量子位 |