當前位置:
首頁 > 科技 > 面向數據科學 NVIDIA藉助RAPIDS拓展GPU新的應用場景

面向數據科學 NVIDIA藉助RAPIDS拓展GPU新的應用場景

至頂網伺服器頻道 10月29日 新聞消息(文/李祥敬):毋庸置疑,我們處於一個數據大爆炸的時代,企業也在數據驅動的策略進行更多業務創新。於是,以分析、深度學習、機器學習為代表的數據科學市場迎來了快速發展發展的機遇期。為了抓住這樣的商業機會,NVIDIA針對大規模數據分析和機器學習推出了RAPIDS開源GPU加速平台。

GPU瞄準新的市場

如今 ,雖然業界對於算力的需求不斷加大,憑藉其強大的並行計算能力,GPU在高性能計算市場表現出色。目前,包括美國Summit、Sierra;日本ABCI;歐洲的Piz Daint在內的諸多全球頂級超級計算機都採用了NVIDIA GPU作為其算力核心。而且,目前已有70%的通用HPC程序已經實現GPU加速。

同時,當前以人工智慧為代表的新技術席捲各行各業,而GPU在深度學習方面具有獨特的優勢,NVIDIA在人工智慧市場得到迅猛發展,GPU計算加速了深度學習革命。

NVIDIA亞太區解決方案架構高級總監趙立威告訴記者,整個市場還在持續快速發展,面向數據科學和機器學習的伺服器市場每年價值約為200億美元,加上科學分析和深度學習市場,高性能計算市場總價值大約為360億美元。

除了數據科學市場,現在零售、金融、醫療等行業也在努力從數據中獲得更多價值,也就是我們常說的大數據分析。「其實幾乎每一家企業都在用數據驅動來增強自己的核心競爭力,而這離不開所謂的大數據決策支持系統。」趙立威說。

面對廣闊的市場機會,NVIDIA GPU將目標瞄準了數據科學和機器學習市場。於是,我們看到了RAPIDS的問世。RAPIDS為GPU加速分析和機器學習提供了一整套開源庫,為數據科學家提供了他們需要用來在GPU上運行整個數據科學管線的工具。

RAPIDS加速數據價值實現

趙立威表示,大數據分析一般經過三個步驟,一個是數據準備,這個過程數據特徵的提取、數據合併、數據降維等等;第二步,訓練。這是一個不斷的循環過程,我們要不斷優化,進行參數的調整,訓練過程精度會更高,可預測的結果會更準確;第三步,推理,上線運營。

在這三個步驟中,業界產生了很多相應的工具,可以加速相應的過程實現。但是這些工具大多是依託處理器的計算,並沒有有效利用加速器。於是,NVIDIA通過與開源社區合作,實現了GPU加速數據分析。「GPU可以給數據科學家的機器學習項目提供更多的加速支持。」趙立威說。

面向數據科學 NVIDIA藉助RAPIDS拓展GPU新的應用場景

最初的RAPIDS基準分析利用了XGBoost機器學習演算法在NVIDIA DGX-2系統上進行訓練,結果表明,與僅有CPU的系統相比,其速度能加快50倍。這可幫助數據科學家將典型訓練時間從數天減少到數小時,或者從數小時減少到數分鐘,具體取決於其數據集的規模。

趙立威總結說,在方興未艾的數據科學領域,RAPIDS具有顯著的特點:無縫整合,數據科學家只需要進行非常少的代碼修改就可以帶來顯著的性能加速;可以直接運行在NVIDIA近幾年的GPU產品上面;減少數據處理等待時間,數據科學家可以將精力用在模型訓練和優化;開源,更好地融入社區,獲得更多人的智慧,豐富基礎特性,服務更多場景。

據悉,為了推動RAPIDS的廣泛應用,NVIDIA正努力將RAPIDS與Apache Spark進行整合,數據可視化將是下一個目標。

廣泛的生態系統支持及應用

目前,RAPIDS已經被HPE、IBM、Oracle、Databricks等採用。在Databricks公司,開展的多個項目都在將Spark更好地與本地加速器進行整合,其中包括藉助Project Hydrogen實現的Apache Arrow的支持以及GPU調度。

RAPIDS構建於Apache Arrow等流行的開源項目之上,為最流行的Python數據科學工具鏈帶來了GPU提速。得益於CUDA及其全球生態系統以及與開源社區緊密合作,RAPIDS GPU加速平台已與全球最流行的數據科學庫及工作流無縫整合,可加速機器學習。如同深度學習一樣,GPU正在不斷地為端到端的數據科學和機器學習流程提速。

全套RAPIDS開源庫現在即可官網上獲得,代碼經Apache許可公布。容器化RAPIDS版本也可在NVIDIA GPU Cloud container registry上獲取。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

聯想數據中心的賦能與節能
Hot Chips:富士通展示百億億次級ARM超級計算機處理器A64FX

TAG:至頂網 |