當前位置:
首頁 > 知識 > 20顆GPU!曙光SuperBox深度學習伺服器單機性能登頂

20顆GPU!曙光SuperBox深度學習伺服器單機性能登頂

GTC China 2017(GPU技術大會)餘溫尚在,整個大會——包括黃教主的演講——都在向我們傳達一個信息:AI時代,沒GPU不行。這個說法可能有點兒誇張,但其實相差無幾。GPU所提供的加速計算能力極大地推動了AI的發展,這點是毋庸置疑的。不信的朋友可以去看看NVIDIA的股票走勢,一切就都明了了。

緊扣時代脈搏的各大科技企業,包括NVIDIA在AI方面都做了不少的努力,從硬體到軟體,再到應用層。其中,處於最底層的、支撐著AI計算的伺服器,無疑是最不可或缺的角色之一。

隨著GPU在AI計算中重要作用的逐漸體現,各大伺服器廠商也紛紛推出了專為AI計算而設計的搭載GPU的伺服器。而今天我們要介紹的,是來自連續八年穩居中國市場份額第一的「HPC大佬」曙光的新一代高密度深度學習伺服器——SuperBox。

不為別的,只因為這款伺服器能夠搭載多達20個GPU,而且是在4U空間內,可以說是「為了性能,連命都不要了!」

20顆GPU!曙光SuperBox深度學習伺服器單機性能登頂

關於我們最關注的性能

嚴格來說,SuperBox在4U空間中內置有20個PCI-E介面,可搭載GPU、FPGA、MIC等多種處理單元。如此密度,稱得上是當前全球最高了。在搭載20片最新NVIDIA P100 GPU時,單機運算能力可達到184 TFLOPS,是當前世界上單機運算能力最強的伺服器。同時SuperBox完美支持NVIDIA下一代Volta架構的GPU處理器,對於高端深度學慣用戶而言,這款產品絕對值得列入備選清單。

配備這麼多加速器,若沒有高效的通信架構,也都只能是雞肋。SuperBOX採用PCI-E Switching Fabric架構,機內全部加速器可以實現P2P通信,提供960Gbp/s的通信速率,高效完成並行運算不是問題。

20顆GPU!曙光SuperBox深度學習伺服器單機性能登頂

▲SuperBox所採用的PCI-E Switching Fabric架構示意圖

靈活性與可靠性必不可少

不同用戶的需求是不同的,甚至同一用戶的需求也可能發生變化。因此,產品的靈活性也至關重要。SuperBox機內的PCI-E埠不僅可搭載一些主流深度學習加速器,還可以適配IB、Raid等功能元件。此外,該產品也支持USB、VGA、GBE等多種埠,用戶完全可以根據自身需求進行配置,實現多樣化搭配。

為保障業務穩定運行,SuperBox關鍵部件均實現模塊化、冗餘化、熱插拔化,大幅度提高系統整體可靠性。在運維方面,通過搭配曙光clussoft環境部署工具包,無論單機或者集群環境都可提供簡易部署、高效可控的管理體驗,進一步降低運維成本。

20顆GPU!曙光SuperBox深度學習伺服器單機性能登頂

▲曙光SuperBox

曙光SuperBox所具備的超高密度和所能提供的超強運算能力是非常亮眼的,想必其價值也將集中體現在如智慧城市等高端深度學習應用領域,但絕不限於這些領域。隨著AI的發展,優秀演算法、模型等的不斷湧現,對計算力的需求也將隨之迅速提升。作為HPC大廠,曙光對計算力的追求是迫切的。SuperBox會是其產品線上的一顆明珠,但在這之後,也必定會有更優秀的產品出現,我們拭目以待。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT168企業級 的精彩文章:

微軟的「登月計劃」實施,拓撲量子計算你造么?
你知道嗎?就連Excel都植入了機器學習!趕快來試試吧!
Python程序員必看的十大學習資源

TAG:IT168企業級 |