當前位置:
首頁 > 科技 > HPC China上採訪Mellanox:數據在哪裡,計算就在哪裡

HPC China上採訪Mellanox:數據在哪裡,計算就在哪裡

我們的工作和生活都在因為數據而改變,「數據驅動」成了大多數企業增強自己競爭力的法寶。一旦離開數據,很多商業行為就變得不可想像。數據激增並不是一個新鮮話題, IDC報告顯示,在過去的8年和未來的8年,數據的增長將會前所未有,到2025年,數據總量會超過160 Zeta位元組。但在以前,數據大多是「靜止不動」或者』緩慢移動「的,而隨著大數據、人工智慧等技術的發展,數據可以被計算、分析、被更容易傳輸,數據的價值被無限放大、數據也煥發了新的生命力。

數據中心無疑是數據的一個重要「領地」,想利用好數據,數據中心的規模開始變大,計算規模和存儲的規模也變得越來越大,然而,動則成千上萬台伺服器的大規模的數據中心,是否能充分的發揮出它的性能?這是困擾很多數據中心用戶的問題所在。另一方面,在傳統的數據中心中,CPU是用來做計算的最核心部分,數據被輸送到CPU,之後由CPU來做計算。 當數據量越來越大、計算單元越來越多的時候,各項操作就會開始搶佔資源,CPU、內存和網路就成為了計算性能的瓶頸。類似HPC、機器學習、深度學習、大數據和存儲等類型的應用,需要將所有的數據由網路中的各個計算單元送到這個CPU,導致了網路擁塞、CPU需要花大量的時間來等待數據同步。那麼,我們到底是不是必須要讓CPU承擔這麼大壓力?有沒有其他的替代方案?

在HPC China大會期間,天極網採訪了Mellanox公司全球市場副總裁Gilad Shainer和Mellanox亞太區高級市場總監宋慶春,通過近一個小時的深度交流,了解到這家專註於網路計算的以色列公司,如何用自己與眾不同的產品和技術理念,為正在受到困擾的數據中心用戶打開一扇窗。

Mellanox公司全球市場副總裁Gilad Shainer

誰說數據只能在CPU計算?

上文說到,CPU來作為計算核心的架構仍然是一個主流的思路,在目前的這種架構下,增加CPU的計算能力和數量,或是增加伺服器的數量,不能解決計算效率低下的問題,還會使問題更加惡化,導致更嚴重的網路擁塞。

Mellanox提供了一種嶄新的思路:「數據在哪,計算就在哪」。Gilad Shainer表示,既然數據是一切的起點,數據的增長導致了計算規模擴大、導致網路通信的擁塞、數據的增長導致了存儲的容量和性能瓶頸…… 「數據帶來的問題不是只在CPU、網路、或是存儲,而是在數據中心的任何地方。所以解決問題的關鍵就要從數據入手,現在我們的答案就是以數據為計算的中心,數據在那兒,計算就在那兒。」他說。

數據在伺服器的時候,CPU是主要的計算單元;數據在網路中移動的時候,網路是主要的計算單元;數據在存儲中的時候,存儲是主要的計算單元……由此而誕生了各種新的計算技術,如網路計算(In-Network Computing)、存儲計算等。

而從另一方面來看,數據計算和傳輸的速度影響數據中心的運營成本,數據移動到CPU,也是數據中心代價最高的部分,如果把計算放到數據中, 數據可以實時分析和計算,就得到最好的數據中心性能也能降低運營成本。

從HPC到AI

我們了解,Mellanox是一家端到端的網路設備提供商,在網路計算領域,這家公司的做法通過將各種通信相關的計算從CPU卸載到網路中來,這樣會大大降低CPU和主機內存在通信中的消耗,也可以解決需要將大量的數據歸約到某台伺服器而導致的網路擁塞問題,提升數據中心的計算效率。

筆者在採訪中了解,目前Mellanox能提供的網路計算功能主要包括RDMA技術、GPU Direct RDMA技術、SHARP(Scalable Hierarchical Aggregation and Reduction Protocol)技術、NVMe Over Fabric Target Offload技術、SHIELD(Self-Healing Technology)技術、Socket Direct和Multi-Host等前沿技術。而除了以上網路計算功能以外,Mellanox也正在積極開發新的網路計算功能,比如安全計算功能、NVMe Emulation功能等,新的功能將會進一步提升數據中心的性能,給用戶帶來更大的益處。

在談及Malledox在技術上的創新和投入方面,Gilad Shainer表示,「SHARP技術,在某些使HPC和機器學習應用中可以得到10倍以上的性能提升;採用RDMA和MPI加速技術,可以提升35倍以上的性能;採用SHIELD,可以加快5000倍網路故障的恢復時間;採用GPU Direct RDMA技術,可以在一些HPC和AI應用中得到10倍以上的性能提升。網路計算功能可以在HPC和AI應用中大幅提升數據中心用戶的ROI和降低投資成本和運行成本,已經被大量的用戶應用在他們的數據中心、計算中心和雲計算中心中。

據筆者了解,Mellanox 200Gb/s和400Gb/s的產品將會在今年年底量產,更多的新技術將會用到新的產品中來,而用戶可以得到更大的收益。

在HPC的應用上,TOP500榜單中的很多超算中心都應用了Mellanox的產品或加速技術,在AI領域的一些領先公司,例如科大訊飛、facebook、uber等,也和Mellanox達成了深度合作。

此外,Shainer還特別提到了Mellanox在中國市場的投入和成長,「Mellanox已經在中國設立了研發中心,將很多關鍵技術的開發工作放到了中國。在2018年,Mellanox端到端網路產品已經全線進入了中國政府採購網;Mellanox和華為雲簽訂了戰略合作協議; Mellanox成為了阿里雲的策略合作夥伴共同打造阿里「可信雲2.0」;Mellanox也和滕訊雲緊密合作,成為騰訊雲大帶寬、低延遲、高性能網路的重要合作夥伴;同時Mellanox也在剛剛結束的ODCC 2018年會上,成功當選為ODCC專家委員會成員, 未來將積极參与中國數據中心的建設。「

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 天極網 的精彩文章:

vivo Z3發布 水滴屏+驍龍710售價1898元
顏值實力派!vivo全新千元機Z3i開啟預約:10月17日發布

TAG:天極網 |