當前位置:
首頁 > 科技 > 以數據為中心 Mellanox網路計算釋放創新價值

以數據為中心 Mellanox網路計算釋放創新價值

至頂網伺服器頻道 10月30日 新聞消息(文/李祥敬):毋庸置疑,我們現在處於一個數據大爆炸的時代,數據無處不在,數據成為企業創新的重要來源。數據影響我們的行為,但是數據價值的實現並不是一蹴而就的,這需要在計算力的支撐下,通過一定的演算法來實現。於是,我們看到計算形態的多樣化,比如雲計算、邊緣計算等,還有人工智慧技術的流行。

但是問題來了,在傳統數據中心是以CPU為中心的,也就是所有的數據都需要被送到CPU,CPU的計算包含了應用的計算、通信的計算、存儲的計算等,每一類計算都需要獨佔的CPU資源、內存資源、網路資源,當我們的數據量越來越大、計算單元越來越多的時候,各項操作就會開始搶佔資源,CPU、內存和網路就成為了計算性能的瓶頸,特別是像HPC、機器學習、深度學習、大數據和存儲等類型的應用。

在以數據為中心的時代,我們的計算架構也需要變革,由此而誕生了各種新的計算技術,如網路計算(In-Network Computing)、存儲計算等。網路計算,是相對於CPU計算而言的。顧名思義,就是利用網路來代替CPU處理某些計算工作,讓CPU的計算效率變得更高。通過網路計算不僅可以解決通信瓶頸的問題,還可以將CPU和GPU的資源釋放出來,讓應用獲得更多的計算資源,從整體應用的性能上得以提升。

目前網路計算的研究剛起步不久,但已經有越來越多的科研機構、大學和企業參與到網路計算的研究中來,如美國的橡樹嶺國家實驗室、Sandia國家實驗室、Lawrence Livermore國家實驗室、俄亥俄州大學、IBM公司和Mellanox公司等,都投入了大量的開發人員來共同研究如何優化CPU計算和網路計算的資源,讓應用運行更有效率。

作為端到端的網路設備提供商,Mellanox不光提供InfiniBand和乙太網互連解決方案,還將網路計算融入到自身的產品和方案中,實現無縫集成,通過將各種通信相關的計算從CPU卸載到網路中來,提升計算效率,幫助企業應對數據挑戰。

立足網路

以數據為中心 Mellanox網路計算釋放創新價值打開今日頭條,查看更多精彩圖片

Mellanox公司全球市場副總裁Gilad Shainer

Mellanox公司全球市場副總裁Gilad Shainer告訴記者,當前的世界是一個數據時代,如何能更快甚至實時的分析不斷增長的數據,直接關係到一個公司新產品和業務的開發,甚至影響到競爭力。「這是一個數據驅動的時代,數據為企業帶來創新的力量。而Mellanox交付關鍵技術去釋放數據的價值,為企業帶來最快和最智能的數據分析結果。今天我們加速了數據的傳輸速度,明天我們要實現實時的數據處理。」

Mellanox為業內提供了加快內部設備互連的技術和產品,包括網路適配器、交換機、軟體和晶元,這些產品可以加速應用的執行。Mellanox互連解決方案通過低延遲、高吞吐量的強大性能,可以極大地提升數據中心效率,在應用和系統之間快速的傳遞數據,提升系統可用性。如Mellanox公司的ConnectX系列網卡,可以通過網卡硬體來加速網路的性能;Mellanox公司的Spectrum系列的乙太網交接機可以支持更多的VXLAN功能,提供超過其他同類產品10倍以上的性能。

Mellanox的產品線幾乎滿足了廠商對各種速率的需求,為了保證對端到端連接路徑中每一個節點的速度控制,Mellanox實現了在晶元、網卡、交換機甚至線纜等所有產品的全覆蓋。在產品多樣性上,Mellanox也做足了功課。以交換機為例,Mellanox可以提供包括機頂、機架、機櫃式等在內的全系列交換機。除此而外,Mellanox還擁有完整的網管管理軟體和一系列應用加速軟體來配合硬體完成網路性能的整體提升。

提到Mellanox,在HPC領域幾乎無人不知。Mellanox從2001年推出一代InfiniBand產品以來,一直是InfiniBand市場的領導者。Mellanox InfiniBand現已被業界大規模應用,並且在高性能計算和人工智慧領域佔據了領先的市場份額。

Gilad說,HPC是Mellanox的傳統領域,但是現在HPC和AI呈現了融合趨勢,人工智慧也被Mellanox鎖定為今後的重點領域。中國有很多合作夥伴正在使用Mellanox的InfiniBand和乙太網高速網路解決方案在實現深度學習或人工智慧等技術,包括京東、百度、英偉達、商湯科技、曠世科技、科大訊飛等公司。

如上,Mellanox在高速網路方面的成績得益於其獨特的技術理念和基於這些理念下的諸多獨特優勢,為業界貢獻了十足創新的產品,當然Mellanox並沒有滿足於此,而在數據時代,積極探索網路計算,賦能更快更智能的數據處理,為企業加速數據價值的實現貢獻自己的力量。

加速創新

目前Mellanox能夠提供的網路計算功能主要包括RDMA(Remote Direct Memory Access)技術、SHARP(Scalable Hierarchical Aggregation and Reduction Protocol)技術、NVMe Over Fabric硬體卸載等;以及面向未來智能雲計算中心的網路智能修復功能SHIELD(Self Healing Communication Technology)等先進的功能,可大幅提升雲計算中心的整體性能,系統的健壯性和易管理性。

RDMA技術,RDMA(Remote Direct Memory Access,遠程直接內存訪問)技術直接顛覆了傳統的TCP/IP的通信方式,可以直接從網路的傳輸層將所有的通信相關的計算交由網卡設備來做,不需要CPU參與任何通信計算,甚至在整個通信過程中都不需要和CPU有任何溝通。目前RDMA技術已經被廣泛使用到了各種不同的應用當中,如機器學習的各種框架、大數據分析應用、資料庫應用、存儲應用、HPC應用。

此外,GPU Direct RDMA技術可以直接在GPU內存和遠端GPU內存直接建立一個通信通道,直接傳輸數據,不需要和CPU有任何溝通,既提升了性能,又降低了主機CPU和內存的利用率。這個技術也被廣范用到了AI和HPC中,如NCCL2.0、CNTK和TensorFlow就在使用GPU Direct RDMA技術。

SHARP(Scalable Hierarchical Aggregation and Reduction Protocol)技術,通過SHARP技術可以將CPU在通信計算中的操作卸載到交換機上來,如Reduce、AllReduce、Broadcast、And、Max、SUM、Barrier等等操作。這樣既可以讓應用獲得更多的CPU計算資源來計算,又有效地解決了大量數據需要送往參數伺服器帶來的網路擁塞問題。在未來,SHARP技術還能將參數伺服器的計算工作完全卸載到交換機上來,直接替代參數伺服器,用戶可以用交換機來做參數伺服器,而不必購買價格昂貴的伺服器。

在NVMe Over Fabric技術規範里,已經將RDMA定義為默認的傳輸協議,其原因是NVMe技術的出現,將磁碟訪問的速度由原來傳統硬碟的毫秒降低到了微秒級,最新的NVMe磁碟可以達到低於10微妙的訪問速度,同時NVMe Over Fabric技術也重新改寫了傳統的存儲訪問方式,大大簡化了存儲訪問的軟體協議棧,提升了從Initiator端到Target端的通信效率,通過網卡硬體直接向NVMe磁碟寫數據或從磁碟讀取數據,可以在零CPU利用率的情況下達到超過百萬次的IOPS,大大提升了NVMe Over Fabric的性能。

隨著應用性能的越來越高,要求的通信效率也越來越高,丟包成為應用不可接受的結果,但是網路出故障總是在所難免。SHIELD技術可以通過交換機硬體來在網路中自動處理這種網路故障,自動選擇新的路徑將後續的數據送到終點,在網管軟體採取措施之前已經有新的傳輸路徑,從而大大降低了丟包的次數和時間,可以在上千節點的規模下達到低於1毫秒的丟包時間,應用將不會感知這個鏈路問題,大大增強了網路的健壯性。

Gilad介紹說,採用SHARP技術,在某些HPC和機器學習應用中可以得到10倍以上的性能提升;採用RDMA和MPI加速技術,可以提升35倍以上的性能;採用SHIELD,可以加快5000倍網路故障的恢復時間;採用GPU Direct RDMA技術,可以在一些HPC和AI應用中得到10倍以上的性能提升。網路計算功能可以在HPC和AI應用中大幅提升數據中心用戶的ROI和降低投資成本和運行成本,已經被大量的用戶應用在他們的數據中心、計算中心和雲計算中心中。Mellanox 200Gb/s和400Gb/s的產品將會在今年年底量產,更多的新技術將會用到新的產品中來,用戶可以得到更大收益。

除了以上網路計算功能以外,Mellanox也正在積極開發新的網路計算功能,比如安全計算功能、NVMe Emulation功能等,新的功能將會進一步提升數據中心的性能,給用戶帶來更大的益處。同時,為了推動網路計算,Mellanox還推出了BlueField系列SoC可編程晶元。該晶元以ARM處理器作為內核,支持Mellanox ConnectX網路卸載加速技術,可以面向NFV(網路功能虛擬化)的數據面進行卸載、實現數據平面和安全平面的隔離、以及快閃記憶體陣列的嵌入式存儲控制器等等。

Gilad表示,Mellanox推出SoC晶元並不是排斥CPU計算,而是為了加速計算,硬體加速和軟體定義結合為用戶帶來最佳的性能體驗。「沒有硬體支撐的軟體定義是沒有意義的,離開了硬體支撐,軟體定義不光帶不來好處,反而會給企業帶來管理上的災難。」

完善生態

廣泛的生態系統是Mellanox業務發展的重要根基。長期以來,Mellanox一直致力於與產業鏈各環節的合作與分享。惠普、IBM、戴爾、華為、曙光、浪潮等伺服器廠商都集成了Mellanox的網路產品;EMC、IBM、華為等紛紛推出了一系列支持Mellanox網路的存儲產品;微軟、Redhat、VMware、甲骨文等軟體廠商也與Mellanox有很好的集成合作。

Gilad還特別提到了Mellanox在中國市場的投入和成長,Mellanox已經在中國設立了研發中心,將很多關鍵技術的開發工作放到了中國。同時,Mellanox積極與中國合作夥伴開展合作,在雲數據中心市場為用戶奉獻完善的行業解決方案。

在2018年,Mellanox端到端網路產品已經全線進入了中國政府採購網;Mellanox和華為雲簽訂了戰略合作協議,發布了基於200Gb/s InfiniBand HDR網路的華為雲高性能雲計算解決方案;Mellanox成為阿里雲的策略合作夥伴共同打造阿里「可信雲2.0」,阿里雲使用基於Mellanox BlueField晶元的智能網卡,可以將網路通信時的數據平面和安全平面隔離開來,減少網路攻擊者接觸用戶數據的機會,增加數據的安全性,同時還能通過Offload部分CPU的安全操作,讓應用能得到更多的計算資源,提升應用性能;Mellanox也和滕訊雲緊密合作,成為騰訊雲大帶寬、低延遲、高性能網路的重要合作夥伴;Mellanox獲頒百度數據中心2018年度 「優秀合作夥伴獎」;同時Mellanox也在ODCC 2018年會上,成功當選為ODCC專家委員會成員,未來將積极參与中國數據中心的建設。

「不管是高速網路還是網路計算,Mellanox提供了端到端的解決方案,釋放了所有計算架構的力量,這包括x86、OpenPower、GPU、ARM、FPGA等。基於Mellanox智能互連解決方案,加速了數據中心應用和業務決策流程,為用戶提供更好的體驗。」Gilad最後說。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

加勒比海加密貨幣:世界上最具田園風格的區塊鏈沙箱
峰會前瞻|聽聽老外咋用「中文」解讀「Make It Real」

TAG:至頂網 |