當前位置:
首頁 > 科技 > 讓計算看到數據:可以做自處理的快閃記憶體驅動器

讓計算看到數據:可以做自處理的快閃記憶體驅動器

將計算靠近數據,目標是避免跨網路把大量數據遷移到主伺服器來降低存儲數據訪問延遲。將計算靠近磁碟驅動器正面臨著嚴峻的挑戰,但訪問速度更快的快閃記憶體驅動器可以輕鬆做到這一點。

有一種相反的方法——通過NVMe over Fabric讓數據更快地靠近計算——可能會給帶有板載計算的快閃記憶體驅動器造成阻礙。有兩家初創公司就涉足把計算融入快閃記憶體驅動器的領域,:ScaleFlux和NGD Systems。

ScaleFlux

ScaleFlux在其CSS 1000快閃記憶體驅動器板上安裝了Xilinx FPGA,將其稱為Computational Storage,並讓主伺服器負責Flash Translation Layer(FTL)。

讓計算看到數據:可以做自處理的快閃記憶體驅動器

我們對ScaleFlux計算+快閃記憶體驅動器的理解

CSS 1000驅動器採用HHHL AIC格式或U.2 2.5英寸格式,使用TLC(3位/單元)3D NAND,提供高達6.4TB的容量。ScaleFlux說,每個伺服器最多可以有8個CSS 1000驅動器,最大容量為51TB。

讓計算看到數據:可以做自處理的快閃記憶體驅動器

x86主伺服器運行一個ScaleFlux軟體模塊,該模塊提供對驅動器的API訪問。ScaleFlux公司表示,通過一體化的、易於安裝的軟體包,可輕鬆實現低延遲存儲IO和計算硬體加速,無需開發工作或重新編譯應用。

ScaleFlux在美國聖何塞、中國北京和日本橫濱都設有辦事處。

中國公共雲提供商UCloud是ScaleFlux的客戶之一,ScaleFlux與伺服器製造商浪潮合作將其驅動器與浪潮伺服器進行集成。ScaleFlux已經測試了使用這個卡加速Aerospike、PostgrSQL和MySQL等軟體的效果:

讓計算看到數據:可以做自處理的快閃記憶體驅動器

ScaleFlux的網站已單獨列出有關此類產品加速的詳細信息。例如,這就是它對NoSQL資料庫Aerospike性能評價:

與NVMe SSD相比,ScaleFlux CSS 1000系列每秒處理速度明顯更高。該測試進行24小時,讀取率為67%,寫入率為33%,對象大小為1.5 KB。

這意味著已經編寫了代碼運行在該卡的FPGA上,針對這些應用。ScaleFlux表示,它已經開始銷售其CSS 10000驅動器,並將該驅動器出貨到多個企業的最終用戶生產環境中。

ScaleFlux公司聯合創始人兼首席執行官Hao Zhong表示:「從高交易吞吐量和電子商務支付環境到需要對查詢進行實時響應的旅遊網站,我們的客戶從使用CSS的大容量快閃記憶體存儲部署中獲得更高價值。」

ScaleFlux公司正在將驅動器應用擴展到內容交付、搜索、高性能計算、人工智慧和機器學習環境。

下一個廠商採取了不同的方法,使用具有更高容量的卡和ARM處理器,使其更容易編程。

NGD Systems

Next Generation Data (NGD) Systems成立於2013年,使用大量的美光TLC 3D NAND快閃記憶體開發了一款Catalina 2快閃記憶體驅動器,容量高達24TB。目前NGD Systems已經進行了兩輪融資,2016年融資630萬美元,2017年為1000萬美元。

NGD Systems公司的三位創始人——首席執行官Nader Salessi、首席技術官Vladimir Alves和執行副總裁理Richard Mateya——都是SSD行業的資深人士,曾在STEC、西部數據和Memtech。 NGD Systems以前名稱是NxGnData,在將片上計算推廣到多核ARM系統之前,這家公司致力於將FPGA添加到快閃記憶體卡中。

讓計算看到數據:可以做自處理的快閃記憶體驅動器

Catalina 2卡

NGD Systems表示,已經實現了業內每TB最低的每瓦功耗,每TB功耗低於0.65瓦特。

主伺服器有一個C / C ++庫和一個代理程序,用於使用NVMe協議處理跨PCIe 3.0 x4鏈接與驅動器進行通信所需的通道。這個驅動器SoC配有運行Linux的A53 ARM CPU,以及用於12個M.2快閃記憶體模塊的ECC和FTL功能的邏輯。

我們對Catalina 2主要組件的理解,顯示了連接到板載ARM SoC的快閃記憶體模塊。

讓計算看到數據:可以做自處理的快閃記憶體驅動器

Salessi談到Catalina 2卡時說道:「嵌入式人工智慧和機器學習等高級應用本質上是IO密集型的,可以運行在存儲設備中。」

Vladimir Alves的快閃記憶體峰會演講中談到了一個場景,在這個場景中需要4.5個小時才能將0.5PB數據集讀入裝有8TB SSD的2-CPU伺服器系統中:

讓計算看到數據:可以做自處理的快閃記憶體驅動器

如果這些8TB SSDS替換為8TB Catalina驅動器,則接收時間會減少15分鐘——速度提高8倍,總帶寬超過380GB /秒。

讓計算看到數據:可以做自處理的快閃記憶體驅動器

NGD Systems仍處於隱身狀態。我們可能預計這家公司很快會走出隱身模式。

NVMeStorage

NVMeStorage通過將計算移到數據所在的位置承諾實現範例上的轉變,它使用的就是Catalina卡。

NVMeStorage公司聯合創始人Jos Keulers在博客中寫道:「原位處理(In Situ Processing)意味著驅動器本身具有計算能力,數據首先保存在驅動器上,數據不會離開最初保存在的驅動器。」

「存儲之後,可以在存儲數據的位置上進行分析,而無需將數據從驅動器傳輸出去。可以對哪些數據需要發送回雲進行大數據分析、做協議轉換進行本地判斷,還可以在數據不再有用或有價值的時候清理磁碟、刪除保存的物聯網數據。」

他表示,這種驅動器/設備可以用於霧計算:「分析物聯網數據的理想位置,是靠近產生和處理數據的設備,這就是所謂的霧計算。」

Keulers補充道:「由於物聯網數據無需傳輸,所以原位處理是至關重要的,藉助NGD Systems的Catalina In-Situ處理NMVe技術支持NVMestorage.com,確保霧中的安全旅程。」

繞過NVMeoF的問題

NVMe over Fabrics基本上是通過讓主伺服器使用遠程直接內存訪問(RDMA)訪問存儲數據來消除存儲網路問題,因此,我們可以說,以兩位數微秒的速度操作數據IO。

這有效地讓數據更快速地靠近計算,而計算是我們的老朋友,x86伺服器,意味著將代碼放置在快閃記憶體驅動器FPGA或ARM處理器上不存在編程問題,也無需協調其活動。

藉助NVMeoF,無需開發專用硬體即可將計算添加到存儲驅動器,這意味著可以使用標準的商用驅動器。

我們從哪裡開始?

我們詢問了ScaleFlux營銷負責人Tian Jason Tian,NVMe over Fabrics會給原位處理帶來怎樣的影響?因為它通過RDMA式連接使存儲陣列更接近伺服器,這是否意味著你不再需要像CSS 1000這樣的產品?

他表示:「今天的大多數應用都受益於橫向擴展/超融合部署模型中的Computational Storage,在這種模型中,Computational Storage可以在計算伺服器中直接鏈接。這提供了最低延遲和最革新的部署模式。隨著客戶考慮解耦的存儲,Computational Storage將提供更高的價值,因為本地計算功能不僅可以在計算伺服器中減少CPU/內存之間的數據遷移,現在,還可減少Fabrics之間的數據遷移。」

像SCM(存儲級內存)和NVMeoF這樣的技術會給原位處理帶來怎樣的影響?

他認為:「SCM和NVMeoF都承諾要麼增強要麼擴展Computational Storage的使用模型,如上所述。隨著SCM的成熟,我們看到它與Computational Storage一起工作來擴展應用集。從NVMeoF的角度來看,在存儲上進行處理,可以減少數據中心內的數據移動,從而降低功耗、降低成本並提高數據驅動應用的響應速度。」

NGD Systems公司的營銷主管Scott Shadley也不認為NVMeoF會淘汰掉具有計算能力的快閃記憶體驅動器:「NVMeoF仍然只是讓每個驅動器獲得更多CPU訪問。它能起到一定的幫助作用,但不能完全解決瓶頸問題。它只是對存儲位置的整合,而不是變得更智能或更高效。」

但它解決了存儲網路瓶頸問題嗎?

他說:「下一步需要全快閃記憶體陣列和伺服器銷售人員賣出更多、更大的驅動器,但由於數量或內核數量還沒有增加,所以實際上並沒有實現高效擴展。在驅動器上的CPU仍然沒有實現擴展。」

將計算靠近數據,具有主伺服器CPU卸載的元素,類似於TOE網卡,即TCP/IP卸載引擎。這些都有一個明確的事情要做,那就是TCP / IP處理,但是除了壓縮或擦除編碼之類的低級操作之外,沒有存儲層面上類似的操作。

如果具備計算能力的快閃記憶體卡發揮一定作用,那麼就需要了解主存儲處理和驅動器存儲處理之間的界限。這可能是一個可移動的界限,隨著一般應用類型的變化而變化,但廠商必須能夠在特定的市場領域展示其產品技術的持久價值。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

回顧2017,中國存儲市場變化超乎想像!
什麼才是好的身份安全管理?

TAG:至頂網 |