當前位置:
首頁 > 科技 > 從V3跳到V6,華為OceanStor Dorado為何進步如此神速?

從V3跳到V6,華為OceanStor Dorado為何進步如此神速?

大家都知道,在AFA(All-Flash Array)的市場上,美國是大幅領先中國的。根據Gartner最新發布的外部存儲市場跟蹤數據,2019年Q1,美國國內的全快閃記憶體陣列(Gartner叫SSA:Solid-State Array)占整個陣列市場的56%,已經超過了混合陣列12個百分點了。

雖然中國使勁追趕,但是,從銷售數據上,中國的全快閃記憶體陣列佔比只佔整個陣列市場的26%,約為混合陣列的1/3。

這個差距其實比中美兩國的GDP差距要大多了。為什麼兩國有這麼巨大的差異呢?我覺得還是國內的AFA產品技術相對國外存儲公司來說,還差一些火候。

但是,最近華為發布的全新架構的OecanStor Dorado V6全快閃記憶體陣列,從架構和特性上比上一代產品OecanStor Dorado V3有了巨大的進步。大家知道,華為一般不用V4這個命名(不吉利),但為啥不叫OecanStor Dorado V5(對應混合陣列的OceanStor V5)而直接叫OecanStor Dorado V6呢,我猜想是因為其全新的架構和特性遠遠超過OecanStor Dorado V3和OceanStor V5的總和,因此直接叫OecanStor Dorado V6,以提醒客戶其巨大的進步。

這款OecanStor Dorado V6由於採用了華為大量自研的晶元,是一款真正的中國 「芯」 全快閃記憶體陣列,具有強烈的中國特色。

具體的進步體現在哪裡?我下面和大家來分三部分和大家聊一聊。

國產晶元,永快一步

在OecanStor Dorado V6里,有5種華為自研的晶元(不只是5顆哦):

智能多協議介面晶元Hi1822承載了本應由通用CPU負責的協議解析工作,加速前端訪問性能20%;

智能處理器晶元採用業界標杆性能的ARM-basedCPU鯤鵬920,算力優於業界水準25%;

智能AI晶元昇騰310基於機器學習框架,主動分析並掌握多個應用模型的I/O規律,實現內存空間的智能預取,讀緩存命中率提升50%;

智能SSD控制晶元Hi1812e承載核心FTL(FlashTranslation Layer)演算法,加速SSD盤內數據訪問,讀時延優於業界水準10%;

智能BMC管理晶元Hi1710內置華為存儲故障基因庫,加速部件故障診斷和定位,故障恢復時間從2小時縮短到10分鐘。

以上5種自研晶元,有3種的老版本是OecanStor Dorado V3使用過的,雖然這次晶元的版本有了巨大的更新。但其中的鯤鵬CPU和晟騰AI晶元是OecanStor Dorado V6特有的。

這裡,我們先來了解一下這款鯤鵬920 CPU(AI晶元後面再講)。

高性能鯤鵬920處理器,在SPECint benchmark測試成績超過930分,位居第一,超越業界主流CPU 25%

OceanStor Dorado V6單引擎有768核CPU,業界核數最多,獨有的CoreFarm眾核智能調度演算法,發揮眾核最大性能,達到單引擎160萬IOPS的高性能體驗。

業界首創有「芯」的智能硬碟框,鯤鵬920晶元裝備的智能硬碟框,承擔CPU算力,系統性能30%提升。

這裡我特別要強調一點就是,鯤鵬CPU不僅僅用在OecanStor Dorado V6的引擎上,而且還用在硬碟框上,使得硬碟框具有計算能力,一些加密和壓縮的操作完全可以卸載到智能硬碟框的鯤鵬處理器處理,系統的性能必然大大提高。這個智能硬碟框,在主流廠商裡面應該是第一個。

SmartMatrix,永遠在線

看完OecanStor Dorado V6的晶元加持部分,我們來了解一下其互聯架構SmartMatrix的設計和上一代有啥不同。

SmartMatrix架構採用了多控前後端的全互聯共享架構,前端通過FC-AA保證故障場景下的客戶無感知的高可靠性,後端通過100GE RoCE實現高端8控對IP硬碟框的共享,達成控制器8壞7情況下硬碟仍然可用的高可靠。同時由於在硬體架構中採用了全互聯CPU及cache架構,構築了NVME端到端協議棧化的架構,SmartMatrix在高可靠的前提下也可獲得極高的性能。

這裡我就要重點提一下針對上一代OecanStor Dorado V3的一些重大改變:

前端LUN級全對稱AA架構。上一代產品雖然控制器是AA的,但是在LUN級別是有歸屬的,這樣在控制器故障時系統需要切換LUN歸屬控制器(業界叫LUN Trespass),應用可以感覺到切換,對業務會有一些影響,一般IO夯住時間要長一些。業界一般是傳統高端存儲才具有這個高級特性。華為的OecanStor Dorado V6,圓滿解決這個問題後,預計未來在金融Core Banking系統等關鍵業務場景中將會得到大量採用。

全IP互聯。現在,OecanStor Dorado V6引擎(控制器)之間,引擎和硬碟框之間,引擎和主機之間,全部支持100GE RoCE互聯。由於RoCE上面也跑IP,因此,可以說是全IP互聯架構。原來OecanStor Dorado V3架構比較複雜,引擎直接是PCIe互聯,硬碟框採用SAS互聯,對外主機採用FC/iSCSI互聯。現在,可以全部統一到100GE RoCE上,當然,對外介面也保留對傳統FC的支持。

端到端的NVMe-oF。上一代OecanStor Dorado V3隻有後端支持NVMe,現在,在全IP互聯下,前後端都支持NVMe-oF了。當然,為了保持兼容性,前端也可以不跑NVMe-oF,而採用傳統的FC/iSCSI,後端也兼容傳統的SAS硬碟框,支持SAS的SSD。

正是基於這些軟硬體的改進,SmartMatrix全互聯架構可實現:

控制器8壞7業務0中斷(原特性);

控制器故障業務0感知(新特性);

1秒在線升級業務0影響(新特性)。

端雲AI,永智高效

持續幫助企業提升效率是IT系統的使命,在智能化時代它的重要性更為突出。華為OceanStor Dorado V6全快閃記憶體存儲基於AI晶元和AI演算法實現全生命周期的智能運維,創新的設備永新商業模式避免數據遷移導致的業務割接與中斷,提供流暢的使用體驗。

雲上雲下協同:華為OceanStor Dorado V6全快閃記憶體存儲採用邊緣個性化智能和雲上通用智能相結合原理,設備內置昇騰A310 AI晶元增量訓練,深度學習業務特徵,提升個性化體驗;eService智能運維管理平台實時統計現網19萬 設備規律,提取共性能力,增強基礎運維能力。

AI貫穿業務全生命周期:從資源規劃、業務發放、系統調優、風險預測、故障定位實現全方位智能管理,使得性能容量趨勢提前60天預判、系統提前14天發現故障盤、93%問題發現即給出方案。

FLASH EVER設備永新:智能彈性架構實現模塊化升級,10年以內數據無需遷移,用戶即可持續享用最新一代軟硬體能力,保護用戶投資。這個全新特性,可以有效解決傳統存儲的叉車升級的麻煩,生命周期結束升級設備硬體無壓力。

由於OecanStor Dorado V6有昇騰AI晶元的加持,使得其在智能程度上大大優於上一代產品。AI在各個方面都得到應用,在Cache預取演算法上尤其值得了解一下。因為雖然快閃記憶體很快,但是相比內存還是差不少,因此,在AFA時代,內存做Cache依然有很大意義。但傳統的Cache演算法在現代IO混雜負載場景下效果很差。

大量IO的讀取,好比大廳里大量人在同時討論,需要準確辨別出每個人並且理解相應的說話內容。可見,智能Cache預取演算法所進行的大量I/O序列的分析和深度挖掘,不僅需要智能的演算法,也依賴強大的計算能力。而華為OceanStor Doardo V6存儲真是集高性能計算和智能演算法於一體的智能存儲產品,是業界首創植入AI晶元(昇騰310)的存儲。通過AI學習引擎中的智能演算法分析和挖掘,可以自動識別IO「語音關聯」的規律,將客戶即將讀取的數據預取到DRAM等高端介質層,讓上層業務在OecanStor Dorado V6上感受最快速的數據讀取體驗。做到真正的知「輸」達「理」,根據你的輸入,就能知道你輸入中蘊含的應用規律。此外,隨著使用時間的積累,通過智能演算法孜孜不倦的學習,OecanStor Dorado V6對於上層業務的規律會挖掘的更透徹,用戶體驗會更上一層樓。不僅如此,OecanStor Dorado V6會將自己的智慧「保存」起來,當新舊設備更替,進行數據遷移後,繼續發揮作用。

相比上一代產品OecanStor Dorado V3只支持16個控制器,OecanStor Dorado V6支持到了32個控制器,系統整體性能高達20000萬IOPS,時延低至0.1ms。特性方面,我用紅色也標出OecanStor Dorado V6重大的新特性。

OecanStor Dorado V6的推出,我覺得在幾個關鍵的領域拉起和業界標杆的差距:

支持LUN級AA,拉齊了和HDS VSP 1500F等高端存儲的差距;

支持用AI提升Cache命中率和1分鐘內完成升級,拉齊和EMC PowerMax的差距;

支持全IP互聯和端到端NVMe-oF,拉齊了和Kaminario的差距;

支持在線升級控制器硬體,拉齊了和Pure Storage的差距;

支持深度AI運維,拉齊了和HPE InfoSight的差距;

而且,OecanStor Dorado V6這次還在一些創新上超越了主流廠商:

首創智能硬碟框。OecanStor Dorado V6在智能硬碟框內置鯤鵬處理器,可以卸載控制器引擎上的部分負載到硬碟框上,比如加密、壓縮、數據校驗和硬碟重構等。這樣的好處是數據無需送到引擎,處理起來更加高效;

首創內置AI晶元。OecanStor Dorado V6內置昇騰AI晶元,因此可以處理大量的數據,可以支持更智能更複雜的AI演算法,將會在智能運維、智能Cache預讀、智能QoS等等構造差異化,為未來存儲向全自動駕駛方向發展打下堅定的基礎。

隨著快閃記憶體的架構持續下滑,在主存儲領域,磁碟已經沒有任何優勢。Gartner在2018年Market Insight: Preparing for the SSD Rise and HDD Demise一文中指出:當快閃記憶體介質降到HDD每GB平均銷售價格(ASP)的三倍時(因為快閃記憶體的重刪壓縮率一般超過3:1),快閃記憶體技術通常會出現一個拐點,會加速取代HDD。

因此,Gartner預測,2023年,所有的數據中心的10,000rpm的HDD幾乎都被SSD代替。Gartner建議,現在就停止在數據中心環境中使用15,000 rpm和10,000 rpm HDD技術。

而且,SSD全面替換HDD盤,還有下面的利好。

更快:機械盤寫時延需要2毫秒,而當前業界最快的NVMe SSD盤寫時延僅需0.02ms,SSD盤HDD機械盤快100倍;

更穩:根據業內統計,HDD機械盤的5年返還率高達13.4%, 同等條件下,SSD盤的5年返還率僅為0.8%,顯然,SSD比HDD機械盤更穩;

更經濟:HDD盤的功耗為10瓦,而SSD盤的功耗僅為3瓦,SSD盤比HDD機械盤更經濟。

因此,快閃記憶體普惠時代已經到來。而這次全新的OecanStor Dorado V6的發布,補齊了原來和業界標杆的差距,並且在某些方面有一定的領先優勢。OecanStor Dorado V6的強勢推出,預計將會大大推動中國的快閃記憶體化進度,特別是在金融關鍵業務場景。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 高端存儲知識 的精彩文章:

阿里雲POLARDB資料庫為啥全線標配Intel「傲騰」?
公有雲也「All-Flash」?

TAG:高端存儲知識 |