當前位置:
首頁 > 最新 > 華為KunLun小型機讓In-Memory應用持續!

華為KunLun小型機讓In-Memory應用持續!

資料庫越來越多地被使用到現代企業的生產、運營和管理中,是企業重要的IT基礎設施。其中承載企業關鍵業務的核心資料庫通常要求實現7X24小時不間斷運行,以最大降低宕機帶來的損失。

KunLun開放架構小型機滿足關鍵業務對性能和可靠性的高要求。在性能方面,KunLun不僅在多項SPEC基準測試中排名第一,並且在面向聯機分析處理過程(OLAP)和聯機事務處理過程(OLTP)的SAP B4H和SD2基準測試中更是拿下雙料冠軍。在可靠性方面,KunLun開放架構小型機採用創新的RAS 2.0技術,突破性實現CPU和內存等核心部件在線不停機更換,在高可靠性方面具備超越傳統UNIX小型機的能力。(RAS是可靠性Reliability、可用性Availability 和可服務性Serviceability的縮寫,代表在這3個領域的技術集合。)

傳統資料庫中大量參與運行的數據是保存在磁碟等存儲設備上的。在現代計算機的基本架構中,存儲設備相對內存更遠離計算機的核心運算單元中央處理器CPU:CPU訪問存儲設備的速率和帶寬都遠低於CPU訪問內存時的速率和帶寬。隨著伺服器處理器支持管理的內存容量越來越大,不少資料庫廠商已經將資料庫的大量運行數據持續保存在內存中進行運算和管理,這一類採用了「In-Memory Computing」的資料庫大大提升了資料庫的整體性能。

隨著伺服器可安裝的內存條數目和內存容量的不斷增加,企業對伺服器內存子系統的可靠性的關注度也在不斷提升。華為KunLun開放架構小型機不僅具備DDDC、內存備份、內存鏡像等高可靠性技術,更是具備了X86業界唯一的內存在線熱替換技術,該技術結合KunLun 的故障主動分析預警引擎(PFAE)技術,可使用戶在內存出現早期輕微異常時就提前採取措施。內存條也和大部分電子設備一樣,其故障率隨時間的曲線呈浴盆形,即業界常說的浴盆曲線(bathtub curve),失效率較高的階段為早期失效期和損耗失效期。早期的高失效階段,KunLun通過生產測試進行過濾,保證到達用戶手上的是處於低失效率階段的內存條。對於後期的損耗失效,KunLun的內存熱替換技術使得內存條在即將進入損耗失效期時就可以在保證業務持續運行的前提下進行熱替換,使業務系統使用的內存一直處於低失效階段,避免了內存連續使用進入高失效率階段後出現嚴重故障甚至導致系統宕機。

圖:失效率浴盆曲線

「開放帶來加速創新」

華為KunLun開放架構小型機與世界知名的企業級Linux操作系統廠商SUSE聯合發布的In-Memory應用持續運行解決方案是雙方建立在開放架構、開放生態基礎上的創新成果。

圖:內存熱替換功能分層架構

自KunLun發布以來,華為和合作夥伴積極構建開放生態,加速創新。內存熱替換技術是系統性的複雜技術,需要處理器、BIOS固件、伺服器平台,還有操作系統內核的支持。SUSE和華為在長期合作的基礎上,共同向該項技術發起挑戰。SUSE召集了資深的內存及ACPI專家,和華為進行深度聯合開發。在SUSE正式發布的操作系統補丁中,對內存管理模塊、ACPI的驅動模塊做了大量底層代碼的優化與加固,優化了內存熱替換技術的流程。

不僅如此,華為與SUSE的In-Memory業務持續運行解決方案的聯合發布,也是開放架構伺服器的業界首創。以X86架構為代表的開放架構伺服器正在引領技術創新的潮流,KunLun開放架構小型機不僅幫助用戶加速創新的步伐,更在加速創新的同時提供業界領先的可靠性保障。

「專註業務體驗提升」

KunLun的In-Memory業務持續運行解決方案不僅關注技術本身,更專註於用戶的業務體驗。

華為與SUSE在內存在線熱替換技術上進行了長期的合作開發,一步一個腳印,從操作系統本身支持內存熱替換到不同用戶業務場景下的內存遷移效率優化,都進行了深入的研究和不斷的創新,尤其對於「In-Memory」這類業務進行了系統性地驗證和優化。

對於有潛在故障內存的在線熱替換,極其重要的一個環節是將這些內存上正在運行的數據遷移到其他正常的空閑內存上,最後在內存遷移完成以後刪除潛在故障內存相關的資源信息,以保證沒有新的數據存放於此。操作系統和資料庫對內存的使用非常複雜,特別是不同的資料庫對內存的訪問方式可能存在差異。華為與SUSE面向主流的資料庫包括Oracle、SAP HANA等應用場景都進行了內存遷移優化,提高了單個內存頁的遷移成功率,減少重試從而縮短整體的內存遷移時間。

「操作簡單易於維護」

雖然內存的在線熱替換是一個系統級的非常複雜的過程,但是對於用戶來說,操作卻是非常簡單的。

當KunLun的PFAE技術檢測到某個內存板發生了輕微異常,並且有演變為嚴重故障的趨勢時,KunLun的管理頁面上會出現預告警提示,這時用戶只需在管理界面上找到預告警中標記的具有潛在故障的內存板對應的圖標,點擊圖標上的熱插拔按鈕觸發內存熱移除命令,便可自動完成接下來的操作:

1. 系統固件會通知操作系統遷移潛在故障內存上的數據;2. 操作系統完成內存數據遷移後刪除對應的資源管理信息;3. 系統固件刪除潛在故障內存板對應的系統地址編碼信息,並控制硬體系統給內存板斷電。

圖:熱插拔操作界面,點擊內存條圖標上的圓點(狀態燈)觸發熱插拔操作,內存熱移除後狀態燈由綠色(表示健康)變為藍色(表示在位但未供電)

用戶此時只需打開機櫃抽出故障內存板,更換故障內存條,然後,將內存板插回到機櫃中,再次點擊熱插拔按鈕觸發內存熱添加命令,便可自動完成包括內存的加電、電氣特性配置、系統地址分配和創建管理信息等操作。整個熱移除和熱添加的過程中,用戶的業務都不會出現中斷。

KunLun開放架構小型機不僅支持內存在線熱替換,也可支持CPU的在線熱替換。視頻中記錄了在華為實驗室中進行的CPU和內存的在線熱替換操作演示。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT168科技 的精彩文章:

IFC 開展在即,看台達演繹「智慧城市」
智慧AI加持/18:9全面屏 酷比S509接受預約

TAG:IT168科技 |