哈爾濱中軟分享:需要關注的5種預測性存儲分析功能
預測性存儲分析工具正在成為企業採用的標準設備。人們需要了解它們的功能、工作方式以及提供的好處。
很多人都熟悉預測數據分析的強大功能、便利性,以及無與倫比的精確性。無論是在Netflix網站上尋找新內容,還是瀏覽近日在亞馬遜網站購買的物品,預測分析越來越多地用於自動化日常任務,過濾信息,做出更好的決策,並改善客戶支持。
預測分析的大多數早期用途都集中在消費者應用程序上,在這些應用程序中可以從大量用戶那裡收集大量數據,從而更容易證明在數據採集、處理和模型開發方面的大量投資是合理的。很難了解預測分析的投資回報率,因為這是一項複雜的工作。它遠遠超越了傳統的統計和概率技術,通常使用機器學習,甚至在某些情況下,採用基於神經網路的深度學習來訓練模型,並根據大量數據集進行預測。數據驅動的方法非常適合於自動化IT系統管理,因為現在的基礎設施可以提供大量的事件日誌、系統遙測、性能指標。
製造、物流和設施控制系統開創了預測分析的工業應用。例如,勞斯萊斯公司使用預測分析來主動安排維護,並提高其飛機發動機的效率。在存儲應用中,預測分析用於預測和主動修復設備故障,識別性能瓶頸,並基於歷史測量優化系統配置。
消化所有數據
毫無疑問,無論是Netflix網站還是谷歌智能助理,企業的使用數據越多,其提供的建議就越好,因為逐步提高準確性主要取決於是否有更多數據可供使用。這同樣適用於預測性存儲分析。該軟體的準確性與它所擁有的數據一樣,無論是數量還是質量都很重要;基於不準確或不精確數據的預測模型都將失敗。
對於預測性存儲分析軟體,數據需求轉化為收集大量系統事件、內部參數、性能度量和特定於工作負載的度量。其基線遙測包括:
· 事件和錯誤日誌,例如系統故障和異常;
· 性能測量,例如總體IOPS和每卷IOPS、各種操作(如順序讀取、隨機讀取和順序寫入)的吞吐量以及延遲;
· 按工作負載劃分的帶寬使用和延遲;
· 工作集(熱數據)和緩存利用率。
用於模型開發和培訓的數據集越大,預測統計模型或機器學習模型的精度越高。考慮到這一點,許多供應商對來自其所有客戶的數據進行匯總和匿名。使用更廣泛和多樣的安裝示例中的數據,供應商可以顯著提高預測,更好地檢測性能、安全性和硬體異常。
例如,Hewlett Packard Enterprise InfoSight是HPE公司收購Nimble的產物,每天從幾乎每個部署的Nimble陣列收集來自3000萬到7000萬個感測器的數據。該公司聲稱,在客戶發現問題之前,它發現的90%的問題都可以得到解決。
HPE公司的InfoSight每天從部署的Nimble陣列收集多達7000萬個感測器的數據。
由於訓練數據集僅由存儲軟體供應商用於預測模型開發,因此不需要識別特定客戶的信息,並且每個客戶部署可以從其他客戶的經驗中受益。首先,存儲供應商使用聚合數據來改進所謂的機器學習或深度學習培訓階段的預測模型。然後,他們將模型推送到系統管理軟體,該軟體在推理階段從各個系統中提取實時監控數據。其他模型用於系統配置、容量規劃和故障排除,以執行根本原因分析。
預測演算法正在成為存儲平台上的標準設備,與存儲管理的被動方法相比,它具有許多優勢。
預測性存儲分析軟體通常用於改進許多任務。在評估產品時,需要查看每個產品如何衡量這五個關鍵特性和功能:
(1)支持自動化預測並防止性能、容量、可用性和安全問題。容量管理是預測性存儲分析軟體最常見的應用程序。模型可以實時分析每個設備、數量和應用程序的使用情況,並在達到使用目標時主動發出警報。根據管理員的判斷,系統可以自動添加分配的空間或重新平衡現有容量,以防止其耗盡。
預測性存儲分析還可以通過關聯和識別與特定問題相關的事件來幫助解決問題和進行根本原因分析。使用匯總的客戶數據對於故障排除特別有用,因為它為管理系統提供了對所有客戶問題超集的可見性,並能夠檢測到以前未發現的細微的問題,這些問題與其他地方發生的類似問題共享取證簽名。
(2)管理和配置功能顯示在模型中,模型可以自動確定性能、資源消耗、容量基線和趨勢。其中包括不適合簡單統計模型的模型,如線性、多項式回歸或周期性時間波動(季節性、每月、每周)。基線和趨勢可用於自動化存儲系統的設置和管理,並通過優化配置設置和協助工作負載分配來提高資源利用率和效率。
(3)系統軟體更新和修補功能主動應用修補程序(需經管理員批准),包括解決以前發現的系統問題的修補程序。一些供應商使用分析使beta或alpha級別的代碼,僅對遇到特定問題並滿足硬體或其他系統要求的站點可用,希望該修復程序能夠解決緊急問題,而不會不必要地危及其他客戶的可靠性。
(4)資源規劃功能使用相同的趨勢發現預測演算法來增強規劃模擬和假設分析,使存儲管理員能夠快速模擬各種場景,預測容量、IOPS和帶寬需求,並建議系統升級。
(5)虛擬機管理功能與各種虛擬化平台(尤其是VMware的vSphere)集成,可提供特定於工作負載的性能和容量指標,現場使用趨勢並建議存儲配置設置。
好處和建議
預測演算法通常與其他自動化和配置管理工具配合使用,正在成為存儲平台上的標準設備,與存儲管理的被動方法相比,它具有許多優勢。這些包括:
· 通過自動化與容量和性能管理相關的存儲任務來降低運營支出;
· 通過主動解決問題來提高可用性,例如特定卷上的容量耗盡;
· 通過推薦最佳配置來提高資源利用率和效率,並改善應用程序性能。
例如,除了在客戶意識到問題之前預測和解決問題之外,HPE公司聲稱InfoSight將管理和解決存儲相關問題所花費的時間減少了85%,並節省了79%的運營費用。
存儲供應商通常提供管理軟體。因此,建議將預測性存儲分析和其他人工智慧衍生技術作為未來產品評估的關鍵點。對於使用設備無關的軟體定義存儲的組織也是如此,例如Cohesity、DataCore、Red Hat Ceph、Gluster以及VMware vSAN。使用上面的功能列表作為產品評估清單的一部分,以確定最適合企業的需求和更廣泛的基礎設施管理環境。
※哈爾濱中軟分享:從事雲計算的5種技能IT人員必了解
※哈爾濱中軟分享:如何管理物聯網大量湧入的數據
TAG:中軟卓越哈爾濱 |