當前位置:
首頁 > 最新 > AIOps智能運維=機器學習+自動化運維

AIOps智能運維=機器學習+自動化運維

隨著機器學習、深度學習等人工智慧技術在IT領域的廣泛應用,AIOps智能運維將為數字化企業提供更高的管理效率和更低的運營成本。

在互聯網和數字化成為全球經濟增長新引擎的今天,企業管理和業務運行與IT系統健康息息相關,高效的IT管理能幫助企業在瞬息萬變的市場競爭中獲得快人一步的競爭優勢。然而雲計算、虛擬化和微服務技術的應用使得企業IT系統越來越龐大而複雜,要滿足高性能的業務運行需求絕非易事。

特別是為了提升用戶訪問體驗而廣泛採用的分散式應用系統和CDN資源,以及越來越複雜的網路接入環境,使得IT部門很難第一時間發現IT故障的發生。企業為了保障系統的高可用,降低故障率,往往會進一步擴大IT系統規模,於是業務增長越快、IT規模越大,IT管理的負擔越重。

在2016年,Gartner針對IT發展和運維管理的困境,提出了一種全新的運維管理方法,以減輕企業IT的負擔,提升管理效率,這就是AIOps智能運維。AIOps是Algorithmic IT Operations的縮寫,從字面上看是一種基於演算法的運維方式,區別於傳統的人工運維和自動化運維,通過基於運維大數據的機器學習,用智能決策逐步取代人工決策,提升IT管理效率,因此國內業務運維企業雲智慧把AIOps稱為智能運維。

AIOps的落地,將把日常的IT管理工作移交給擁有機器學習和自動化運維的智能運維平台,大大降低企業管理的時間成本和資金投入。而運維管理人員也可以從篩查海量告警信息、執行重複性巡檢任務、人工判斷故障、手動解決問題的低效工作中釋放出來,專註於構建更加高效、高擴展的IT系統,支持企業的數字化業務發展,這也就是業界所倡導的「IT從運維到運營」之路。

AIOps智能運維平台還能有效預測潛在的IT故障,並在無需人為干預的情況下提前解決掉這些問題,而應用系統故障率的降低,將有效提高雲計算資源的使用效率。這得益於機器學習和深度學習演算法在IT監控和應用性能管理系統中的持續積累,不斷記錄IT運維人員在不同場景下使用故障排除或修復基本問題的自動化工具的操作。當針對不同型號設備、不同應用系統、不同的雲平台的學習樣本數據足夠豐富時,AIOps智能運維平台就可以自動評估系統的健康狀態,如CPU使用率、磁碟吞吐率、設備故障率等,如果發現了系統的異常活動,就能提前自動觸發相關運維操作。

企業採用AIOps的能力不僅取決於IT監控系統的數據規模和自動化系統的可用性,還取決於人員和流程的一致性。服務商可以在很短時間內把AIOps智能運維平台部署到企業,但任何管理轉型都不是安裝一套系統那麼簡單,需要根據業務特點對人員和流程進行調整,而這往往需要更多的時間。

要衡量AIOps智能運維平台在企業中的實施效果,可以重點關注兩項關鍵指標,平均故障恢復時間(MTTR)和事務(故障)處理數量,這兩項指標反映到客戶滿意度上,就是AIOps的價值。

以機器學習、深度學習為代表的人工智慧技術的成熟,為利用IT手段持續改善企業經營水平和服務質量鋪平了道路。而AIOps以IT大數據為切入點,率先解決了所有數字化和互聯網+轉型企業所面臨的業務與IT系統斷層的問題。雖然大多數機器學習項目可能需要多年才能看到價值,但AIOps平台可以用最小的代價為企業運營帶來卓越的投資回報。同時,這筆投資可以長期持續的提供業務價值和提升用戶口碑。

責編:chenjian


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

星座分析有科學依據嗎?用大數據和機器學習揭開十二星座的真實面目!
借鑒師生互動模式來訓練機器學習模型
機器學習演算法可近似性的量化評估分析
初學者必讀的八個趣味機器學習項目‖教程 數據集
無需編程,僅用攝像頭,Google 最新項目讓你 3 分鐘學會機器學習

TAG:機器學習 |