人工智慧給雲時代的智能運維帶來了哪些創新
隨著越來越多的企業將應用系統遷移到各類雲計算平台上,帶來了應用系統開發和部署架構的變化,使得傳統以網路、主機、資料庫、中間件等基礎設施和獨立IT組件為核心的監控系統已經無法滿足對應用系統性能、業務連續性和最終用戶體驗等方面的管理需求,IT運行維護模式需要適應新的變化。
公有雲由於它的自身特點就是為其他企業提供雲計算服務,所以必然決定了它的體量一定是巨大的,並且公有雲運維和傳統運維有個非常大的不同,傳統運維都是自有業務,可以和業務部門協調變更、停機窗口,而公有雲全部都是客戶的業務,很難去判斷用戶行為,所以要求是絕對的穩定,變更中斷都要求是無感知的,這些都增加了公有雲的運維難度。所以公有雲運維和一般運維比起來,技術難度更大,需要更強的運營能力以及技術前瞻性。
人工智慧作為當下最火爆的前沿技術,是計算機科學最值得期待的一個分支,目的是研製出模仿人類思考邏輯和行動的智能化機器。科研人員嘗試用各種方式讓機器人替代人類從事不同類型的工作,從最開始的重體力勞動到繁複的精密加工到未來替代人類進行邏輯思考。智能化將大大減輕人的勞動,以最少的人工干預完成複雜的工作。
眾所周知,在運維發展的過程中,最早出現的是手工運維,在大量的自動化腳本產生後,就有了自動化的運維,後來又出現了 DevOps 和智能運維。在運維的過程中,其本質而言,涉及到的步驟無非是:產生海量的監測日誌,進行分析決策,並通過自動化的腳本進行控制。
過去,企業為了實現系統運維不得不藉助技術牛人來看管整個系統。而要做到對上述如此複雜環境中應用問題的追蹤、定位,則將是更為複雜。依靠人力的方式已很難做到。而人工智慧技術的引入則為這一難題的解決提供了千載難逢的契機。通過人工智慧技術的引入可以做到自動化的監控,可以很快的發現各個應用之間的邏輯關係,並快速定位問題、尋找問題根源。而藉助各種人工智慧的模型,則可以對問題實現自動化的解決處理。
最突出的一點就是,通過離散數據關聯關係的分析將運維數據進行人工智慧分析,實現系統性能的智能展現、系統智能預警分析、故障的智能分析。將工程師的經驗和分析思路轉換為系統人工智慧的分析過程,將以往知識庫內的信息轉化為人工智慧網路,成為系統的分析能力。從而達到智能、動態知識庫體系。
智能動態知識庫是人工智慧運維繫統的核心。知識庫中存儲了智能預測分析模型、歷史問題處理方案、運維經驗教訓、智能監控結果等。可以對歷史及新增知識自動分析管理、歸類保存,並依據現有知識庫的內容對日常監控中發現的問題進行實時智能分析、出具解決方案並對變更效果進行評估預測。
以睿至大數據的智能運維平台為例,其充分利用全景分析試圖、動態感知的業務分析知識圖譜、基於人工智慧技術的根源分析技術以及利用機器學習和智能分析進行異常診斷與風險洞察來幫助睿至大數據的用戶順利的從傳統「穩」態運維模式逐漸融合演進到新型「敏」態運維模式。
人工智慧將成為未來網路世界必不可少的一項工具。在IT運維領域,我們期待著人工智慧的不斷突破,讓憋屈的運維人好好緩口氣!


TAG:IT168企業級 |