當前位置:
首頁 > 最新 > 不是所有的伺服器都叫「智能伺服器」

不是所有的伺服器都叫「智能伺服器」

『IT數智匯』

是華為IT為廣大IT鐵粉隆重推出的技術專欄,

乾貨多多,營養多多,內容多多,

精彩不間斷,每周都有,敬請期待!

隨著雲計算、大數據以及AI業務的蓬勃發展,對伺服器和計算能力的需求大大增加,全球都在加速數據中心的建設,而且規模越來越大,從幾萬台伺服器到幾十萬甚至上百萬的規模。根據Gartner報告,2017年第4季度全球範圍內伺服器的收入同比增加25.7%,伺服器相關的技術產業正處於高速的上升期。由於業務的快速發展,需要IT基礎設施具備快速部署、快速上線及便捷管理的能力,海量伺服器的管理場景將變得越來越複雜,傳統運維領域面臨著許多新的挑戰。

伺服器部署的挑戰

在數據中心的擴容、遷移和整合場景中,一台新採購的伺服器到正式使用需要經過裝配、、調測、分配網路資源、下發配置等過程,現場人力涉及到硬體安裝、軟體部署和技術類運營維護人員等。這些操作大部分都需要運維人員現場手工操作,據華為公司IT部門統計,這類操作中,超過50%的故障是由人工操作引發。人工操作效率較低且容易出錯,這將導致額外的人力、物力以及時間的開銷。

能耗管理的挑戰

根據Climate Change News的報告,2017年全球數據中心的電力消耗總量佔據全球電力使用量的3%,而且預計在2025年這一比例將高達20%。另外據統計,能耗費用占數據中心OPEX(運營費用)比例高達35%,OPEX高速增長成為「全球難題」。用戶對能耗管理的訴求主要體現在如何設計可靠的能耗管理策略,能夠高效地節約能耗開銷;以及如何有效地統計和預測能耗開銷,這對數據中心的精準投資至關重要。

故障預警及診斷的挑戰

傳統運維模式中,運維人員主要是被動式地等待問題發生,再進行故障處理,傳統運維模式下人均維護效率為50~100台。隨著數據中心規模越來越大,故障將發生地更加頻繁,故障之間的關聯將更加複雜,傳統方式的維護效率會進一步降低。另外基於告警上報的傳統維護方式是要達到嚴重的閾值才能上報問題,難以避免業務中斷。在這樣的背景下,用戶級的99.95%或以上的服務質量承諾(SLA)很難保障。

面對這樣的挑戰,我們應該如何應對呢?

Gartner於2016年提出了智能運維的概念(Algorithmic IT Operations, AIOps),AIOps的部署率在2016年低於5%,但是2019年AIOps的全球部署率將達到25%,智能運維正快速發展。AIOps運維平台擁有如下11項能力:包括歷史數據管理、流數據管理、日誌數據提取、網路數據提取、演算法數據提取、文本和NLP文檔提取、自動化模型的發現和預測、異常檢測、根因分析、按需交付和軟體服務交付能力等,這些能力的定義為解決上述痛點問題提供了很多針對性的解決措施,是當前數據中心管理海量伺服器主要的發展方向。

▲智能運維概況[Gartner 2016]

智能運維是一個長期演進的過程,可以看到智能運維側重的是從海量機器數據中進行檢測、預測,從被動運維變成主動運維,這種優化主要軟體層面的優化,但實際上要在部署、節能以及故障管理等領域實現質的提升,軟硬體的協作必不可少。

在這樣的背景下,華為提出智能伺服器的概念,智能伺服器通過集成智能管理晶元及智能演算法,在伺服器部署、故障診斷及預測、能耗管理、移動運維以及版本管理等方面,提供智能化的管理能力。

▲智能伺服器五大功能

智能伺服器是集成運維平台軟體、BMC軟體以及智能化晶元的軟硬體整體解決方案。那這種軟硬體整體的解決方案有什麼優勢呢?

相對於傳統伺服器和OEM模式的伺服器,智能伺服器具備智能化的管理功能,例如單機級別的故障預測和分析,智能能耗管理等。同時界面操作更加人性化和智能化,降低了運維人員的維護成本,提高運維體驗。另外智能伺服器支持維護人員在近端通過藍牙、WiFi接入伺服器運維繫統,在伺服器部署和故障定位排查提供了極大的便利性。

以部署和維護場景為例,智能伺服器提供一鍵式WiFi熱點按鈕,維護人員到達現場後,按下WiFi熱點按鈕,並使用移動App掃描伺服器上的條碼接入伺服器運維網路,快速維護伺服器的框位信息及下發配置操作,或者根據移動App提供的裝配和故障排查指導進行裝配和維修等。

▲移動App一覽

相對於智能運維,智能伺服器提供了支持智能化管理功能的硬體平台,這大大豐富了智能運維的場景。在很多場景,運維人員需要手工操作的瓶頸點並不是因為有效信息在隱藏在海量數據中,而是硬體本身不支持智能化的管理。智能伺服器將軟硬體打通,從根本上解決一些運維場景中僅依賴軟體層面無法解決的問題。同時由於硬體晶元能力的提升,伺服器本身能夠分擔一部分智能運維能力,對伺服器的管理更加及時、高效;伺服器採集到的硬體信息也將更加全面,能夠為運維平台產生決策提供更加可靠的參考。

對於能耗管理,智能伺服器將動態CPU調頻、風扇調速以及電源休眠等功能進行整合。當夜間業務負載較低時,用戶將能耗模型設置成節能模式,智能伺服器動態地調節CPU頻率,限制功率數值,同時讓部分電源進入休眠模式,進一步節約能耗。當日間業務負載較高時,用戶將能耗模式設置成高性能模式,智能伺服器解除CPU調頻限制和電源休眠配置,同時讓風扇散熱使用高性能的散熱規格, 節能策略的智能聯動,單櫃伺服器有望節能10%以上。智能化的能耗管理平台還提供了機櫃級能耗的智能控制,根據歷史功率推薦合適的功率封頂值數值,在典型業務場景下,單櫃伺服器的部署密度可以提升10%以上。

▲智能能耗管理平台

智能伺服器繼承了智能運維現有的功能,同時為智能運維的演進提供了一個新的方向。可以預想到,通過智能伺服器解決方案的實施,傳統運維人員能夠擺脫以往機械式、重複性和低價值的日常工作,手工操作最大限度得變為智能化的自動操作,現場運維人力的效率能夠得到極大的提升。同時智能化的能耗和故障管理能力能夠更好地保障對業務系統所承諾的服務質量(SLA),並且為用戶更好節省運營成本。

華為智能伺服器,用「芯」呵護,承載未來。

- 相關回顧 -

點擊了解華為伺服器


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 華為IT產品解決方案 的精彩文章:

華為新一代智能快閃記憶體存儲看點一應俱「全」
華為在中國生態夥伴大會2018發布新一代智能快閃記憶體存儲

TAG:華為IT產品解決方案 |