當前位置:
首頁 > 最新 > 機器學習有助於解鎖自驅動數據中心的力量

機器學習有助於解鎖自驅動數據中心的力量

本文中,我們將與您一起來看看機器學習所具備的改善數據中心的潛力。

對於谷歌公司的工程副總裁Ben Treynor Sloss來說,未來的數據中心不僅僅將受益於機器學習,同時,其運行也將是由AI推動的。 Sloss指出,通過採用谷歌自己的DeepMind機器學習系統,該公司實現了大量的成本節省。自2016年開始,其DeepMind機器學習系統對於這家技術巨頭數據中心的運營就已經發揮了舉足輕重的有幫助的重要作用了。DeepMind系統通過調整伺服器的運行方式和數據中心內部電力和冷卻設備的運行,顯著提高了數據中心的能效。使得其節能減排達到了40%。而如果在谷歌全球所有的數據中心都推出類似的系統的話,那麼,該公司每年可以節省數千萬美元。

對於Belatrix軟體公司的共同創始人兼總裁Alex Robbio來說,機器學習和人工智慧的應用潛力不僅僅是電源管理。長期以來,Robbio一直致力於對神經網路和機器學習的研究工作,在Belatrix公司內部,他創建了一個研究小組來研究不同AI和機器學習框架在客戶項目中的應用。Belatrix公司擁有的500多名工程師中,有95%的工程師在為該公司數據中心的客戶服務,因此在這些環境中應用機器學習解決方案尤其令這些工程師們感興趣。

Robbio設想了一個場景,就像自動無人駕駛汽車的承諾一樣,未來我們將擁有自驅動的數據中心,這些數據中心將負責運行自驅動的計算機,而這些計算機則又將運行自運行的軟體。他表示,儘管谷歌公司使用DeepMind來優化電源管理的確令人興奮,但我們很快就會看到,在數據中心環境中還有很多機器學習和人工智慧的其他應用。

DFINITY網路公司的運營總監兼通信主管Artia Moghbel表示,AI目前已經在數據中心中得到廣泛使用了,通過識別低效率和節省成本的機會來幫助企業數據中心降低運營成本,特別是與數據中心相關的運營變數(如冷卻風扇,窗戶等等因素)。

機器學習如何在數據中心運營實踐中發揮作用?

下一步,就是使用AI來管理數據中心運行的其他物理方面。 「我們可以看到,機器人負責管理數據中心的物理網路。如果你企業有一台在網路中正在執行某項任務的錯誤機器,例如,該機器可能已經被病毒感染,通常軟體會被分離出來,通知操作人員需要做些什麼補救措施。」Robbio補充說AI就可以在這方面發揮作用。

「軟體沒有能力在這些情況下採取措施。但是,通過機器學習,您數據中心可以採取主動或被動的措施,數據中心可以自動將設備從網路上解除耦合,而無需人為干預。」

他補充說,這並不一定意味著機器人就會像科幻小說中所經常出現的那樣是人形的機器人。「這是關於插拔網卡的物理行為,而不是一個複雜的機器人。」 Robbio說。

創建機器學習IT分析工具的SIOS技術公司總裁兼首席執行官Jerry Melnick補充說,虛擬環境已經迅速成為許多數據中心的核心——負責運行企業最為重要的業務應用程序。Melnick說,這一趨勢已經超過了傳統的數據中心管理和優化方法。大多數企業的IT團隊仍然沿著計算]存儲、應用和網路的傳統物理孤島進行組織,並結合使用手動專有技術和依賴單一的「閾值」分析的工具。

「今天,虛擬環境對於人類來說是非常複雜和動態的。如果沒有一種有效的方法來查看虛擬基礎設施孤島,以及組件之間的交互,IT就會因為性能問題,容量超限和其他意想不到的後果而陷入困境。」Melnick說。這就是AI發揮其用武之地的時候了。先進的機器學習和深度學習分析工具通過即時識別虛擬環境中應用程序性能問題的根本原因,並通過推薦解決問題的具體步驟來解決此問題。

「他們將目光投向IT孤島,了解虛擬系統中相互關聯的組件之間的複雜的行為模式。這使得他們能夠識別即使是複雜的,微妙的交互,比如「嘈雜的鄰居」場景,其中一台虛擬機的性能下降可能是由共享資源的其他虛擬機的行為引起的。最為重要的是,先進的機器學習分析工具可以根據過去的行為預測何時會出現性能問題。」他說。

Robbio相信,更長遠的來看,我們將可以擁有完全自動化的數據中心。「你企業可以僅僅提供伺服器和設備,而由機器學習演算法控制的機器人負責進出運營,這些機器人可以主動處理數據中心的維護工作。」由於數據中心的維護工作成本非常昂貴,這可能會為企業節省大量的成本。

Robbio認為,機器學習潛力的另一個領域是邏輯上的。隨著機器學習的發展,企業決策將成為部署維護數據中心的軟體功能的一部分。 Robbio說:「大部分軟體都是基於規則的,沒有能力根據過去的模式做出決定,但是機器學習有可能應用更多的模糊邏輯,識別可能的模式,並在此基礎上作出決定。」

IBM公司分析開發副總裁Dinesh Nirmal對此表示贊同。 「未來,數據中心將轉變為自我優化、自我管理——根本原因分析和預測/減少設備熱點等等都將是自動化的。」Nirmal認為,未來,數據中心應該能夠通過自身運營。例如,AI應該知道應該打什麼樣的補丁,何時應用這些補丁。其應該能夠進行異常檢測,監視如何看待意外的機器故障。」

Moghbel說,儘管業界在數據中心使用人工智慧(AI)領域還處於初級階段,但它在下一代數據中心(如分散式雲)中的應用可能被證明是至關重要的。例如,在分散式雲計算機的例子中,關於如何存儲和管理信息的決定可能落在人類決策的手中,所有這些人可能並不都同意是否應該實施新的代碼來改進網路的效率。

Moghbel說:「通過像Dfinity技術公司一樣使用AI和自我管理的系統,這些類型的決策將受到演算法的控制,從而確保平台的凝聚力,並在整個網路中及時高效地執行操作更新。」

然而,在數據中心實現人工智慧和機器學習並非沒有挑戰,即使是在最基本的部署階段。其並不只是單純的技術,同時也存在相應的使用障礙。而Robbio說,這關乎到現有數據的數量,質量和性質。

「挑戰在於更多地收集和理解數據,因為您需要大量數據才能使這些應用程序正常工作。他說,並不是所有的設備都裝備齊全,而且並不是所有的設備都有記錄功能,沒有共同的標準,所以把這些設備整合在一起,進行清理,並需要將他們放在機器學習演算法可以學習的格式中。」

數據中心的機器學習是否會造成人才短缺?

對於那些希望在數據中心部署機器學習的人來說,另一大絆腳石可能是人才的缺乏。「獲取數據是一回事,但讓人們自如的使用數據卻是另一回事。」Robbio警告說,機器學習和人工智慧與傳統開發人員的所學完全不同。「開發人員傾向於以基於規則的思維模式進行思考,而機器學習需要一個不同的思維過程。讓人們擁有這種思維和經驗是非常困難的。這就是為什麼你看到像谷歌這樣的公司試圖針對所有的開發人員進行機器學習方面的培訓的原因。」

NetApp公司的雲戰略和佈道師Michael Elliott說,機器學習和AI的部署應該像其他業務自動化程序一樣對待。企業高管們應該問:你企業最終想從數據洞察分析中獲得什麼?

Elliott補充道:「企業CXO級別的高層管理人員們還應該考慮為他們的業務提供最佳的存儲基礎架構,以及他們想向客戶提供什麼樣的產品和服務。一旦建立起來,保持數據管理和保護的首要目的就是維持控制權,而在機器學習的幫助下最大程度地減少一些日常的障礙,人工智慧的進步將保持數據管理方面的風險的緩解。」

Nirmal警告說,轉向人工智慧不是一個容易的過渡過程。「企業組織需要做大量的測試。 針對這項任務所做的準備越是充分,該任務的進展就會越順利,數據中心故障恢復處理的成本遠遠高於實施AI或機器學習的成本。但是這一切都始於對於您所想要完成的任務的充分理解。」


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

Facebook如何運用機器學習進行十億級用戶數據處理
機器並不想學習——初識機器學習

TAG:機器學習 |