數據中心智能化,華為憑什麼做到一騎絕塵?
這段時間如果你途經深圳或北京機場,可能會被華為的巨幅平面廣告所吸引。不是手機,也不是雲,華為這一次秀的,是隸屬於企業BG的數據中心系列產品。率先登場的,是華為數據中心交換機CloudEngine系列——號稱業界首個面向AI時代的數據中心交換機。
從廣告主視覺到文案,滿眼都是AI的身影——華為昇騰AI晶元、iLossless演算法,以及重複出現四次的AI字眼——似乎要非常明確地表明身份,「不同於傳統數據中心交換機,我是AI加持的劃時代產品。」有多不同,小字部分給出了直觀的「跑分」答案:在三大場景性能上比友商均提升了30%左右。
見慣了手機「跑分」的人可能對此有些麻木,但IT業內人士當能看到關鍵場景性能提升30%的價值和意義。仔細看你會發現這個數據出自國際權威評測機構Tolly Group,公信力不在話下;而密切關注IT行業動向的業內人可能已經知道,廣告中未點名的被Tolly對比測評的業界產品,正是思科頂級的Nexus交換機。
如此一來問題就變得有趣了:在AI方興未艾的當下,華為真的有「九陽神功」護體學什麼武功都很快,而且都很能打嗎?眾所周知,華為已經用AI手機在消費市場創下新高度,難道僅僅引入AI,就能讓華為在企業數據中心領域走完別人行走多年的路,實現彎道超車嗎?
帶著這些問題,筆者日前代表極客網與國內一眾IT網路資深媒體人走進華為企業業務展廳實地參觀體驗,並與華為企業BG全球Marketing總裁邱恆做了深度的交流,特將所見所聞所感與大家分享。
AI貫穿一切,打造端到端智能數據中心
華為身上的標籤很多,其中之一是「端到端」,指的是華為能夠提供端到端全面而完善的產品及解決方案。數據中心也不例外,除了開篇提到的機場廣告中的主角數據中心網路外,位於深圳坂田的華為企業業務展廳還展出了包括計算、存儲、傳輸、電源、散熱在內的數據中心產品及方案。
一個顯著的特徵是:AI不僅被華為應用到其中的計算或網路等單一環節,而是貫穿整個數據中心的每一環。也就是說,基於全面的技術和產品能力,華為打造的是端到端的智能數據中心。這或許可以解釋為什麼華為敢於喊出智能數據中心的口號,並切實做出讓傳統數據中心黯然失色的劃時代產品。
比如在數據中心交換機環節,邱恆介紹到,華為CloudEngine系列最新產品CloudEngine 16800通過華為自研的昇騰310高性能AI晶元和獨創的iLossless智能無損交換演算法,可實現流量模型自適應自優化,大幅降低故障識別和故障定位所需的時間,在零丟包基礎上獲得更低時延和更高吞吐的網路性能,克服傳統乙太網丟包導致的算力損失,將AI訓練效率提升40%,數據存儲IOPS性能提升30%。
又如在存儲環節,華為的OceanStor Dorado V3全快閃記憶體存儲系統採用智能晶元、NVMe架構和FlashLink智能演算法,可提供0.3ms的穩定時延,實現端到端加速,業務性能提升3倍。
再如在電源、散熱及管理環節,華為的FusionModule2000智能模塊化數據中心實現了業界唯一的智能化管理,提出了基於iCooling、iPower、iManager的i3解決方案,能在典型場景(100kW數據中心,負載率50%)中每年省出13萬度電。
端到端的智能帶來的好處是十分顯著的,邱恆在分享中列舉了一個銀行客戶做數據中心故障排查演練的案例,以前用傳統的方法要76分鐘才能找到故障,現在8分鐘就能把故障定位。這意味著,有了智能演算法、智能晶元的幫助之後,數據中心的智能水平有了飛躍性的進步;從76分鐘到8分鐘,這是一個數量級的提升!
綜上可見,不囿於一招鮮單點發力,AI已經被華為融入到數據中心的每一個環節,並且在關鍵場景性能提升和運維管理的降本增效層面均取得顯著突破。可預見,機場秀肌肉的CloudEngine系列交換機還只是個開始,接下來華為還將展示智能數據中心更多維度的躍升。
核心能力全上陣,不斷突破產品極致性能
除了無處不在的AI外,華為數據中心全線產品展現出來的另一個姿態是「死磕」性能——核心能力全部上陣,不斷突破各類產品的行業極限,積極應對AI時代正在爆發或即將爆發的分散式存儲、高性能計算(HPC)和AI應用等場景對數據中心資源需求的爆髮式增長。
華為用於數據中心的核心能力首先表現在晶元層面。近期「備胎」轉正的新聞一直伴隨著華為,特別是在晶元層面。此番參觀遍歷華為數據中心產品,才發現原來華為自研晶元已經廣泛應用於數據中心網路、計算、存儲的每一個核心環節。
比如在CloudEngine系列數據中心網路產品中,除了上面提到的昇騰310高性能AI晶元,核心的網路晶元(NP)也是華為自研的Solar系列。又如在華為TaiShan伺服器中,不僅搭載了華為自研的CPU晶元鯤鵬920,還配置了智能網路融合晶元、智能管理晶元、智能SSD控制晶元等自研晶元。再如在華為OceanStor系列存儲中,也有華為自研的SSD控制晶元、BMC管理晶元、智能多協議介面晶元等。此外在異地災備數據中心互聯方案中,同樣用到了昇騰310,以及華為最傳統的強項oDSP光傳輸晶元。
有自研高性能晶元的加持,產品性能的提升立竿見影。邱恆以計算環節為例,指出華為數據中心在採用了新型的處理晶元之後,跟傳統的數據中心相比AI訓練的算力提升了2倍;跟業界頂級水平的公司相比,也能提升2倍的算力水平。如今,集鯤鵬920、昇騰310等眾多晶元於一身的華為的TaiShan伺服器,正在將高效能計算帶入每一個數據中心。
除自主可控、創新靈活的晶元外,華為用於數據中心的核心能力還表現在ICT技術融會貫通後強大的產品設計能力,其中涉及到架構、材料等方方面面。以網路產品CloudEngine 16800為例,其全面升級了硬體交換平台,在正交架構、無背板基礎上突破超高速信號傳輸、高效供電、超強散熱等多項技術難題,使得單槽位可提供業界最高密度48埠400GE線卡(單機提供業界最大的768埠400GE交換容量),交換能力高達業界平均水平的5倍(一台頂5台),很好滿足了AI時代流量倍增的需求。
其中,信號傳輸採用新型亞微米無損材料,使得電信號的傳輸效率提高了30%,確保了高性能板卡的實現;供電採用磁吹滅弧和大勵磁技術實現單個電源模塊獨立雙路輸入的ms級快速切換,大幅節省機房空間,使單位空間的供電效率提升95%;散熱採用新型碳納米導熱墊和VC相變散熱器,使得散熱效率較業界平均提升4倍,整機可靠性提升20%。
總之,無論是微觀的晶元設計,還是宏觀的產品設計,華為都傾其ICT核心能力發揮到極致,為數據中心全線產品帶來了極致性能。如此一來,當產品本身強大的基礎性能遇上AI效率倍增的能力,就會進一步爆發出巨大的能量了。
以客戶需求為中心,多維度實現超低TCO
當然,強勁的AI能力,極致的產品性能,都不一定是企業客戶選擇升級數據中心的必然理由。很多時候,TCO因素在企業的IT投資考量中會佔據更大的比重,特別是在當前的經濟大環境下。但是,科學技術是第一生產力,在面向AI時代的轉型中,企業如果不能抓住以數據高效處理、AI助力決策為特色的智能經濟浪潮,則極有可能會被時代拋棄。
如何平衡?通常情況下,新技術的加入和產品性能的升級通常都意味著客戶擁有成本的增加,但華為智能數據中心展示了強大的TCO控制能力,多維度發力為客戶實現了超低TCO。同邱恆的交流中我們發現,為獲取超低TCO,華為數據中心解決方案考慮的不僅是單個設備怎麼樣,而且要思謀如何端到端實現整體最低成本。
邱恆指出,在擁有智能化能力和保障高性能的前提下,數據中心運營者其實第一就是想省電,第二是想省空間,第三是想省運維。對此華為智能數據中心拿出了專門的供電智能、散熱智能和管理智能解決方案,通過AI演算法自適應和架構設計優化(比如上面提到的FusionModule2000智能模塊化數據中心方案),達成超低TCO。
具體的數據表現上,從單一環節產品看,華為智能數據中心各產品都實現超低TCO。比如,整機滿配的CloudEngine 16800一年能省出32萬度電,同時機櫃只佔傳統方案1/5的空間。OceanStor Dorado V3能達到75%的OPEX節省和5:1的數據縮減率,同時無損性能。而如果採用集電源、散熱及管理於一體的FusionModule2000智能模塊化數據中心方案,則能在100kW數據中心、負載率50%的典型場景中一年省下13萬度電!
總之,單品+系統級的極致節省,是華為智能數據中心能夠獲得超低TCO的法寶。當然必須意識到,以AI為首的智能技術的引入,不僅僅能提升數據中心各環節的業務效率,本身也是降低端到端TCO的關鍵,十分值得注意。
綜上,筆者此行參觀體驗的最大的感受是,華為數據中心的每個產品都在努力做到智能、極致性能和超低TCO,同時產品與產品之間還有協同,以達成端到端的智能、極致性能和超低TCO。如此很明顯,華為數據中心的智能化水平,不是每一個單點設備提升的匯總相加,還有各部分之間的乘法效應。這大概就是華為智能數據中心能夠一騎絕塵的原因吧!


※助力文化產業升級 極客網「文化產業新星計劃」盛大開啟
※華為斷供事件警示:名為開放的Android實際仍被谷歌鐵腕控制
TAG:極客網 |