當前位置:
首頁 > 科技 > 從雲時代邁入AI時代,數據中心準備好了嗎?

從雲時代邁入AI時代,數據中心準備好了嗎?

伴隨著雲計算、大數據、IoT物聯網、AI人工智慧、5G等新興技術的快速發展,數據中心正在成為新型IT基礎設施不可或缺的核心,為科技改動世界的步伐不斷提速。

譬如華為GIV(Global Industry Vision,全球產業展望)2025白皮書就曾預測:在2025年,全球年新增數據量將達到驚人的180ZB/年,其中多達95%的語音、視頻等非結構化數據都要依賴AI處理。而企業對AI的採用率,也將從2015年的16%飛速提升至2025年的86%。

可以預見的是,隨著數據中心從雲時代向AI時代的進化,未來還會有越來越多的企業利用AI助力決策,提升客戶體驗,甚至是重塑商業模式與生態系統。

然而在迎接AI時代到來的同時,數據中心和企業用戶也正在面臨前所未有的嚴峻挑戰。

「去年我見了很多的客戶,大家都有一個普遍反饋:過去幾年裡很多企業都在關注云,然而在把雲部署起來之後,卻突然發現從AI算力,到網路帶寬,再到運營維護,都可以說是困難重重。那麼面向AI時代的數據中心網路,究竟應該是什麼樣子?」華為網路產品線總裁胡克文的這一席話,道出了無數企業的心聲。

AI時代數據中心網路面臨的三大挑戰

胡克文指出,從網路視角來看,數據中心在AI時代正面臨三大挑戰。

1、AI算力

在傳統的乙太網時代,千分之一的丟包率還被業界認為是可以接受的。然而隨著AI時代的來臨,受數據中心網路性能的影響,AI算力正在成為AI商用進程的關鍵瓶頸。

「千分之一的丟包率對AI時代意味著什麼?意味著數據中心的AI算力僅僅只能發揮50%!這是通過我們實際測試發現的問題。」胡克文表示,「未來的網路應該做到零丟包,這是強制性的需要。」

2、網路帶寬

2018年,全球年新增數據量是10ZB;然而到了2025年,這個數字將飛速增長到180ZB。這也意味著現有100GE為主的數據中心網路,已經無法支撐未來數據洪水的衝擊。

「做到了零丟包之後,我們又碰到了第二個問題,那就是帶寬。未來五年流量越增長,AI數據越集中,數據中心越大,帶寬需求越多,互訪也越頻繁。」胡克文表示,「這一點從伺服器的升級就可以看出來,從10G到25G再到100G,升級的速度超乎想像,特別是25G到100G在中國的增長,更是遠遠超過了全球其他區域。」

3、運營維護

隨著數據中心伺服器規模的不斷增加,以及計算網路、存儲網路、數據網路的三網融合,數據中心運維人員也迎來了更大的問題。

「計算、存儲、數據的三網融合帶來了更加複雜的問題,這也讓傳統的人工運維手段難以為繼。譬如遇到一個故障的時候,有可能幾天幾夜都無法準確定位。」胡克文表示,「我們做網路的都非常辛苦,為什麼這麼說呢?因為業務部門一般是最先發現問題的,等他找你解決的時候已經是心急火燎、氣急敗壞,留給你的時間非常短,結果你花幾天時間還不一定能解決問題。所以我們做網路的壓力都很大,這就迫切需要新的技術來對網路故障進行排查。」

AI時代數據中心交換機的三大特徵

「為了應對以上這三大挑戰,AI時代的數據中心交換機也應該具備三大特徵,那就是內嵌AI晶元、單槽48×400GE以及向自動駕駛網路演進的能力。」胡克文說道。

1、內嵌AI晶元

內置AI晶元的目的非常明確,那就是能夠百分之百地發揮AI算力,不至於因為網路問題讓AI算力成為瓶頸。

「要做內嵌AI晶元是很難的,非常非常難。但正是因為難才有價值,所以我們堅決在這項技術上進行了突破。」胡克文表示。

2、單槽48×400GE

面對海量數據的增長,為了提供能夠滿足未來應用需求的足夠帶寬,單槽48×400GE已經成為現實。但是這也帶來了諸多的困難與挑戰,譬如超高速信號傳輸對材料和槽位的限制,急劇增加的功耗,以及隨之而來的供電與散熱問題等等。

3、向自動駕駛網路演進的能力

對於數據中心運維人員而言,如果能夠做到秒級故障識別,那麼壓力就能減輕很多。因此作為AI時代的數據中心交換機,就必須要有支撐自動駕駛網路的能力。

胡克文指出,要做到自動駕駛網路,主要有三大要素:第一是要有演算法,來對不同場景下的各種模式進行識別;第二是要有局域本地的數據,能夠讓演算法據此判斷和排查故障;第三是要有本地的推理和執行,這樣在不同的網路場景下,判斷排查的精度和準確度都能做到非常高。

CloudEngine 16800:為AI時代而生

在深入洞察了AI時代數據中心網路面臨的三大挑戰,以及AI時代數據中心交換機的三大特徵之後,華為也有的放矢地推出了相應的解決方案,那就是CloudEngine 16800數據中心交換機。作為業界首款搭載了高性能AI晶元的數據中心交換機,這款產品可以說是為AI時代而生,具有非常鮮明的特點。

1、內嵌AI晶元,100%發揮AI算力

內置高性能AI晶元,擁有獨創iLossLess智能無損交換演算法,可實現流量模型自適應自優化,零丟包,低時延,高吞吐,100%發揮AI算力,數據存儲IOPS(Input/Output Operations Per Second)性能提升30%……這就是CloudEngine 16800能夠讓AI算力充分釋放的原因。

2、單槽位48×400G,5倍流量交換能力

為了提供足夠的網路帶寬,CloudEngine 16800突破了超高速信號傳輸、高效供電、超強散熱等多個高密400GE技術難題,實現了單槽位可提供業界最高密度48埠400GE線卡,單機提供業界最大768埠400GE交換容量,其交換能力是業界平均值的5倍,滿足AI時代流量倍增需求。與此同時在功耗控制方面,其單比特功耗大幅下降了50%,更加綠色節能。

舉例來說,單槽48×400GE使得原本16槽位一般只能做到12槽位,而CloudEngine 16800採用新型亞微米級無損材料將超高速電信號傳輸效率提升30%,從而可以支撐16槽位,並且未來還能支持高密800GE埠平滑演進;

在供電方面,CloudEngine 16800通過SuperPower高效電源技術、磁吹滅弧技術,能夠讓電源輸入切換時間小於6毫秒,並在單個普通電源里做到獨立雙輸入。原本N N備份時20個模塊要加20個模塊,現在只需要加1個模塊,減少了19個模塊的成本;

在散熱方面,新一代風扇技術除了可以大大降低雜訊之外,SuperCooling技術還可通過相變散熱,在普通晶元里內置層中間採用液體與氣體,可將單位面積散熱效率提升4倍,溫度從93.5度降至74.5度,可靠性提升20%。以一台設備滿配單板來算,每年光是電費就可以為企業節省26萬人民幣。

3、使能自動駕駛網路,大幅提升運維效率

基於內置AI晶元,CloudEngine 16800大幅度提升了「網路邊緣」即設備級的智能化水平,讓交換機具備了本地推理和實時快速決策的能力;通過本地智能結合集中的FabricInsight網路分析器,構建分散式AI運維架構,可實現秒級故障識別和分鐘級故障自動定位,使能自動駕駛網路加速到來。同時,該架構還可大幅提升運維繫統的靈活性和可部署性。

「作為華為AI發展戰略以及全棧全場景AI解決方案的重要組成部分,CloudEngine 16800率先將AI技術引入數據中心交換機,將重新定義數據中心網路的代際切換,助力客戶使能和加速AI商用進程,引領數據中心網路從雲時代邁入AI時代。」胡克文表示,「這也是華為『普惠AI』的願景,讓AI不再高高在上,而是讓大家都能用得起。這也將助力更多的企業加速智能化轉型,共同構建萬物互聯的智能世界。」


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 趣味科技 的精彩文章:

想圓科幻船長夢么?這台PC想必能讓你愛不釋手
縱觀IT進化,解構行業數字化轉型

TAG:趣味科技 |