當前位置:
首頁 > 最新 > 數據中心網路運維可視化新技術漫談

數據中心網路運維可視化新技術漫談

關鍵訊息,D1時間送達!

最近,網路可視化還真出現不少新技術,頗為引人注目,也許是未來網路運維的技術演進方向。

網路運維一直倡導要可視化,並且在實踐中不斷優化,怎耐可視化的技術寥寥無幾,網路技術經過了五十年的演進變化,可視化依然要依託SNMP、鏡像這些老技術。SNMP能監控到網路的運行信息實在有限,從外部應用發起的請求獲取網路狀態信息的SNMP協議,無法實時反映網路的狀態。比如:時延、轉發路徑、緩存和丟包,這些都無法通過SNMP獲知,網路對運維的人員來講,就是一個黑盒子,傳統的監控手段無法看透黑盒子。所以,長期以來網路運維的可視化算不上真正的可視化,那些通過大屏將埠流量、設備CPU、Memory等運行狀態顯示出來只不過是可視化的一部分,網路真實的運行狀態還未能顯現出來。最近,網路可視化還真出現不少新技術,頗為引人注目,也許是未來網路運維的技術演進方向,本文接下來就詳細講講。

Sflow(RFC3176)

Sflow其實算不上新技術,這幾年幾乎已經所有的網路設備都能支持。Sflow實現了網路流量的採樣和推送,通過Sflow採集最原始的數據信息,以IP報文格式的形式發往伺服器,由專門的分析工具解析,然後根據這些採集的數據進行統計分析。Sflow是採樣方式收集數據,採樣比越高獲取的數據越真實,但採樣比越高,設備CPU壓力就越大。Sflow採樣報文是經過網路設備CPU收集,然後再發向伺服器的,採集的數據太多,會對網路設備CPU形成攻擊,可能影響設備的正常協議處理,影響業務。所以,要謹慎使用Sflow,即便使用也要根據設備流量大小,確認好採樣比。Sflow使用的局限性讓人想到用硬體實現數據採集,比如FPGA、Netstream硬體設備,這樣採集數據性能雖會有很大提升,但運維的投入成本(購入支持FPGA的板卡或Netstream硬體設備)會上去。另一方面,網路設備的CPU、Memory、網路擁塞和網路事件的日誌信息也無法通過Sflow實時傳遞出來。所以,Sflow技術一直不溫不火,並未得到絕大多數人的認可,使用時還要配合著SNMP來用,一個網路中要部署多個監控系統,可視化看到的都是部分網路,並非全部。

gRPC(Google Remote Procedure Calls,谷歌遠程過程調用)

網路運維在可視化上的窘態引起了互聯網技術人員的注意,谷歌發布了一個開源的RPC框架,RPC定義了客戶端和服務端進行通信的數據結構,服務端提供的服務等,然後編譯生成相應的代碼供客戶端和服務端使用,gRPC是RPC框架正式的實現版本,在2015年初開源的通信框架。gRPC採用了protocol buffer來做數據的序列化與反序列化,用http 2作為數據傳輸協議,性能更優。在網路設備上集成gRPC應用,網路設備就相當於gRPC客戶端角色,監控伺服器相當於gRPC伺服器角色,網路設備主動向監控伺服器發起gRPC通道建立和連接。gRPC可以靈活定義數據格式和數據推送的閾值,從而實現網路設備自身運行狀態的主動推送數據能力,實現周期性推送網路設備豐富的運行狀態,尤其當發生緩存不足導致的丟包時,也會實時通知給監控伺服器,實現網路運行數據的可視化。表1列舉了gRPC與傳統可視化技術的對比:

顯然,gRPC具有響應速度快,實時性高,採集數據全面的優點。

INT(In-band Network Telemetry帶內網路遙測)

INT是由Barefoot、Arista、Dell、Intel和VMWARE共同提出的技術。INT是被設計用來收集和報告網路狀態的一個框架,它通過數據平面實現,不需要控制平面的干涉,Facebook根據這個協議和相應廠商的網路設備設計了一套系統,未來可能會開源。INT的思想是在第一跳的網路設備上收到相應報文,對其進行封裝特定報文,然後扔給下一跳,直到最後一跳網路設備,每一跳網路設備都會收集相應的信息,封在報文裡面。最後,在最後一跳網路設備剝離報文裡面收集到的信息,然後把原始報文扔給伺服器,收集到的網路設備信息扔給監控端處理。這樣即不影響正常業務轉發,又能收集到經過網路設備的信息,在黑盒不知道網路拓撲的情況下還能探測出網路拓撲。初步協議給定的有:交換機ID、入埠信息、入埠時間戳、出埠ID、出埠時間戳、出埠鏈路利用率,緩存信息。INT是一個類似OAM的協議,INT根據沿路設備的信息,就能夠知道報文怎麼走的,哪裡有性能瓶頸,解決了網路轉發路徑和轉發時延不可見的問題。要注意的是:「INT推薦在數據面處理,不推薦控制面處理以體現真實情況。」利用INT技術能很快定位網路丟包和延遲問題,通過軟體打標記是無法實現INT的高效處理的,必須需要網路設備硬體支持。

網路運維的可視化還有很長的路要走,sflow、gRPC、INT等都是可視化具體實現技術,尤其gRPC和INT技術還沒有得到廣泛使用,現有數據中心的絕大部分設備還無法支持這種新技術,網路設備的更新換代需要數年時間,所以這些新技術只有在新建的數據中心網路中才能有機會出現,能支持INT功能的網路設備必然具有晶元自編程能力,這對網路設備提出了更高要求。除了以上介紹的這三種可視化技術,還有微軟在2015年提出的Pingmesh技術,以及依然是微軟在2015年提出的Everflow技術,還有Netsight(具體採用的Openflow協議)、ATPG、Planck等等,這些都是這兩年出現的可視化技術,雖然沒有gRPC、INT影響力大,但技術也在不斷完善中,未來也不好說哪些技術一定能勝出,哪些技術會直接淘汰,去讓時間證明一切吧。

版權聲明:本文為企業網D1Net原創,轉載需註明出處為:企業網D1Net,如果不註明出處,企業網D1Net將保留追究其法律責任的權利。

(來源:企業網D1Net)

企業網D1net已推出企業應用商店(www.enappstore.com),面向企業級軟體,SaaS等提供商,提供陳列,點評功能,不參與交易和交付。現可免費入駐,入駐後,可獲得在企業網D1net 相應公眾號推薦的機會。歡迎入駐。

Hello,夥伴們

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 數據中心D1net 的精彩文章:

數據中心的進化史
安全對於開放源碼的數據中心堆棧來說是一個特殊的挑戰

TAG:數據中心D1net |