當前位置:
首頁 > 科技 > 微軟將開源其對抗雲網路中斷的秘密武器

微軟將開源其對抗雲網路中斷的秘密武器

作者 | Yevgeniy Sverdlik

譯者 | 姚佳靈

完全複製或模擬雲網路是不可能的,因為很明顯——雲網路的規模太大了。但是微軟攻克了這個難題。

8 月初,微軟的研究人員在微軟研究院 Faculty Smmit 上接受採訪時稱,他們設計了一款開放網路模擬器(Open Network Emulator,簡稱 ONE),可以通過模擬整個 Azure 網路基礎架構,來查找最終導致網路中斷的錯誤,故障和其他惡意軟體。並且!微軟打算開源這項技術。

近一年來,微軟一直利用 ONE 模擬器測試將要被部署到生產中的更改。研究人員說,微軟的網路工程師在使用過程中,從這些更改中找到了數百個 bug,防止了可能出現的重大中斷錯誤。

計算機網路是複雜的玩意兒,因為這樣的複雜性也變得很脆弱:網路規模越大,單個錯誤造成的損害就越大。

回想一下之前各大公有雲服務的故障,給用戶帶來的影響,這樣的一款模擬器如果能穩定投入使用,應該能防止不少問題的發生。

ONE 能在軟體中模擬所有組成網路的硬體和軟體設備,以及它們相互連接的方式。它在 Docker 容器和虛擬機中運行,其構建目的是為了防止變更引起的網路崩潰,在網路變更投入生產之前對它們進行測試和檢查。其工作原理是對整個網路進有效的複製。當網路工程師和運營商進行更改時,它們實際上只是對模擬器進行更改,而不是對底層網路進行更改。

「因為它對底層網路的模仿程度如此驚人,以至於你無法區分,」微軟研究院移動性和網路總監 Victor Bahl 解釋說。如今,當 Azure 網路工程師進行更改時,這些更改首先被應用於 ONE 模擬系統,但是實際上,他們也不知道自己是否對網路做了更改。因為實際上被改變的是模擬器。ONE 能惟妙惟肖地模擬底層的網路,讓人無法區分它們。

「我們認為,這個對每個人都那麼重要的資源,如果只是為我們所用,那不是一件正確的事。因此,我們想讓整個社區都能使用它。」Bahl 在 8 月初的採訪中這樣說道。

Bahl 解釋說,讓公眾得以接觸該技術不僅有助於大型企業提高網路的正常運行時間,而且也給學生和研究人員提供了一種工具,他們可以用 ONE 來模擬超大規模網路,比如微軟、谷歌和亞馬遜已經建立的網路,並在不訪問實際網路的情況下進行創新。

同時,這也將給網路產品供應商們提供一種大規模測試新的控制平面軟體的方法。

微軟還未透露何時開源 ONE。在 GitHub 上搜索 ONE 還沒有任何結果。

去年,在 ONE 投入使用 6 個月之後,微軟首次對外披露了這個系統。在當時,它被稱為「CrystalNet」,寓意是可以顯示網路未來的水晶球。

https://www.microsoft.com/en-us/research/event/faculty-summit-2018/

微軟的研究人員當時就已經暗示在考慮向公眾發布這項技術。他們於今年 6 月的 Sigcomm 大會上確認以 ONE 的名字將該系統進行開源。

微軟的研究人員在提交給 Sigcomm 的 ONE 的描述中提到:「我們的網路是龐大的、異構的、複雜的,並且一直在變動。在這樣的環境中,那些由設備故障觸發的小問題、錯誤的設備軟體、配置錯誤、未經證實的管理工具和無法避免的人為錯誤都會很快引發大型中斷。因此,在生產環境中部署更改之前對每個更改的影響能力進行驗證,這對維護和提高我們網路的可靠性是至關重要的。」

根據 Sigcomm 的論文所述,到目前為止,Azure 網路工程師已經使用 ONE 超過了一年的時間。他們已經「在 ONE 模擬器上花了數百萬小時,並且在變更中找到了數百個錯誤,防止了可能出現的重大中斷。」

2018 年微軟 Azure 雲計算服務的收入強勢增長了 89%,在 Gartner 2018 年的雲基礎設施魔力象限中佔據領導者地位,緊跟 AWS 排第二,並且與 AWS 的差距在縮小。

隨著各家公司對雲服務的依賴日益增加,確保這些雲服務不宕機比以往更重要。但是,無論系統設計地多好,運行它們的工程師有多聰明機警,人類總是偶爾會犯錯。而在超大規模網路更改的過程中出現的細微錯誤會導致大型中斷。在超大規模網路中,像這樣的中斷會影響數百萬人,Bahl 說:「我可不希望成為這種災難的源頭。」

如果在模擬系統中,更改沒有造成任何錯誤,就會自動傳播到生產網路。

英文原文

https://www.datacenterknowledge.com/microsoft/microsoft-open-source-its-secret-weapon-against-cloud-network-outages


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 InfoQ 的精彩文章:

在頂尖架構師眼裡,你遇到的坑都是小問題
都是前端工程師,為什麼他的年薪過百萬?

TAG:InfoQ |