當前位置:
首頁 > 最新 > IT生產環境中容器編排系統的五個最佳做法

IT生產環境中容器編排系統的五個最佳做法

如果您的企業IT運維組織結構已轉移到Docker等容器技術,您可能會在IT生產環境中接觸到容器編排系統。這些系統包括Apache Mesos、Google Kubernetes、Docker Swarm以及其他一些小眾編排系統。

如果您還沒有關注容器編排技術,那您需要抓緊了,因為它們和容器技術一樣重要。這些產品能夠讓您進行容器啟停調度,並且通過管理容器集群來提升容器使用率。

雖然容器自身是一個非常棒的、分布式且可移植的架構,但是容器編排引擎的重要性在於它能夠滿足企業需求,因為它解決了容器伸縮問題(至少也解決了一部分)。

IT生產環境的一個普遍問題在於它的任務是在真實環境中運行的,並且需要保證其正常運行,至少在一段時間內需要保證99.99%的時間都正常運行。考慮到市場上多數容器技術都較新,對於容器生產環境的要求就更多了。

因此,當IT運維管理人員和產品開發人員將基於容器的應用程序部署到生存環境時,他們應該考慮的最佳做法是什麼?雖然虛擬化技術具有一些現存的運維模式,但IT運維人員很快會發現容器並不是虛擬機。所以事實上並沒有太多現存的IT運維方式可供參考。

考慮到這一點,是時候為IT生產環境的容器編排定義一些核心的最佳做法。以下從大多重要步驟中總結了5點。

1. 建立生產分界線

雖然這是一種常見的傳統做法,但涉及容器的人往往不了解從開發到生產的途徑。在進行容器編排時,需要有一個staging平台,通常是在DevOps進程和工具鏈的末尾。容器需要進行測試、集成、驗證,並準備好進行staging。

當處於staging階段時,它們應該運行在編排系統中,例如Kubernetes,因為這是生產環境配置的準確副本。一旦被證明是穩定的,那麼容器可以從staging階段部署到生產環境。如果新部署出現問題,他們需要隨時回滾。在許多情況下,回滾是一個自動過程。

2. 自動報告在容器編排生產環境中發現的問題

所有事情都可能會出錯,特別是當您考慮容器如何在編排系統中運行時。

鑒於生產和開發現在已經通過DevOps做法相互聯繫,自動報告生產環境容器中發現的問題非常重要。

開發人員需要通過連續報告的問題來了解發生了什麼問題,並且需要對持續測試、集成和部署的修補程序反饋的問題做出反應,以便在短時間內解決問題。

3. 監控,監控,監控

運行容器編排系統(無論是在雲端還是在本地)的好處是它提供了可以監控容器運行狀況的監控和管理工具。這些監控系統具有幾個核心功能和優點,包括:

隨時間收集詳細數據的能力,並使用該數據來發現可能表明容器正在走向失敗的趨勢。這些工具從容器編排系統中提取數據,例如內存使用情況、處理器、網路、I/O等,並確定了表明系統健康的相關性,包括可能需要注意的系統各個方面。

監測系統具備根據它的發現採取自動行動的能力。例如,如果控制台上出現網路錯誤,那麼關閉疑似這些錯誤源的集線器能夠避免網路完全中斷。並且,它允許您通過既定規則在監控軟體中設置策略。

4. 自動備份數據,包括災難恢復和業務連續性

有些管理容器編排生產環境的工作人員,對於數據的位置或者數據應該如何備份、保存以及恢復不是很了解。然而無論是否在公有雲上,這些需求都必須被處理。

容器,包括編排系統中運行的容器,可以在運行應用程序的容器內存儲數據,或者也可以通過基於容器的外部資料庫進行存儲,但通常不是。無論數據存在哪裡,都必須將其複製到次級和獨立存儲系統,並對其進行保護。

雖然很多人相信公有雲已經建立了災難恢復機制,但在大多數情況下,您可能需要恢復一些意外刪除或損壞的數據。雖然公共雲確實具有某些故障恢復功能,但您也需要確保這些更細粒度的數據恢復操作已經具備且可用。而且它們不是自動的 您需要設置好它們並進行測試。

此外,許多備份和恢復機制只是對部分用戶可用的用戶驅動進程。如果你只將控制許可權賦予一小部分運維管理人員,你很快會發現開發人員和其他終端用戶比想像中更需要進行數據恢復。安全機制和控制管理機制允許那些沒有OP許可權的工作人員根據企業的政策和規定恢復他們想要恢復的數據。

5. 規劃生產能力

本文所列所有最佳做法中最重要的是生產能力規劃。同樣地,本地和基於公共雲的系統都需要考慮。

這種做法理論上很簡單,但實際上很難實現。對於容器編排系統所需的基礎設施而言,您需要了解當前的容量需求。這包括伺服器、存儲、網路、資料庫等。此外,您需要規劃短期、中期和長期的需求。

關鍵在於您需要了解容器、容器編排系統以及任何其他支持系統(例如資料庫)之間的相互關係及其對容量的影響。例如,假設您有五個容器編排系統實例,包括2個staging環境和3個生產環境,那麼您需要20個特定方式配置的伺服器。

這些伺服器可以在公共雲中進行配置,也可以使用傳統方法在物理機上進行配置。當然,這些伺服器也有一定需求,包括存儲、網路、安全、監控、電源等。您還需要對這些容量進行建模。

您需要了解目前生產環境中容器的使用情況,以及未來五年的增長情況。 通過生產環境中容器使用情況的增長預測,您應該可以算出其他基礎設施的影響,以及了解其容量問題。這種方式需要被建模,從而增長不會超出預期。

公共雲用戶可以根據他們的需要調整容器容量。然而,這並不能解決所有問題,例如在預算和了解需要使用哪些雲伺服器等方面。更重要的是,您需要考慮將容器編排系統作為雲服務進行提供,因此您對他們的管理可能要少於雲服務提供商。

試錯時間

容器時代IT產品取得成功是基於開放思維和嘗試新流程與技術的能力。儘管試錯方式可能會嚇倒IT生產環境中的許多人,但實際情況是您沒有選擇。

當然,IT生產環境流程不能被誇大,通常每五到十年其流程和工具就會有所變化。IT世界的變化是常事,容器和容器編排的興起要求您再次進行改變。

負責容器編排生產環境的人員需要明白他們正在打開一扇新的大門,當然他們仍可以依靠以前的方式來學習如何操作這些系統。但考慮到DevOps的興起以及開發與運維的邏輯耦合,這是您學習新方式並走向正確方向的好時機。

深入淺出學習etcd

etcd為分布式系統提供可靠、高效的配置管理服務,在Docker、Kubernetes、Mesos等平台中扮演了越來越重要的角色。作為2013年開始的項目,它還很年輕,官方文檔中缺乏實現上全面、系統的介紹,本課程深入淺出地介紹了etcd的實現,並為運維和二次開發提供了系統的指導和建議。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Docker 的精彩文章:

TAG:Docker |

您可能感興趣

BIOS設置選項詳細解釋——系統監視&系統啟動篇
NICE IN打通內衣行業垂直平台,構建垂直領域生態系統
家裝七大生命系統
波場TRX——全球最大的區塊鏈去中心化應用操作系統
EOS中心化最大隱患:容易用社工手段合法入侵系統
淺析檢測中心LIMS系統
分散式存儲系統中DHT演算法改進
Dawn SONG:安全是AI應用最大挑戰 需強健的防禦系統
蘋果iOS 12版本系統最新消息和傳聞匯總,這是最強大的系統
鎚子系統和MIUI哪個體驗感更好?
KaiOS 超越 iOS 成為印度第二大移動操作系統
AI技術在視頻系統中的應用
IAA宇航研究小組——空間系統的跨系統兼容性
美軍裝備愛國者II防空系統
SEELE:全新的區塊鏈生態系統
LINUX系統伺服器的常見攻擊
為垂直領域提供AI晶元全定製解決方案,鯤雲科技欲做物聯網AI生態系統的構建者
器材搭配:WHAT HIFI推薦的「21世紀最佳的三套黑膠音響系統」
單目VINS系統的重定位,全局優化和地圖融合
首個 SteamVR 輸入系統發布,兼容所有主流手柄控制器