分布式系統的那些事兒(五)-容錯與故障
我們都經歷過巨石應用,單一應用某個功能誘發的故障導致整個站點掛掉,任何人都無法訪問,只能一一排錯再部署上線,這樣造成的影響就是用戶的流失。而分布式應用就沒有這樣的問題,就算某個節點出現故障,那麼主備切換,替換主節點,整個系統還是照樣運行,完全沒有訪問不了的現象。
要使系統達到一定的容錯性,那麼
首先要實現的就是高可用,最簡單的就是進行節點集群化,使用心跳機制讓好的節點替換壞的節點。
其次要保證系統的穩定性,如果運維有事沒事上去重啟一次,這樣也不太好吧(其實很多應用在一開始都是每周重啟一次的)
然後整個系統平台的安全性當然要提高,比如防CSRF攻擊,防IIS攻擊等等,安全性一旦提高系統崩潰的幾率也相應降低。
最後就是系統的可維護性,這個在我看來是最高級別的,一旦系統難以維護,那麼開發人員以及運維人員的工作量是巨大的,甚至會出現有人不想維護而離職不幹,這都是會發生的情況,所以一個系統的可維護性非常考驗架構師的能力。
對於故障的分類有代碼級別的,也有硬體方面的,硬體的故障咱們姑且不說,而代碼方面的故障我們要做的就是日誌分析了,設置好日誌級別,在很多發生業務的地方會產生大量的日誌,這個時候就需要ELK來進行分析了,通過日誌來解決代碼放的bug,也是必要的。
點擊展開全文
※分布式系統的那些事兒(四)-MQ時代的通信
※分布式系統的那些事兒(三)-系統與系統之間的調用
※有意思的冒泡排序法,我竟然全部都看完了!
※分布式系統的那些事兒(二)-線程與進程
※薪資18-22K,Java方向,坐標上海
TAG:BeJavaGod |
※分散式存儲系統的一致性是什麼?
※分散式文件系統設計與實現
※三哩島核事故:複雜系統的正常事故
※分散式系統中常見技術解決的問題是什麼?
※IPFS:下一代分散式文件系統
※系統性紅斑狼瘡-注意事項
※納稅服務系統五配置系統、子系統首頁、登陸與攔截
※安卓系統之父出的第一款手機是什麼樣?
※髒話,一種神奇的語言系統
※基於交換中心的分散式系統數據同步技術
※這樣的預碰撞安全系統真的靠譜嗎
※DNF:魂鏈是否會受裝等系統的影響?全面分析裝等系統的意義
※知識點:一消考試泡沫滅火系統的組成與分類
※人體八大系統「之五」泌尿系統疾病的「防與治」!
※四柱八字是如同計算機一樣的人事模擬系統,這才是算命的真諦
※零基礎了解奇門遁甲符號系統
※左耳朵耗子:聊聊分散式系統的認知故障和彈力設計
※iOS系統又現新漏洞 一個字元就讓系統循環重啟
※羅永浩:TNT的核心不是那塊一萬塊的屏幕 而是革命性的操作系統
※系統的認識新風系統