當前位置:
首頁 > 知識 > 分布式系統的那些事兒(五)-容錯與故障

分布式系統的那些事兒(五)-容錯與故障

我們都經歷過巨石應用,單一應用某個功能誘發的故障導致整個站點掛掉,任何人都無法訪問,只能一一排錯再部署上線,這樣造成的影響就是用戶的流失。而分布式應用就沒有這樣的問題,就算某個節點出現故障,那麼主備切換,替換主節點,整個系統還是照樣運行,完全沒有訪問不了的現象。

要使系統達到一定的容錯性,那麼

首先要實現的就是高可用,最簡單的就是進行節點集群化,使用心跳機制讓好的節點替換壞的節點。

其次要保證系統的穩定性,如果運維有事沒事上去重啟一次,這樣也不太好吧(其實很多應用在一開始都是每周重啟一次的)

然後整個系統平台的安全性當然要提高,比如防CSRF攻擊,防IIS攻擊等等,安全性一旦提高系統崩潰的幾率也相應降低。

最後就是系統的可維護性,這個在我看來是最高級別的,一旦系統難以維護,那麼開發人員以及運維人員的工作量是巨大的,甚至會出現有人不想維護而離職不幹,這都是會發生的情況,所以一個系統的可維護性非常考驗架構師的能力。

對於故障的分類有代碼級別的,也有硬體方面的,硬體的故障咱們姑且不說,而代碼方面的故障我們要做的就是日誌分析了,設置好日誌級別,在很多發生業務的地方會產生大量的日誌,這個時候就需要ELK來進行分析了,通過日誌來解決代碼放的bug,也是必要的。

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 BeJavaGod 的精彩文章:

分布式系統的那些事兒(四)-MQ時代的通信
分布式系統的那些事兒(三)-系統與系統之間的調用
有意思的冒泡排序法,我竟然全部都看完了!
分布式系統的那些事兒(二)-線程與進程
薪資18-22K,Java方向,坐標上海

TAG:BeJavaGod |

您可能感興趣

分散式存儲系統的一致性是什麼?
分散式文件系統設計與實現
三哩島核事故:複雜系統的正常事故
分散式系統中常見技術解決的問題是什麼?
IPFS:下一代分散式文件系統
系統性紅斑狼瘡-注意事項
納稅服務系統五配置系統、子系統首頁、登陸與攔截
安卓系統之父出的第一款手機是什麼樣?
髒話,一種神奇的語言系統
基於交換中心的分散式系統數據同步技術
這樣的預碰撞安全系統真的靠譜嗎
DNF:魂鏈是否會受裝等系統的影響?全面分析裝等系統的意義
知識點:一消考試泡沫滅火系統的組成與分類
人體八大系統「之五」泌尿系統疾病的「防與治」!
四柱八字是如同計算機一樣的人事模擬系統,這才是算命的真諦
零基礎了解奇門遁甲符號系統
左耳朵耗子:聊聊分散式系統的認知故障和彈力設計
iOS系統又現新漏洞 一個字元就讓系統循環重啟
羅永浩:TNT的核心不是那塊一萬塊的屏幕 而是革命性的操作系統
系統的認識新風系統