當前位置:
首頁 > 知識 > 漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

第一天

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?


第二天

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?


第三天

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?


ZooKeeper 的數據模型

ZooKeeper 的數據模型是什麼樣子呢?它很像數據結構當中的樹,也很像文件系統的目錄。

漫畫:什麼是 ZooKeeper?

樹是由節點所組成,ZooKeeper 的數據存儲也同樣是基於節點,這種節點叫做 Znode

但是,不同於樹的節點,Znode 的引用方式是路徑引用,類似於文件路徑:


/ 動物 / 倉鼠

/ 植物 / 荷花

這樣的層級結構,讓每一個 Znode 節點擁有唯一的路徑,就像命名空間一樣對不同信息作出清晰的隔離。

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

data:Znode 存儲的數據信息。

ACL:記錄 Znode 的訪問許可權,即哪些人或哪些 IP 可以訪問本節點。

stat:包含 Znode 的各種元數據,比如事務 ID、版本號、時間戳、大小等等。

child:當前節點的子節點引用,類似於二叉樹的左孩子右孩子

這裡需要注意一點,ZooKeeper 是為讀多寫少的場景所設計。Znode 並不是用來存儲大規模業務數據,而是用於存儲少量的狀態和配置信息,每個節點的數據最大不能超過 1MB。

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?


ZooKeeper 的基本操作和事件通知

ZooKeeper 包含了哪些基本操作呢?這裡列舉出比較常用的 API:

create:創建節點

delete:刪除節點

exists:判斷節點是否存在

getData:獲得一個節點的數據

setData:設置一個節點的數據

getChildren:獲取節點下的所有子節點

這其中,exists、getData、getChildren 屬於讀操作。ZooKeeper 客戶端在請求讀操作的時候,可以選擇是否設置 Watch。

Watch 是什麼意思呢?

我們可以理解成是註冊在特定 Znode 上的觸發器。當這個 Znode 發生改變,也就是調用了 create、delete、setData 方法的時候,將會觸發 Znode 上註冊的對應事件,請求 Watch 的客戶端會接收到非同步通知。

具體交互過程如下:

1. 客戶端調用 getData 方法,Watch 參數是 true。服務端接到請求,返回節點數據,並且在對應的哈希表裡插入被 Watch 的 Znode 路徑,以及 Watcher 列表。

漫畫:什麼是 ZooKeeper?

2. 當被 Watch 的 Znode 已刪除,服務端會查找哈希表,找到該 Znode 對應的所有 Watcher,非同步通知客戶端,並且刪除哈希表中對應的 Key-Value。

漫畫:什麼是 ZooKeeper?


ZooKeeper 的一致性

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

ZooKeeper 的集群長成什麼樣呢?就像下圖這樣:

漫畫:什麼是 ZooKeeper?

ZooKeeper Service 集群是一主多從結構。

更新數據時,首先更新到主節點(這裡的節點是指伺服器,不是 Znode),再同步到從節點。

在讀取數據時,直接讀取任意從節點。

為了保證主從節點的數據一致性,ZooKeeper 採用了 ZAB 協議,這種協議非常類似於一致性演算法 Paxos 和 Raft。

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

在學習 ZAB 之前,我們需要首先了解 ZAB 協議所定義的三種節點狀態:

Looking:選舉狀態。

Following:Follower 節點(從節點)所處的狀態。

Leading:Leader 節點(主節點)所處狀態。

我們還需要知道最大 ZXID 的概念:

最大 ZXID 也就是節點本地的最新事務編號,包含 epoch 和計數兩部分。epoch 是紀元的意思,相當於 Raft 演算法選主時候的 term。

假如 ZooKeeper 當前的主節點掛掉了,集群會進行崩潰恢復。ZAB 的崩潰恢復分成三個階段:

1. Leader election

選舉階段,此時集群中的節點處於 Looking 狀態。它們會各自向其他節點發起投票,投票當中包含自己的伺服器 ID 和最新事務 ID(ZXID)。

漫畫:什麼是 ZooKeeper?

接下來,節點會用自身的 ZXID 和從其他節點接收到的 ZXID 做比較,如果發現別人家的 ZXID 比自己大,也就是數據比自己新,那麼就重新發起投票,投票給目前已知最大的 ZXID 所屬節點。

漫畫:什麼是 ZooKeeper?

每次投票後,伺服器都會統計投票數量,判斷是否有某個節點得到半數以上的投票。如果存在這樣的節點,該節點將會成為準 Leader,狀態變為 Leading。其他節點的狀態變為 Following。

漫畫:什麼是 ZooKeeper?

這就相當於,一群武林高手經過激烈的競爭,選出了武林盟主。

2. Discovery

發現階段,用於在從節點中發現最新的 ZXID 和事務日誌。或許有人會問:既然 Leader 被選為主節點,已經是集群里數據最新的了,為什麼還要從節點中尋找最新事務呢?

這是為了防止某些意外情況,比如因網路原因在上一階段產生多個 Leader 的情況。

所以這一階段,Leader 集思廣益,接收所有 Follower 發來各自的最新 epoch 值。Leader 從中選出最大的 epoch,基於此值加 1,生成新的 epoch 分發給各個 Follower。

各個 Follower 收到全新的 epoch 後,返回 ACK 給 Leader,帶上各自最大的 ZXID 和歷史事務日誌。Leader 選出最大的 ZXID,並更新自身歷史日誌。

3. Synchronization

同步階段,把 Leader 剛才收集得到的最新歷史事務日誌,同步給集群中所有的 Follower。只有當半數 Follower 同步成功,這個准 Leader 才能成為正式的 Leader。

自此,故障恢復正式完成。

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

什麼是 Broadcast 呢?簡單來說,就是 Zookeeper 常規情況下更新數據的時候,由 Leader 廣播到所有的 Follower。其過程如下:

1. 客戶端發出寫入數據請求給任意Follower。

2. Follower 把寫入數據請求轉發給 Leader。

3. Leader 採用二階段提交方式,先發送 Propose 廣播給 Follower。

4. Follower 接到 Propose 消息,寫入日誌成功後,返回 ACK 消息給 Leader。

5. Leader 接到半數以上 ACK 消息,返回成功給客戶端,並且廣播 Commit 請求給 Follower。

漫畫:什麼是 ZooKeeper?

ZAB 協議既不是強一致性,也不是弱一致性,而是處於兩者之間的單調一致性。它依靠事務 ID 和版本號,保證了數據的更新和讀取是有序的。


ZooKeeper 的應用

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

1. 分散式鎖

這是雅虎研究員設計 ZooKeeper 的初衷。利用 ZooKeeper 的臨時順序節點,可以輕鬆實現分散式鎖。

2. 服務註冊和發現

利用 Znode 和 Watcher,可以實現分散式服務的註冊和發現。最著名的應用就是阿里的分散式 RPC 框架 Dubbo。

3. 共享配置和狀態信息

Redis 的分散式解決方案 Codis,就利用了 ZooKeeper 來存放數據路由表和 codis-proxy 節點的元信息。同時 codis-config 發起的命令都會通過 ZooKeeper 同步到各個存活的 codis-proxy。

此外,Kafka、HBase、Hadoop 也都依靠 ZooKeeper 同步節點信息,實現高可用。

漫畫:什麼是 ZooKeeper?

漫畫:什麼是 ZooKeeper?

補充:

ZAB 協議相對比較複雜,小灰對此也只是淺層次的理解,有興趣的小夥伴們可以去官方社區進行進一步學習。


本漫畫純屬娛樂,還請大家盡量珍惜當下的工作,切勿模仿小灰的行為哦。

聲明:本文為作者投稿,首發於個人公眾號程序員小灰,版權歸其所有。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 CSDN 的精彩文章:

要「輸血」更要「造血」 華為 Developer Day攜手開發者鎖定未來
一個「垃圾」 App,毀掉 70 萬藝考生的命運?

TAG:CSDN |