Zookeeper 杂记 -

都将会收录于 Draft

2022-04-08 2022-04-08 约 1610 字预计阅读 4 分钟 - 次阅读

警告

本文最后更新于 2022-04-08，文中内容可能已过时。

zookeeper 是 chubby 的开源实现，使用 zab 协议，paxos 算法的变种。

其从相应的存储中移除。

串行：客户端 Watcher 回调的过程是一个串行同步的过程。
轻量：Watcher 通知非常简单，只会告诉客户端发生了事件，而不会说明事件的具体内容。客户端向服务端注册 Watcher 的时候，并不会把客户端真实的 Watcher 对象实体传递到服务端，仅仅是在客户端请求中使用 boolean 类型属性进行了标记。
最终一致性：异步发送通知，无法保证强一致性。数据同步方式：
1. diff：差异化同步
2. trunc+diff：先回滚，再差异化同步
3. trunc：回滚同步
4. snap：全量同步（快照）

封装 WatchedEvent：将通知状态（SyncConnected）、事件类型（NodeDataChanged）以及节点路径封装成一个 WatchedEvent 对象
查询 Watcher：从 WatchTable 中根据节点路径查找 Watcher
找到：提取并从 WatchTable 和 Watch2Paths 中删除对应 Watcher（从这里可以看出 Watcher 在服务端是一次性的，触发一次就失效了）
调用 process 方法来触发 Watcher：这里 process 主要就是通过 ServerCnxn 对应的 TCP 连接发送 Watcher 事件通知。

客户端 SendThread 线程接收事件通知，交由 EventThread 线程回调

Watcher。

全局递增的事务ID，所有 proposal（提议）都在被提出时加上了 zxid，为 64 位数字：

高 32 位： epoch，用来标识 leader 周期
低 32 位：用来计数，新产生proposal 的时候，会依据数据库的两阶段过程，首先会向其他的 server 发出事务执行请求，如果超过半数的机器都能执行并且能够成功，那么就会开始执行

集群规则为 2N+1 台，N>0，至少 3 台。只要超过半数的节点正常，集群就能正常提供服务。

分布式数据的发布和订阅：

数据发布/订阅：配置中心，动态获取数据，数据量通常较小（如数据库配置信息）
- 数据存储：存储在 zk 上的一个数据节点
- 数据获取：读取数据节点，并注册一个数据变更 watcher
- 数据变更：当变更数据时，zk 会将数据变更通知发到各客户端
负载均衡
命名服务：指通过指定的名字来获取资源或者服务的地址，利用 zk 创建一个全局的路径，这个路径就可以作为一个名字，指向集群中的集群，提供的服务的地址，或者一个远程的对象等等。
分布式协调/通知
集群管理：所有机器约定在父目录下创建临时目录节点，然后监听父目录节点的字节点变化信息，判断是否有机器退出和加入、选举 master
分布式锁：
- 独占锁：所有用户都去创建/distribute_lock 节点
- 控制时序：/distribute_lock 已经预先存在，所有客户端在它下面创建临时顺序编号目录节点，和选 master 一样，编号最小的获得锁，用完删除。
分布式队列
- 同步队列：当一个队列成员都聚齐时，队列才可用。在约定目录下创建临时目录节点
- 异步队列，先进先出：入列有编号，出列按编号。类似分布式锁中控制时序的实现。