保姆级 -- Zookeeper超详解

news2025/1/16 6:37:02
1. Zookeeper 是什么(了解)
Zookeeper 是一个 分布式协调服务 的开源框架, 主要用来解决分布式集群中应用系统的一致性问题, 例如怎样避免同时操作同一数据造成脏读的问题.
ZooKeeper 本质上是 一个分布式的小文件存储系统 . 提供基于类似于文件系统的目录树方式的数据存储, 并且可以对树中的节点进行有效管理. 从而用来维护和监控你存储的数据的状态变化. 通过监控这些数据状态的变化,从而可以达到基于数据的集群管理. 在大数据生态系统里,很多组件的命名都是某种动物,比如 hadoop 就是大象, hive就是蜜蜂, 而 Zookeeper 就是动物管理员.
2. Zookeeper 的数据模型(必会)
ZK 本质上是一个分布式的小文件存储系统.
ZK 表现为一个分层的文件系统目录树结构, 既能存储数据, 而且还能像目录一样有子节点. 每个节点可以存最多 1M 左右的数据.
每个节点称做一个 Znode, 每个 Znode 都可以通过其路径唯一标识.
而且客户端还能给节点添加 watch, 也就是监听器, 可以监听节点的变化, 这个功能常在实际开发中作为监听服务器集群机器上下线操作.
2.1 节点结构
图中的每个节点称为一个 Znode。 每个 Znode 由 3 部分组成:
① stat:此为状态信息, 描述该 Znode 的版本, 权限等信息
② data:与该 Znode 关联的数据
③ children:该 Znode 下的子节点
2.2 节点类型
59 60
Znode 有 2 大类 4 小类, 两大类分别为永久节点和临时节点.
永久节点(Persistent): 客户端和服务器端断开连接后,创建的节点不会消失, 只有在客户端执行删除操作的时候, 他们才能被删除.
临时节点(Ephemeral): 客户端和服务器端断开连接后,创建的节点会被删除. Znode 还有一个序列化的特性, 这个序列号对于此节点的父节点来说是唯一的, 这样便会记录每个子节点创建的先后顺序. 它的格式为“%10d”(10 位数字, 没有数值的数位用 0 补充, 例如“0000000001”),因此节点可以分为 4 小类:
 永久节点(Persistent)
 永久_序列化节点(Persistent_Sequential)
 临时节点(Ephemeral)
 临时_序列化节点(Ephemeral_Sequential)
3. Zookeeper 的 watch 监听机制(高薪常问)
在 ZooKeeper 中还支持一种 watch(监听)机制, 它允许对 ZooKeeper 注册监听, 当监听的对象发生指定的事件的时候, ZooKeeper 就会返回一个通知.
Watcher 分为以下三个过程:客户端向 ZK 服务端注册 Watcher、服务端事件发生触发 Watcher、客户端回调 Watcher 得到触发事件情况. 触发事件种类很多,如:节点创建,节点删除,节点改变,子节点改变等。
Watcher 是一次性的. 一旦被触发将会失效. 如果需要反复进行监听就需要反复进行注册.
3.1 监听器原理
首先要有一个 main()线程
在 main 线程中创建 Zookeeper 客户端, 这时就会创建两个线程, 一个复制网络连接通信(connect), 一个负责监听(listener).
通过 connect 线程将注册的监听事件发送给 zk, 常见的监听有 监听节点数据的变化 get path [watch]
监听节点状态的变化 stat path [watch]
监听子节点增减的变化 ls path [watch]
将注册的监听事件添加到 zk 的注册的监听器列表中
监听到有数据或路径变化, 就会将这个消息发送给 listener 线程.
listener 线程内部调用了 process()方法.此方法是程序员自定义的方法, 里面可以写明监听到事件后做如何的通知操作.
3.2 监听器实际应用
监听器+ZK 临时节点能够很好的监听服务器的上线和下线.
第一步: 先想 zk 集群注册一个监听器, 监听某一个节点路径
第二步: 主要服务器启动, 就去 zk 上指定路径下创建一个临时节点.
第三步: 监听器监听 servers 下面的子节点有没有变化, 一旦有变化, 不管新增(机器上线)还是减少(机器下线)都会马上给对应的人发送通知.
4. Zookeeper 的应用场景(高薪常问)
ZK 提供的服务包括: 统一命名服务, 统一配置管理, 统一集群管理, 集群选主, 服务动态上下线, 分布式锁等.
4.1 统一命名服务
统一命名服务使用的是 ZK 的 node 节点全局唯一的这个特点. 在分布式环境下,经常需要对应用/服务进行统一命名,便于识别。例如:IP 不容易记 住,而域名容易记住。创建一个节点后, 节点的路径就是全局唯一的, 可以作为全局名称使用.
4.2 统一配置管理
统一配置管理, 使用的是 Zookeeper 的 watch 机制
需求: 分布式环境下, 要求所有节点的配置信息是一致的, 比如 Kafka 集群. 对配置文件修改后, 希望能够快速同步到各个节点上.
方案: 可以把所有的配置都放在一个配置中心, 然后各个服务分别去监听配置中心, 一旦发现里面的内容发生变化, 立即获取变化的内容, 然后更新本地配置即可.
实现: 配置管理可交由 Zookeeper 实现
可将配置信息写入 Zookeeper 上的一个 Znode.
各个客户端服务器监听这个 Znode.
一旦 Znode 中的数据被修改, Zookeeper 将通知各个客户端服务器.
4.3 统一集群管理
统一集群管理使用的是 Zookeeper 的 watch 机制
需求: 分布式环境中, 实时掌握每个节点的状态是必要的, 可以根据节点实时状态做出一些调整.
方案: Zookeeper 可以实现实时监控节点状态变化
可将节点信息写入 Zookeeper 上的一个 Znode.
监听这个 Znode 可获取它的实时状态变化.
4.4 集群选主
集群选主使用的是 zookeeper 的临时节点.
需求: 在集群中, 很多情况下是要区分主从节点的, 一般情况下主节点负责数据写入, 从节点负责数据读取, 那么问题来了, 怎么确定哪一个节点是主节点的, 当一个主节点宕机的时候, 其他从节点怎么再来选出一个主节点呢?
实现:使用 Zookeeper 的临时节点可以轻松实现这一需求, 我们把上面描述的这个过程称为集群选主的过程, 首先所有的节点都认为是从节点, 都有机会称为主节点, 然后开始选主, 步骤比较简单
 所有参与选主的主机都去 Zookeeper 上创建同一个临时节点,那么最终一定只有一个客户端请求能够 创建成功。
 成功创建节点的客户端所在的机器就成为了 Master,其他没有 成功创建该节点的客户端,成为从节点
 所 有 的 从 节 点 都 会 在 主 节 点 上 注 册 一 个 子 节 点 变 更 的 Watcher,用于监控当前主节点是否存活,一旦 发现当前的主节点挂了,那 么其他客户端将会重新进行选主。
4.5 分布式锁
分布式锁使用的是 Zookeeper 的临时有序节点
需求: 在分布式系统中, 很容出现多台主机操作同一资源的情况, 比如两台主机同时往一个文件中追加写入文本, 如果不去做任何的控制, 很有可能出现一个写入操作被另一个写入操作覆盖掉的状况.
方案: 此时我们可以来一把锁, 哪个主机获取到了这把锁, 就执行写入, 另一台主机等待; 直到写入操作执行完毕,另一台主机再去获得锁,然后写入.这把锁就称为分布式锁, 也就是说:分布式锁是控制分布式系统之间同步访问共享 资源的一种方式
实现: 使用 Zookeeper 的临时有序节点可以轻松实现这一需求.
1. 所有需要执行操作的主机都去 Zookeeper 上创建一个 临时有序节点 .
2. 然后获取到 Zookeeper 上创建出来的这些节点进行一个 从小到大 的排序.
3. 判断自己创建的节点是不是最小的, 如果是, 自己就获取到了锁; 如果不是,则对最小的节点注册一个监听.
4. 如果自己获取到了锁, 就去执行相应的操作. 当执行完毕之后, 连接断开, 节点消失, 锁就被释放了.
5. 如果自己没有获取到锁, 就等待, 一直监听节点是否消失,锁被释放后, 再重新执行抢夺锁的操作.
5. Zookeeper 集群[高级](高薪常问)
5.1 ZK 集群介绍
Zookeeper 在一个系统中一般会充当一个很重要的角色, 所以一定要保证它的高可用, 这就需要部署 Zookeeper 的集群. Zookeeper 有三种运行模式: 单机模式, 集群模式和伪集群模式.
单机模式: 使用一台主机不是一个 Zookeeper 来对外提供服务, 有单点故障问题, 仅适合于开发、测试环境.
集群模式: 使用多台服务器, 每台上部署一个 Zookeeper 一起对外提供服务, 适 合于生产环境.
伪集群模式: 在服务器不够多的情况下, 也可以考虑在一台服务器上部署多个Zookeeper 来对外提供服务.
5.2 数据一致性处理
ZK 是一个分布式协调开源框架, 用于分布式系统中保证数据一致性问题, 那么 ZK 是如
何保证数据一致性的呢?
5.2.1 集群角色
Leader : 负责投票的发起和决议, 更新系统状态, 是 事务请求(写请求) 的唯一处理者, 一个 ZooKeeper 同一时刻只会有一个 Leader. 对于 create 创建/setData 修改/delete 删除等有写操作的请求, 则需要统一转发给 leader 处理, leader 需要决定编号和执行操作, 这个过程称为一个事务. Follower: 接收客户端请求, 参与选主投票. 处理客户端非事务(读操作)请求,转发事务请求(写请求)给 Leader; Observer: 针对访问量比较大的 zookeeper 集群, 为了增加并发的读请求. 还可新
增观察者角色.
作用: 可以接受客户端请求, 把请求转发给leader, 不参与投票, 只同步 leader的状态 .
5.2.2 Zookeeper 的特性
1)Zookeeper: 一个领导者(Leader), 多个跟随者(Follower)组成的集群.
2)集群中只要有半数以上节点存活, Zookeeper 集群就能正常服务.
3) 全局数据一致 : 每个 Server 保存一份相同的数据副本, Client 无论连接到哪个 Server, 数
据都是一致的.
4)更新请求 顺序性 : 从同一个客户端发起的事务请求,最终会严格按照顺序被应用到zookeeper 中.
5) 数据更新原子性 : 一次数据更新要么成功, 要么失败。
6) 实时性 ,在一定时间范围内,Client 能读到最新数据。
5.2.3 ZAB 协议
Zookeeper 采用 ZAB(Zookeeper Atomic Broadcast)协议来保证 分布式数据一 致性 。
ZAB 并不是一种通用的分布式一致性算法,而是一种专为 Zookeeper 设计的崩溃可恢复的原子消息广播算法。
ZAB 协议包括两种基本模式: 崩溃恢复 模式和 消息广播 模式:
消息广播模式主要用来进行事务请求的处理
崩溃恢复模式主要用来在集群启动过程,或者 Leader 服务器崩溃退出后进行新的Leader 服务器的选举以及数据同步.
5.2.4 ZK 集群写数据流程
Client 向 Zookeeper 的 Server1 上写数据, 发送一个写请求.
如果 Server1 不是 Leader, 那么 Server1 会把接受的请求进一步 转发 给 Leader, 因为 每个 Zookeeper 的 Server 里面有一个是 Leader. 这个 Leader 会将写请求广播 给各个Server, 比如 Server1 和 Server2, 各个 Server 会将该写请求加入待写队列, 并向 Leader 发送成功信息(ack 反馈机制 ).
当 Leader 收到 半数以上 Server 的成功信息, 说明该写操作可以执行. Leader 会向各个Server 发送事务提交 信息, 各个 Server 收到信息后会落实队列里面的写请求, 此时写成功.
Server1 会进一步通知 Client 数据写成功了, 这是就认为整个写操纵成功.
5.3 ZK 集群选举机制
Zookeeper 服务器有四个状态:
looking: 寻找 leader 状态, 当服务器处于该状态时, 它会认为当前集群中没有 leader, 因此需要进入 leader 选举状态.
leading: 领导者状态, 表明当前服务器角色是 leader.
following: 跟随者状态, 表明当前服务器角色是 follower.
observing:观察者状态, 表明当前服务器角色是 observer。
半数机制: 集群中半数以上机器存活, 集群可用, 所以 Zookeeper 适合安装奇数 台服务器 . 集群启动时, 如果当前机器票数超过了总票数一半则为 Leader, Leader 产生后, 投过票的机器就不能再投票了.
Zookeeper虽然在配置文件中没有指定主从节点. 但是, Zookeeper工作时, 是有一个节点 Leader, 其他则为 Follower, Leader 是通过内部的选举机制临时产生的. 配置文件中会指定每台 ZK 的 myid, 而且不能重复, 通常用 1,2,3…区分每台 ZK 的myid.
5.3.1 集群启动器的选举机制
在集群初始化阶段, 当有一台服务器 server1 启动时, 其单独无法进行和完成 leader 选举, 当第二台服务器 server2 启动时, 此时两台机器可以相互通信, 每台机器都试图找到 leader, 于是进入 leader 选举过程.
1. 服务器 1 启动, 服务器 1 状态保持为 looking.
2. 服务器 2 启动, 发起一次选举. 服务器 1 投票给比自己 ID 号大的服务器 2. 服务器 2 投票给自己.
投票结果 : 服务器 1 票数 0 票, 服务器 2 票数 2 票, 没有半数以上结果, 选举无法完成, 服务器 1, 2 状态保持 looking.
3. 服务器 3 启动, 发起一次选举. 此时服务器 1 和 2 都会更改选票为服务器 3, 服务器 3 投票给自己.
投票结果 : 服务器 1 为 0 票, 服务器 2 为 0 票, 服务器 3 为 3 票. 此时服务器 3 的票数已经超过半数,服务器 3 当选 Leader. 服务器 1,2 更改状态为 follower,服务器 3更改状态为 leader;
4. 服务器 4 启动, 发起一次选举. 此时服务器 1,2,3 已经不是 looking 状态, 不会更改选票信息, 服务器 4 投票给自己.
投票结果 :服务器 3 为 3 票,服务器 4 为 1 票。此时服务器 4 服从多数,更改选票信息为服务器 3,并更改状态为 following;
5. 服务器 5 启动,同 4 一样当小弟.
5.3.2 服务器运行时期的 Leader 选举
在 zk 运行期间, leader 与非 leader 服务器各司其职, 即便当有非 leader 服务器宕机或
者新加入, 此时也不会影响leader. 但是一旦leader服务器宕机了, 那么整个集群将会暂停
对外服务, 进入新一轮 leader 选 举, 其过程和启动时期的 Leader 选举过程基本一致.
假设正在运行的有 server1,server2,server3 三台服务器,当前 leader 是 server2,若某
一时刻 leader 挂了, 此时便开始 leader 选举. 选举过程如下:
变更转态, server1 和 server3 变更为 looking 状态.
开始投票, 每台服务器投票给比自己 myid 大的机器, 没有比自己大的就投给自己.
这样server3有2票, server1有1票, server3的票数超过了集群一半, 当选leader,
server1 变更状态 follower.
6. 为什么 zookeeper 集群的数目,一般为奇数个?(高薪常问)
1.容错
由于在增删改操作中需要半数以上服务器通过,来分析以下情况。
2 台服务器,至少 2 台正常运行才行(2 的半数为 1,半数以上最少为 2),正常运行1台服务器都不允许挂掉
3 台服务器,至少 2 台正常运行才行(3 的半数为 1.5,半数以上最少为 2),正常运行可以允许 1 台服务器挂掉
4 台服务器,至少 3 台正常运行才行(4 的半数为 2,半数以上最少为 3),正常运行可以允许 1 台服务器挂掉
5 台服务器,至少 3 台正常运行才行(5 的半数为 2.5,半数以上最少为 3),正常运行可以允许 2 台服务器挂掉
6 台服务器,至少 3 台正常运行才行(6 的半数为 3,半数以上最少为 4),正常运行可以允许 2 台服务器挂掉
通过以上可以发现,3 台服务器和 4 台服务器都最多允许 1 台服务器挂掉,5 台服务器
和 6 台服务器都最多允许 2 台服务器挂掉 但是明显 4 台服务器成本高于 3 台服务器成本,6 台服务器成本高于 5 服务器成本。 这是由于半数以上投票通过决定的。
2.防脑裂
一个 zookeeper 集群中,可以有多个 follower.observer 服务器,但是必需只能有一 个leader 服务器。 如果 leader 服务器挂掉了,剩下的服务器集群会通过半数以上投票选出一个新的leader 服务器。
集群互不通讯情况:
一个集群 3 台服务器,全部运行正常,但是其中 1 台裂开了,和另外 2 台无法通讯。3
台机器里面 2 台正常运行过半票可以选出一个 leader。
一个集群 4 台服务器,全部运行正常,但是其中 2 台裂开了,和另外 2 台无法通讯。4
台机器里面 2 台正常工作没有过半票以上达到 3,无法选出 leader 正常运行。
一个集群 5 台服务器,全部运行正常,但是其中 2 台裂开了,和另外 3 台无法通讯。5
台机器里面 3 台正常运行过半票可以选出一个 leader。
一个集群 6 台服务器,全部运行正常,但是其中 3 台裂开了,和另外 3 台无法通讯。6
台机器里面 3 台正常工作没有过半票以上达到 4,无法选出 leader 正常运行。
通过以上分析可以看出,为什么 zookeeper 集群数量总是单出现,主要原因还是在于第 2 点,防脑裂,对于第 1 点,无非是正本控制,但是不影响集群正常运行。但是出现第 2 种裂的情况,zookeeper 集群就无法正常运行了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1047517.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux】线程同步和互斥

目录 一、线程互斥1.相关概念2.互斥锁(mutex)3.互斥锁的原理4.自定义封装一个锁 二、可重入和线程安全三、死锁死锁概念死锁四个必要条件如何避免死锁 四、线程同步1.条件变量概念条件变量接口基于阻塞队列实现生产者消费者模型 2.信号量概念信号量操作接…

Databend 源码阅读:配置管理

作者:尚卓燃(PsiACE)澳门科技大学在读硕士,Databend 研发工程师实习生 Apache OpenDAL(Incubating) Committer https://github.com/PsiACE 对于 Databend 这样复杂的数据库服务端程序,往往需要支持大量的可配置选项&am…

探索Lighthouse性能分数计算背后的奥秘

本文作者为 360 奇舞团前端开发工程师 作为开发我们都知道,页面性能很重要,一个性能良好的页面可以给用户带来非常好的用户体验。那么,怎么能知道自己写的页面性能是好是坏呢? Lighthouse 是Chrome提供给开发者用来测量页面性能的…

原生js之变量、作用域与内存

原生js之变量、作用域与内存 变量变量类型原始值引用值 复制值传递参数判断类型typeofinstanceof不常用的判断方法constructor构造方法判断Object.getPrototypeOf() 最好用的判断数据类型的方法!toString.call小总结 作用域链垃圾回收标记清理引用计数v8回收v8对GC的优化新生代…

对标8155体验,降本20%以上!这家企业用“量产”证明

智能座舱逐渐成为智能汽车标配。 根据高工智能汽车研究院监测的数据显示,2022年中国市场(不含进出口)乘用车搭载智能数字座舱(大屏语音车联网OTA)前装标配交付795.05万辆,同比增长40.59%,前装搭…

卫星通信链路预算(附程序)

文章目录 简介链路基本概念信息速率与传输速率载波占用带宽载波与噪声功率比 天线参数天线增益波束宽度极化损耗 有效全向辐射功率接收系统品质因数自由空间的传播损耗链路计算程序 简介 卫星通信链路是指从信源开始,通过编码调制及微波上变频、发射机和天线&#…

流量卡不带通话功能,这样的流量卡用着真的安全?

哈喽大家好,很多朋友私信小编,咨询关于纯流量卡的一些问题,可能大家都知道,现在正规的号卡也推出了“纯流量版”,也就是不带通话功能,那么,网上的带手机号的纯流量卡真的用着安全吗?…

企业数字化转型要怎么做?在线报修系统是如何解决维修难题的?

随着科技互联网等新技术的不断发展,企业服务已从信息化迈向数字化阶段。大型企业正迫切地向数字化转型,并需要技术革新和与云的融合,以应对当今市场的挑战。为满足这一需求,广东工程宝科技有限公司推出了一款新一代故障报修产品—…

如何快速搭建一个react项目?如何使用react脚手架快速搭建项目?

如何使用react脚手架快速搭建项目? 一、前提 电脑已经安装了node和npm环境。 react文档中要求Node > 8.10 和 npm > 5.6,查看版本:node -v;npm -v; 二、步骤 1、在合适的文件夹中打开命令行窗口cmd 2、全局安…

前端项目配置 prettier、eslint、lint-stages、husky、commitlint 、style-lint设置代码书写和提交规范

prettier中文网:Options Prettier 中文网 eslint中文网 :ESLint 中文网 github husky : https://github.com/typicode/husky commitlint.js 官网:commitlint - Lint commit messages 、github:GitHub - conventiona…

为什么大力推行国密算法SSL证书

国密算法SSL证书是一种采用我国自主研发的SM2公钥算法体系,支持SM2、SM3、SM4等国产密码算法及国密SSL安全协议的数字证书。相比于普通SSL证书,国密SSL证书具有以下特点: 自主可控:国密SSL证书采用我国自主研发的SM2公钥算法体系&…

十一,从摄像机打印HDR环境贴图

越来越接近真相了。我们很自然地想到,如果把漫游器放在中心打印,是不是就可以打印整个等距柱状投影图了呢?是的,但是,只是要注意的是,立方体贴图的内部和外部尽管一样,但是还是稍微有点模糊&…

Git 学习(2)

Git 学习(2) 版本号 Git 中文件的版本号是 40 位十六进制的数字字符串,采用 SHA-1 加密算法计算获得 这样一方面可避免在合并时的冲突问题 另一方面可以用于文件定位,其中前两位表示文件夹,后 38 位表示文件 指令介…

DDS信号发生器Verilog波形发生器FPGA

名称:DDS信号发生器Verilog波形发生器 软件:Quartus 语言:Verilog 要求: 1.可产生正弦波,锯齿波,三角波,方波4种波形,频率可调 2.具有波形选择、起动、停止功能。 代码下载&…

Flink on yarn 实战和源码分析

版本:1.13.6 目录 Flink on yarn 的3种模式的使用 yarn session 模式源码分析 yarn per-job模式源码分析 application模式源码分析 Flink on yarn 的3种模式的使用 Application Mode # ./bin/flink run-application -t yarn-application ./examples/streaming…

Apollo简易地图制作

在Apollo中模拟障碍物 一、准备工作 在模拟障碍物之前,需要下载并编译Apollo源码,过程可以依据Apollo开放平台文档,其中可能遇到的问题在这里或许可以寻找到答案 二、运行Dreamview 进入容器 cd ~/apollobash docker/scripts/dev_start.s…

515万新作者投身电商事业,抖音电商将投入更多资源扶持作者长期发展

9月27日,2023抖音电商作者峰会在上海举办。上千位抖音电商作者、MCN机构、精选联盟服务商、商家等重要生态伙伴参会,围绕大会主题“向新成长”进行了深入探讨。会上,抖音电商总裁魏雯雯提到,电商作者的事业有更多发展方向。为助力…

输送机使用的常见误区

输送机也称流水线,是指在自动化生产过程中起到运输货物,联通各个生产设备的主要机械设备。但在使用的过程中,很多用户对于输送机的使用存在一定的误区,导致设备故障频出,下面就针对用户已在使用输送机过程中的常见误区…

以太网中的介质共享访问控制机制

什么是CSMA/CD CSMA/CD(Carrier Sense Multiple Access with Collision Detection)是一种用于以太网等共享介质的访问控制机制。它用于协调多个设备共享同一物理介质(例如同一局域网)上的传输权利,以避免碰撞并提供公…

mac安装python2

Python 2 于 2020 年 1 月 1 日宣布结束支持,包括 Homebrew 在内的许多项目和包管理器已经停止支持 Python 2。 如果现在你还要安装 Python 2,需要从 Python 官网下载安装包: 访问 Python 的发布页面。从页面底部找到 Python 2 的最后一个版…