Hadoop 中的大数据技术：Zookeeper安装（2）

Hadoop 中的大数据技术：Zookeeper安装（2）

news2026/2/14 15:02:20

目录

下载地址

本地模式安装

1）安装前准备

2）配置修改

3）操作 Zookeeper

配置参数解读

Zookeeper 集群操作

集群规划

解压安装

配置服务器编号

配置 zoo.cfg 文件

集群操作

Zookeeper 集群启动停止脚本

创建脚本

增加脚本执行权限

Zookeeper 集群启动脚本

Zookeeper 集群停止脚本

Zookeeper 选举机制（面试重点）

首次启动选举

非首次启动选举

关键术语解释

下载地址

官网首页：

Apache ZooKeeper

本地模式安装

1）安装前准备

（ 1 ）安装 JDK

Linux环境安装 JDK

https://blog.csdn.net/qq_45115959/article/details/141403400?spm=1001.2014.3001.5502

（ 2 ）拷贝 apache-zookeeper-3.5.7-bin.tar.gz 安装包到 Linux 系统下

（ 3 ）解压到指定目录

[lzl@hadoop12 software]$ tar -zxvf apache-zookeeper-3.5.7-
bin.tar.gz -C /opt/module/

（ 4 ）修改名称

[lzl@hadoop12 module]$ mv apache-zookeeper-3.5.7 -bin/
zookeeper-3.5.7

2）配置修改

（ 1 ）将 /opt/module/zookeeper-3.5.7/conf 这个路径下的 zoo_sample.cfg 修改为 zoo.cfg ；

[lzl@hadoop12 conf]$ mv zoo_sample.cfg zoo.cfg

（ 2 ）打开 zoo.cfg 文件，修改 dataDir 路径：

[lzl@hadoop12 zookeeper-3.5.7]$ vim zoo.cfg

修改如下内容：
dataDir=/opt/module/zookeeper-3.5.7/zkData

（ 3 ）在 /opt/module/zookeeper-3.5.7/ 这个目录上创建 zkData 文件夹

[lzl@hadoop12 zookeeper-3.5.7]$ mkdir zkData

3）操作 Zookeeper

（ 1 ）启动 Zookeeper

[lzl@hadoop12 zookeeper-3.5.7]$ bin/zkServer.sh start

（ 2 ）查看进程是否启动

[lzl@hadoop12 zookeeper-3.5.7]$ jps
4020 Jps
4001 QuorumPeerMain

（ 3 ）查看状态

[lzl@hadoop12 zookeeper-3.5.7]$ bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/module/zookeeper-3.5.7/bin/../conf/zoo.cfg
Mode: standalone

（ 4 ）启动客户端

[lzl@hadoop12 zookeeper-3.5.7]$ bin/zkCli.sh

（ 5 ）退出客户端：

[zk: localhost:2181(CONNECTED) 0] quit

（ 6 ）停止 Zookeeper

[lzl@hadoop12 zookeeper-3.5.7]$ bin/zkServer.sh stop

配置参数解读

Zookeeper 中的配置文件 zoo.cfg 中参数含义解读如下：

1 ） tickTime = 2000 ：通信心跳时间， Zookeeper 服务器与客户端心跳时间，单位毫秒

2 ） initLimit = 10 ： LF 初始通信时限

Leader 和 Follower 初始连接时能容忍的最多心跳数（ tickTime 的数量）

3 ） syncLimit = 5 ： LF 同步通信时限

Leader 和 Follower 之间通信时间如果超过 syncLimit * tickTime ， Leader 认为 Follwer 死

掉，从服务器列表中删除 Follwer 。

4 ） dataDir ：保存 Zookeeper 中的数据

注意：默认的 tmp 目录，容易被 Linux 系统定期删除，所以一般不用默认的 tmp 目录。

5 ） clientPort = 2181 ：客户端连接端口，通常不做修改。

Zookeeper 集群操作

集群规划
- 在 hadoop12、hadoop13 和 hadoop14 三个节点上部署 Zookeeper。
- 思考：如果是 10 台服务器，建议部署奇数台 Zookeeper，如 3 或 5 台，以确保选举机制的有效性。

解压安装

在 hadoop12 解压 Zookeeper 安装包至 /opt/module/ 目录。

[lzl@hadoop12 software]$ tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz -C /opt/module/

修改 apache-zookeeper-3.5.7-bin 目录名为 zookeeper-3.5.7。

[lzl@hadoop12 module]$ mv apache-zookeeper-3.5.7-bin/ zookeeper-3.5.7

配置服务器编号
1. 在 /opt/module/zookeeper-3.5.7/ 创建 zkData 目录。
```
[lzl@hadoop12 zookeeper-3.5.7]$ mkdir zkData
```
1. 在 /opt/module/zookeeper-3.5.7/zkData 目录下创建 myid 文件。
```
[lzl@hadoop12 zkData]$ vi myid
```
- 在文件中添加与 server 对应的编号（注意不要有多余的空白字符）。
```
2
```
1. 拷贝配置好的 Zookeeper 到其他机器上，并在 hadoop13、hadoop14 上修改 myid 文件的内容为 3、4。
```
[lzl@hadoop12 module ]$ xsync zookeeper-3.5.7
```
配置 zoo.cfg 文件
1. 重命名 /opt/module/zookeeper-3.5.7/conf/ 目录下的 zoo_sample.cfg 为 zoo.cfg。
```
[lzl@hadoop12 conf]$ mv zoo_sample.cfg zoo.cfg
```
1. 打开 zoo.cfg 文件并配置数据存储路径及集群信息。
```
[lzl@hadoop12 conf]$ vim zoo.cfg
```
- 修改数据存储路径配置。
```
dataDir=/opt/module/zookeeper-3.5.7/zkData
```
- 增加集群配置。
```
server.2=hadoop12:2888:3888
server.3=hadoop13:2888:3888
server.4=hadoop14:2888:3888
```
1. 同步 zoo.cfg 配置文件至其他节点。
```
[lzl@hadoop12 conf]$ xsync zoo.cfg
```

集群操作

分别启动 Zookeeper。

[lzl@hadoop12 zookeeper-3.5.7]$ bin/zkServer.sh start
[lzl@hadoop13 zookeeper-3.5.7]$ bin/zkServer.sh start
[lzl@hadoop14 zookeeper-3.5.7]$ bin/zkServer.sh start

查看状态。

[lzl@hadoop12 zookeeper-3.5.7]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/module/zookeeper-3.5.7/bin/../conf/zoo.cfg
Mode: follower
[lzl@hadoop13 zookeeper-3.5.7]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/module/zookeeper-3.5.7/bin/../conf/zoo.cfg
Mode: leader
[lzl@hadoop14 zookeeper-3.5.7]# bin/zkServer.sh status
JMX enabled by default
Using config: /opt/module/zookeeper-3.5.7/bin/../conf/zoo.cfg
Mode: follower

Zookeeper 集群启动停止脚本

创建脚本

在 hadoop12 的 /home/lzl/bin 目录下创建脚本。
```
[lzl@hadoop12 bin]$ vim zk.sh
```

编写脚本内容。

#!/bin/bash
case $1 in
"start"){
    for i in hadoop12 hadoop13 hadoop14
    do
        echo "---------- zookeeper $i 启动 ------------"
        ssh $i "/opt/module/zookeeper-3.5.7/bin/zkServer.sh start"
    done
    };;
"stop"){
    for i in hadoop12 hadoop13 hadoop14
    do
        echo "---------- zookeeper $i 停止 ------------"
        ssh $i "/opt/module/zookeeper-3.5.7/bin/zkServer.sh stop"
    done
    };;
"status"){
    for i in hadoop12 hadoop13 hadoop14
    do
        echo "---------- zookeeper $i 状态 ------------"
        ssh $i "/opt/module/zookeeper-3.5.7/bin/zkServer.sh status"
    done
    };;
esac

增加脚本执行权限
```
[lzl@hadoop12 bin]$ chmod u+x zk.sh
```
Zookeeper 集群启动脚本
```
[lzl@hadoop12 module]$ zk.sh start
```
Zookeeper 集群停止脚本
```
[lzl@hadoop12 module]$ zk.sh stop
```

Zookeeper 选举机制（面试重点）

Zookeeper 的选举机制是为了确保集群中始终有一个 Leader 存在，以便进行数据更新和协调工作。下面是 Zookeeper 的选举机制详解，分为首次启动选举和非首次启动选举两种情况。

首次启动选举

服务器1启动：
- 发起一次选举。服务器1投自己一票。此时服务器1票数为1票，由于不足半数以上（3票），选举无法完成，服务器1状态保持为 LOOKING。
服务器2启动：
- 再发起一次选举。服务器1和2分别投自己一票并交换选票信息。
- 此时服务器1发现服务器2的 myid 比自己目前投票推举的（服务器1）大，更改选票为推举服务器2。
- 此时服务器1票数为0票，服务器2票数为2票，没有半数以上结果，选举无法完成，服务器1,2状态保持 LOOKING。
服务器3启动：
- 发起一次选举。此时服务器1和2都会更改选票为服务器3。
- 此次投票结果：服务器1为0票，服务器2为0票，服务器3为3票。
- 此时服务器3的票数已经超过半数，服务器3当选 Leader。服务器1,2更改状态为 FOLLOWING，服务器3更改状态为 LEADING。
服务器4启动：
- 发起一次选举。此时服务器1,2,3已经不是 LOOKING 状态，不会更改选票信息。
- 交换选票信息结果：服务器3为3票，服务器4为1票。
- 此时服务器4服从多数，更改选票信息为服务器3，并更改状态为 FOLLOWING。
服务器5启动：
- 同服务器4一样，成为 FOLLOWER。

非首次启动选举

触发条件：
- 服务器初始化启动。
- 服务器运行期间无法和 Leader 保持连接。
现有 Leader 场景：
- 如果集群中本来就存在一个 Leader，则新加入的服务器会直接和当前 Leader 进行连接，并同步状态，然后成为 FOLLOWER。
无 Leader 场景：
- 假设 Zookeeper 由5台服务器组成，SID 分别为 1、2、3、4、5，ZXID 分别为 8、8、8、7、7，并且此时 SID 为 3 的服务器是 Leader。某一时刻，3 和 5 服务器出现故障，因此开始进行 Leader 选举。
- （EPOCH，ZXID，SID ）
  - SID 为 1、2、4 的机器投票情况：（1，8，1）、（1，8，2）、（1，7，4）
- 选举 Leader 规则：
  - EPOCH 大的直接胜出
  - EPOCH 相同，事务 ID 大的胜出
  - 事务 ID 相同，服务器 ID 大的胜出

关键术语解释

SID (Server ID)：用来唯一标识一台 ZooKeeper 集群中的机器，每台机器不能重复，与 myid 一致。
ZXID (Zxid)：是一个事务 ID，用来标识一次服务器状态的变更。在某一时刻，集群中的每台机器的 ZXID 值不一定完全一致，这和 ZooKeeper 服务器对于客户端“更新请求”的处理逻辑有关。
EPOCH：每个 Leader 任期的代号。没有 Leader 时同一轮投票过程中的逻辑时钟值是相同的。每投完一次票这个数据就会增加。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2061992.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

EmguCV学习笔记 C# 6.1 边缘检测

EmguCV学习笔记 C# 6.1 边缘检测

版权声明：本文为博主原创文章，转载请在显著位置标明本文出处以及作者网名，未经作者允许不得用于商业目的。 EmguCV是一个基于OpenCV的开源免费的跨平台计算机视觉库,它向C#和VB.NET开发者提供了OpenCV库的大部分功能。教程VB.net版本请访问…

阅读更多...

【云原生】MySQL的源码编译

【云原生】MySQL的源码编译

1、实验环境 （1）虚拟机版本：RHEL7.9 （2）主机主机名称IP地址mysql-node1172.25.254.10mysql-node2172.25.254.20 2、实验步骤注意：我们的两台主机都要进行MySQL源码编译，并且操作相同&…

阅读更多...

二手物品交易boot代码

二手物品交易boot代码

TOC springboot548二手物品交易boot代码--论文pf 第1章绪论 1.1 课题背景二十一世纪互联网的出现，改变了几千年以来人们的生活，不仅仅是生活物资的丰富，还有精神层次的丰富。在互联网诞生之前，地域位置往往是人们思想上不可…

阅读更多...

Leaflet+Leaflet-Geoman绘制天地图

Leaflet+Leaflet-Geoman绘制天地图

安装所需依赖 yarn add leaflet geoman-io/leaflet-geoman-free文档地址 https://leafletjs.cn/ https://geoman.io/ <template><div id"map"></div><div class"handle"><button click"drawMap">绘制区块</b…

阅读更多...

什么是生信分析？深入探讨生物信息学的技术、方法与广泛应用

什么是生信分析？深入探讨生物信息学的技术、方法与广泛应用

介绍生物信息学分析，简称生信分析，是一个结合了生物学、计算机科学、信息学和统计学的多学科领域，旨在处理、分析和解释海量的生物数据。随着现代生物技术的发展，尤其是高通量测序（Next-Generation Sequencing, NGS&…

阅读更多...

ArcGIS热点分析 (Getis-Ord Gi*)——七普地级市人口普查数据的热点与冷点分析

ArcGIS热点分析 (Getis-Ord Gi*)——七普地级市人口普查数据的热点与冷点分析

先了解什么是热点分析 ? 热点分析 (Getis-Ord Gi*) 是一种用于空间数据分析的技术，主要用于识别地理空间数据中值的聚集模式，可以帮助我们理解哪些区域存在高值或低值的聚集，这些聚集通常被称为“热点”或“冷点”，Gi* 统计量为…

阅读更多...

LSI-9361阵列卡笔记

LSI-9361阵列卡笔记

背景要将raid0更改为JBOD直通模式注意的点是要先将raid模式调整为JBOD之后重启机器，即可备注：转换过程中硬盘中的数据未丢失。步骤贴图 refer https://zhiliao.h3c.com/questions/dispcont/123250 https://blog.csdn.net/GreapFruit_J/article/…

阅读更多...

Debian12安装jdk8环境

Debian12安装jdk8环境

下载JDK8 下载页面：https://repo.huaweicloud.com:8443/artifactory/java-local/jdk/ 笔者下载的是8u202： #wget https://repo.huaweicloud.com:8443/artifactory/java-local/jdk/8u202-b08/jdk-8u202-linux-x64.tar.gz 解压安装 1、使用命令将压缩包复…

阅读更多...

Golang | Leetcode Golang题解之第354题俄罗斯套娃信封问题

Golang | Leetcode Golang题解之第354题俄罗斯套娃信封问题

题目： 题解： func maxEnvelopes(envelopes [][]int) int {n : len(envelopes)if n 0 {return 0}sort.Slice(envelopes, func(i, j int) bool {a, b : envelopes[i], envelopes[j]return a[0] < b[0] || a[0] b[0] && a[1] > b[1]})f : …

阅读更多...

旅游网站

旅游网站

TOC springboot281旅游网站第1章绪论 1.1 课题背景互联网发展至今，无论是其理论还是技术都已经成熟，而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播，搭配信息管理工具可以很好地为人们提供服务。所以各行业&#xff0…

阅读更多...

【今夕是何年】雅达利发布Atari 7800+游戏主机：配备无线手柄、HDMI接口

【今夕是何年】雅达利发布Atari 7800+游戏主机：配备无线手柄、HDMI接口

雅达利（Atari）发布了Atari 7800游戏主机，目前这款主机在其官方商城接受预定，售价129.99美元。Atari 7800游戏主机，作为Atari 7800系列的革新升级版本，搭载了高效的Rockchip 3128处理器，不仅确保…

阅读更多...

Q*算法深度猜想：从Q-learning优化到智能决策

Q*算法深度猜想：从Q-learning优化到智能决策

Q*算法深度猜想：从Q-learning优化到智能决策引言在强化学习（Reinforcement Learning）中，Q-learning算法作为一种无模型的学习方法，被广泛应用于解决各种决策优化问题。然而，尽管Q-learning在许多场景下…

阅读更多...

基于YOLOv8的船舶目标检测与分割（ONNX模型）

基于YOLOv8的船舶目标检测与分割（ONNX模型）

项目背景需求分析：在海洋监控、港口管理、海事安全等领域，自动化的船只检测与分割技术对于提高效率和安全性至关重要。技术选型：YOLOv8是YOLO系列的一个较新版本，以其速度快、准确率高而著称。使用ONNX（Open Neural …

阅读更多...

深入理解Softmax：从“Hard”到“Soft”的转变

深入理解Softmax：从“Hard”到“Soft”的转变

深入理解Softmax：从“Hard”到“Soft”的转变在机器学习的分类任务中，Softmax 函数是一个极其重要的工具。它不仅将神经网络的输出转化为概率分布，还能有效处理多分类问题。然而，为了更好地理解Softmax，我们可以先将…

阅读更多...

漫画小程序源码全开源商业版

漫画小程序源码全开源商业版

介绍： 漫画小程序源码全开源商业版带漫画资源，带简单安装说明，可以快速发布一个漫画小程序。代码下载

阅读更多...

秋招力扣Hot100刷题总结——链表

秋招力扣Hot100刷题总结——链表

1. 反转链表题目连接题目要求：给你单链表的头节点 head ，请你反转链表，并返回反转后的链表。代码及思路遍历所有节点，将所有节点的next指向前一个节点由于要改变节点的next指向，而链表是单向的，因此需要…

阅读更多...

Spring MVC域对象共享数据

Spring MVC域对象共享数据

在Spring MVC中，域对象（Domain Object）通常指的是与业务逻辑相关的模型对象，它们代表了应用程序中的核心数据结构。例如，在一个电商应用中，Product、User、Order等类可以被视为域对象。这些对象通常与数据库…

阅读更多...

Pod基础使用

Pod基础使用

POD基本操作 1.Pod生命周期在Kubernetes中，Pod的生命周期经历了几个重要的阶段。下面是Pod生命周期的详细介绍： Pending（待处理）: 调度: Pod被创建后，首先进入“Pending”状态。此时，Kubernetes的调度器…

阅读更多...

设计模式24-命令模式

设计模式24-命令模式

设计模式24-命令模式写在前面行为变化模式命令模式的动机定义与结构定义结构 C 代码推导优缺点应用场景总结补充函数对象（Functors）定义具体例子示例：使用函数对象进行自定义排序代码说明输出结果具体应用优缺点应用场景命令模式&#xf…

阅读更多...

查看 CUDA 和 cuDNN 版本

查看 CUDA 和 cuDNN 版本

在安装 onnxruntime-gpu 选择版本时需要查看本机 CUDA 和 cuDNN 版本。查看 CUDA 和 cuDNN 版本 import platform import torchprint("python.version:", platform.python_version()) print("torch.version:", torch.__version__) print("CUDA.vers…

阅读更多...

推荐文章

最新文章