clickhouse使用clickhouse-keeper代替zookeeper

news2024/11/14 0:40:20

目录

异常现象:

1. clickhouse的异常日志     

2. 追踪对应节点的zookeeper日志

使用clickhouse-keeper代替 zookeeper的步骤:

1: 准备 clickhouse-keeper的配置文件

1.1- 设置通信地址,以便对外通信

1.2-  在config.xml中的 zookeeper配置 clickhouse-keeper的地址,keeper的属性, 端口,存放地址等。 

a. 检查端口是否被占用

 b. 设置 clickhouse-keeper的地址,每个节点内容一致

c. 设置clickhouse-keeper的server_id 和clickhouse-server通信端口 9444

2:备份 clickhouse-server的配置文件和数据,以及zookeeper的元数据。(预防升级失败需要回滚)

a.  clickhouse的数据,在config.xml

b.  zookeeper的数据:  在zoo.cfg,数据目录。

3:升级clickhouse。( 包含了clickhouse-server,clickhouse-common, clickhouse-keeper和clickhouse-keeper-converter )

4: 迁移zk的元数据到 clickhouse-keeper  

a- 停止所有的zk 节点。    

b- 建议 启停zk的leader,以便强制 复制一份 一致性的快照。

  c- 运行  clickhouse-keeper-converter , 生成snapshot   

    e- 单独启动clickhouse-keeper

5- 重启 clickhouse    

6- 验证是否clickhouse-keeper是否正常运行   

7- 验证clickhouse是否正常运行

在重启clickhouse时可能遇到认证问题


背景:clickhouse分布式表使用zookeeper作为元数据的存储,客户端每次读写分布式表都会读写zookeeper。 zookeeper是个小型的日志文件系统,在大范围读写时会进入只读模式

clickhouse官方为了解决这个,自己开发了clickhouse-keeper来代替。在21.8版本开始引入,21.12 featrue开发完毕,22.05不依赖系统库。

据官网自己说,目前22.5版的写性能和zookeeper相当,读的性能比zookeeper好。

异常现象:

1. clickhouse的异常日志
    

可以看到说socket和zookeeer连接不上 xxx.xxx.xxx.xxx:2181)

2022.04.01 17:11:01.452465 [ 428517 ] {} <Error> void Coordination::ZooKeeper::sendThread(): Code: 210, e.displayText() = DB::NetException: I/O error: 23: Can't create epoll queue, while writing to socket (20.20.20.34:2181), Stack trace (when copying this message, always include the lines below):
1. DB::Exception::Exception(std::__1::basic_string<char, std::__1::char_traits<char>, std::__1::allocator<char> > const&, int, bool) @ 0x8f9b87a in /usr/lib/debug/.build-id/b1/6d23354750e4d6ff9887c2b4f856f045d62da0.debug
2. DB::WriteBufferFromPocoSocket::nextImpl() @ 0x100764a0 in /usr/lib/debug/.build-id/b1/6d23354750e4d6ff9887c2b4f856f045d62da0.debug

2. 追踪对应节点的zookeeper日志

看到 zookeeper进入了只读模式(r-o mode)

2022-04-01 07:21:14,189 [myid:3] - INFO  [PurgeTask:FileTxnSnapLog@124] - zookeeper.snapshot.trust.empty : false
2022-04-01 07:21:14,191 [myid:3] - INFO  [PurgeTask:DatadirCleanupManager$PurgeTask@145] - Purge task completed.
2022-04-01 17:07:55,961 [myid:3] - INFO  [SessionTracker:ZooKeeperServer@628] - Expiring session 0x31056da7a8a0000, timeout of 30000ms exceeded
2022-04-01 17:07:55,962 [myid:3] - INFO  [RequestThrottler:QuorumZooKeeperServer@163] - Submitting global closeSession request for session 0x31056da7a8a0000
2022-04-01 17:10:23,523 [myid:3] - WARN  [NIOWorkerThread-75:ZooKeeperServer@1411] - Connection request from old client /20.20.20.46:62879; will be dropped if server is in r-o mode
2022-04-01 17:10:23,534 [myid:3] - INFO  [CommitProcessor:3:LeaderSessionTracker@104] - Committing global session 0x31056da7a8a0001
2022-04-01 17:11:01,453 [myid:3] - WARN  [NIOWorkerThread-20:NIOServerCnxn@371] - Unexpected exception
EndOfStreamException: Unable to read additional data from client, it probably closed the socket: address = /20.20.20.46:62879, session = 0x31056da7a8a0001
   at org.apache.zookeeper.server.NIOServerCnxn.handleFailedRead(NIOServerCnxn.java:170)
   at org.apache.zookeeper.server.NIOServerCnxn.doIO(NIOServerCnxn.java:333)
   at org.apache.zookeeper.server.NIOServerCnxnFactory$IOWorkRequest.doWork(NIOServerCnxnFactory.java:508)
   at org.apache.zookeeper.server.WorkerService$ScheduledWorkRequest.run(WorkerService.java:154)
   at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
   at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
   at java.lang.Thread.run(Thread.java:748)

使用clickhouse-keeper代替 zookeeper的步骤:

1- 准备 clickhouse-keeper的配置文件 (config.xml)
2- 备份 clickhouse-server的配置文件和数据,以及zookeeper的元数据
3- 下载 clickhouse-keeper-converter (集成在clickhouse中了)

4- 迁移以前zookeeper元数据到clickhouse-keeper

    a. 停止所有zk节点
    b. 找到zk leader节点
    c. 重启zk leader节点,并再次停止(这一步是为了让leader节点生成一份snapshot)
    d. 运行clickhouse-keeper-converter,生成keeper的snapshot文件
    e. 启动keeper, 使其加载上一步中的snapshot

5- 重启clickhouse-server


1: 准备 clickhouse-keeper的配置文件

keeper在clickhousenode上的配置    config.xml

1.1- 设置通信地址,以便对外通信

<listen_host>0.0.0.0</listen_host>

1.2-  在config.xml中的 zookeeper配置 clickhouse-keeper的地址,keeper的属性, 端口,存放地址等。 

a. 检查端口是否被占用

 假设keeper的端口是9181,与server通信接口为9444

netstat -anp | grep 9181 
netstat -anp | grep 9444

 b. 设置 clickhouse-keeper的地址,每个节点内容一致

<zookeeper>
        <node>
            <host>clickhouse-node01</host>
            <port>9181</port>
        </node>
        <node>
            <host>clickhouse-node02</host>
            <port>9181</port>
        </node>
        <node>
            <host>clickhouse-node03</host>
            <port>9181</port>
        </node>
    </zookeeper>

c. 设置clickhouse-keeper的server_id 和clickhouse-server通信端口 9444

每个节点的server_id要确保唯一,不能和其他节点重复 , keeper_server中的server_id是要和配置raft协议集群时命名的一致。

例如:

在 clickhouse-node01上的配置, <server_id>1</server_id>

在clickhouse_node02上的配置,  <server_id>2</server_id>

<keeper_server>
    <tcp_port>9181</tcp_port>
    <server_id>1</server_id>
    <log_storage_path>/var/lib/clickhouse/coordination/log</log_storage_path>
    <snapshot_storage_path>/var/lib/clickhouse/coordination/snapshots</snapshot_storage_path>

    <coordination_settings>
        <operation_timeout_ms>10000</operation_timeout_ms>
        <session_timeout_ms>30000</session_timeout_ms>
        <raft_logs_level>warning</raft_logs_level>
    </coordination_settings>

    <raft_configuration>
        <server>
            <id>1</id>
            <hostname>clickhouse-node01</hostname>
            <port>9444</port>
        </server>
        <server>
            <id>2</id>
            <hostname>clickhouse-node02</hostname>
            <port>9444</port>
        </server>
        <server>
            <id>3</id>
            <hostname>clickhouse-node03</hostname>
            <port>9444</port>
        </server>
    </raft_configuration>
</keeper_server>

2:备份 clickhouse-server的配置文件和数据,以及zookeeper的元数据。(预防升级失败需要回滚)

a.  clickhouse的数据,在config.xml

<path>/data/1/clickhouse</path>

b.  zookeeper的数据:  在zoo.cfg,数据目录。


     dataDir=/data/1/zookeeper/data    (存储snap数据)
     dataLogDir=/data/1/zookeeper/logs   (存储 transation命令)

3:升级clickhouse。( 包含了clickhouse-server,clickhouse-common, clickhouse-keeper和clickhouse-keeper-converter )

      以先卸载,再安装的升级方法为例

## 卸载
yum remove -y clickhouse-client.noarch clickhouse-common-static.x86_64 clickhouse-common-static-dbg.x86_64 clickhouse-server.noarch

## 下载安装
yum install -y clickhouse-server-22.8.4.7-1.x86_64 clickhouse-client-22.8.4.7-1.x86_64 clickhouse-common-static-22.8.4.7-1.x86_64  clickhouse-common-static-dbg-22.8.4.7-1.x86_64

4: 迁移zk的元数据到 clickhouse-keeper
  

a- 停止所有的zk 节点。    

       在所有的zk节点上 执行

 /usr/local/zookeeper/bin/zkServer.sh stop


b- 建议 启停zk的leader,以便强制 复制一份 一致性的快照。

       查找leader节点, 在所有的节点上执行

/usr/local/zookeeper/bin/zkServer.sh stop


      在leader节点上 启停zookeeper    

/usr/local/zookeeper/bin/zkServer.sh start
/usr/local/zookeeper/bin/zkServer.sh stop


  c- 运行  clickhouse-keeper-converter , 生成snapshot
   

clickhouse-keeper-converter --zookeeper-logs-dir /data/1/zookeeper/logs/version-2 --zookeeper-snapshots-dir /data/1/zookeeper/data/version-2 --output-dir /var/lib/clickhouse/coordination/snapshots

    e- 单独启动clickhouse-keeper

如果server和keeper是安装在同一个节点,这步可以省略

sudo -su clickhouse
clickhouse-keeper --config  /etc/clickhouse-server/config.xml

5- 重启 clickhouse 
   

/usr/bin/clickhouse-server stop
/usr/bin/clickhouse-server start --config=/etc/clickhouse-server/config.xml


6- 验证是否clickhouse-keeper是否正常运行   

 echo ruok | nc localhost 9181; echo

期望看到:imok    


7- 验证clickhouse是否正常运行

连接客户端,创建一张分布式表,查看数据是否能正常操作分布式表(CRUD)。 

 select * from system.clusters;



在重启clickhouse时可能遇到认证问题

1- 异常log

<Error> CertificateReloader: Cannot obtain modification time for certificate file /etc/clickhouse-server/server.crt, skipping update. errno: 2, strerror: No such file or directory

解决方法:在所有的clickhouse-server节点上执行

openssl req -subj "/CN=localhost" -new -newkey rsa:2048 -days 365 -nodes -x509 -keyout /etc/clickhouse-server/server.key -out /etc/clickhouse-server/server.crt

2- 异常log

Error opening Diffie-Hellman parameters file /etc/clickhouse-server/dhparam.pem

解决方法:  在所有的clickhouse-server节点上执行

openssl dhparam -out /etc/clickhouse-server/dhparam.pem 4096

 


clickhouse既然已经支持多zk集群,是否可以让ck同时访问zk集群和keeper集群?

答: 不可以,官网明确说了

 


参考文档:

ClickHouse Keeper | ClickHouse Docs
Configuring ClickHouse Keeper (clickhouse-keeper) | ClickHouse Docs
 
 
 


   
   

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/12627.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

java计算机毕业设计ssm宠物店管理系统element vue前后端分离

项目介绍 宠物店管理平台是使用JAVA的SSM技术,MySQL作为数据库开发,用户通过查看宠物,在线购买商品情况,并可以查看宠物店铺嘻嘻,实现宠物信息化管理。首先对本论文进行分析后,提出平台的相关技术,然后整理系统的需求分析,根据需求进行功能和数据库设计,最后进行系统实现和测试…

Nginx静态资源配置

Nginx配置成系统服务 把Nginx应用服务设置成为系统服务&#xff0c;方便对Nginx服务的启动和停止等相关操作&#xff0c;具体实现步骤: 在/usr/lib/systemd/system目录下添加nginx.service,内容如下: [Unit] # Unit表明该服务的描述&#xff0c;类型描述 Descriptionnginx w…

MQ(二)RabbitMQ快速入门

一、RabbitMQ 概述和安装 RabbitMQ 是基于 Erlang 语言开发的开源消息通信中间件 1. RabbitMQ的结构和概念 RabbitMQ中的几个概念&#xff1a; &#xff08;1&#xff09;channel&#xff1a;操作MQ的工具 &#xff08;2&#xff09;exchange&#xff1a;路由消息到队列中 &…

数据结构知识点补充

(67条消息) c语言怎么return ok,C语言中的 return与exit_哈哈哈可以的博客-CSDN博客 假如把i或i放入到for循环的函数体中&#xff0c;若没有变量或函数来接收其返回值&#xff0c;那么它们的作用效果也是相同的(67条消息) C语言的for循环中i和i的关系_肥嘟嘟的左卫门的博客-CSD…

1226:装箱问题 (贪心)

【题目描述】 一个工厂制造的产品形状都是长方体&#xff0c;它们的高度都是h&#xff0c;长和宽都相等&#xff0c;一共有六个型号&#xff0c;他们的长宽分别为11,22,33,44,55,66。这些产品通常使用一个66h的长方体包裹包装然后邮寄给客户。因为邮费很贵&#xff0c;所以工厂…

爬虫工具-BeautifulSoup

BeautifulSoup&#xff1a; 1. 是一个高效的网页解析库&#xff0c;可以从HTML或者XML文件中提取数据 2. 支持不同的解析器&#xff0c;可以对HTML、XML等进行解析 3. 是一个敏感又方便的网页解析库&#xff0c;处理高效&#xff0c;支持多种解析器 4. 利用它在不编写正则表达式…

Unreal 和 Unity 3D 各有什么特点?如何选择?

一、两个引擎简述 Unreal Engine VS Unity Unity是实时3D互动内容创作和运营平台。包括游戏开发、美术、建筑、汽车设计、影视在内的所有创作者&#xff0c;借助Unity将创意变成现实。Unity平台提供一整套完善的软件解决方案&#xff0c;可用于创作、运营和变现任何实时互动的…

【设计模式】软件设计原则

1. 软件设计原则&#xff1a; 为了提高系统软件的可维护性、可复用性、可扩展性和灵活性 1.1 开闭原则&#xff1a; 对扩展开放&#xff0c;对修改关闭 &#xff08;热插拔&#xff09; 实现方式&#xff1a; 通过定义接口和实现类的方式实现开闭原则&#xff0c;我们再进行…

ASEMI代理艾赛斯IXTY02N50D-TRL车规级MOSFET

编辑-Z 艾赛斯车规级MOS管IXTY02N50D-TRL参数&#xff1a; 型号&#xff1a;IXTY02N50D-TRL 漏极-源极电压&#xff08;VDS&#xff09;&#xff1a;500V 连续漏电流&#xff08;ID&#xff09;&#xff1a;200mA 功耗&#xff08;PD&#xff09;&#xff1a;25W 工作结温…

如何运营推特营销主账号

在推特上做产品推广&#xff0c;Twitter群&#xff08;发&#xff09;推王建议&#xff1a;一般需要两类账号。 主账号&#xff1a;也就是官方号&#xff0c;用来聚集粉丝&#xff0c;日常产品信息、新闻资讯发布的&#xff1b; 批量推广号&#xff1a;也叫小号或者广告号&am…

oracle数据库定义语言—DDL

文章目录1、数据定义语言2 创建表2.2 oracle 数据库中的表2.2.1 常见的数据字典表2.3 用查询创建表2.3.1 示例3 ALTER TABLE 语句3.1 添加一个新的列3.2 修改数据类型3.3 修改默认值3.4 修改列名3.5 删除一个列4、修改名称5、截断表6 、删除表&#xff08;删除表以及表结构&…

《垃圾回收算法手册 自动内存管理的艺术》——引用计数与垃圾回收器的比较(笔记)

文章目录五、引用计数5.1 引用计数算法的优缺点5.2 提升效率5.3 延迟引用计数5.4 合并引用计数5.5 环状引用计数**步骤**5.6受限域引用计数六、垃圾回收器的比较6.1 吞吐量6.2 停顿时间6.3 内存空间6.4 回收器的实现6.5 自适应系统6.6 统一垃圾回收理论6.6.1 垃圾回收的抽象6.6…

神经网络在故障诊断中的应用

人工神经网络是近年来发展迅速&#xff0c;广泛地应用于各个领域&#xff0c;包括航天&#xff0c;自动控制&#xff0c;金融&#xff0c;电子&#xff0c;制造&#xff0c;医药等多个行业&#xff0c;已经有许多成功的先例&#xff0c;并展示了更为广阔的应用前景。基于神经网…

【区块链 | 智能合约】Ethereum源代码(8)- Ethereum服务和以太坊P2P协议发送广播源码分析

在“【区块链 | 智能合约】Ethereum源代码(2)- go-ethereum 客户端入口代码和Node分析”一文中,我们提到Ethereum作为一个service,被Node 注册进去。Node start的时候会启动其注册的所有服务,Ethereum service也是一样。 一、ethereum service的初始化和启动 func geth(c…

【MySQL数据库笔记 - 进阶篇】(二)索引

✍个人博客&#xff1a;https://blog.csdn.net/Newin2020?spm1011.2415.3001.5343 &#x1f4da;专栏地址&#xff1a;暂定 &#x1f4dd;视频地址&#xff1a;黑马程序员 MySQL数据库入门到精通 &#x1f4e3;专栏定位&#xff1a;这个专栏我将会整理 B 站黑马程序员的 MySQL…

day064:File类与I/O流、绝对路径与相对路径、File类的成员方法

目录 一、什么是File类、IO流 1.File类 2.I/O流 3.File类的构造方法 二、绝对路径与相对路径 三、File类的成员方法 1.File类的创建功能 &#xff08;1&#xff09;createNewFile() 创建空的文件 &#xff08;2&#xff09;mkdir() 创建单级文…

CY5.5(Cyanine5.5) azide, 10 mM/DMSO,花菁染料Cy5.5标记叠氮

产品名称&#xff1a;花菁染料Cy5.5标记叠氮 英文名称&#xff1a;CY5.5(Cyanine5.5) azide 该染料具有远红外/近红外发射&#xff0c;可用于NIR活体成像。Cyanine5.5可以取代Cy5.5、Alexa Fluor 680和DyLight 680。 CAS:2183440-52-8 分子式:C43H49ClN6O 分子量:701.36 …

简单工厂、工厂方法、抽象工厂、抽象工厂加简单工厂

简单工厂模式&#xff1a;简单工模式时类的创建模式&#xff0c;又叫做静态工厂方法&#xff08;static Factory Method&#xff09;。简单工厂模式是一个工厂对象决定创建出哪一种产品类的实例。它存在的目的很简单&#xff1a;定义一个创建对象的接口。简单工厂模式的最大优点…

Spring Boot之容器功能

目录 一.Spring 注入组件的注解 二.Configuration 1.代码演示 1.1JavaBean--》Monster.java 1.2配置类 1.3执行代码 2.Configuration 注意事项和细节 三.Import 1.创建两个JavaBean类 2.注入类 3.测试注解的使用 四.Conditional 1.Conditional 介绍 2.应用实例 …

攻防世界 看雪看雪看雪

看雪看雪看雪 题目附件里面给了张图 尝试文件拆解 无果 尝试放入winhex查找信息 无果 尝试放入stegsolve查找信息 无果 题目说雪 刚好有一种snow隐写的方法 但好像跟图片没有什么关系 后来发现存在ntfs流隐写 你解压之后也可以看到 这里我们使用7zip打开附件的压缩包…