clickhouse（十四、分布式DDL阻塞及同步阻塞问题）

news2025/4/27 3:30:40

文章目录

一、分布式ddl 阻塞、超时
- 现象
- 验证方法
- 解决方案
二、副本同步阻塞
- 现象
- 验证
- 解决方案

一、分布式ddl 阻塞、超时

现象

在clickhouse 集群的操作中，如果同时执行一些重量级变更语句，往往会引起阻塞。一般是由于节点堆积过多耗时的ddl。然后抛出如下异常

ru.yandex.clickhouse.except.ClickHouseException: ClickHouse exception, code: 159, host: 127.0.0.1, port: 8123; Code: 159, e.displayText() = 
DB::Exception: Watching task /clickhouse/task_queue/ddl/query-0000000318 is executing longer than distributed_ddl_task_timeout (=180) seconds.

在这里插入图片描述

验证方法

1.查询zookeeper的队列数，节点完成情况。

2.查询mutations表，改更较重操作一般会在这个表记录。

select FQDN() as node,
    database,
    table,
    mutation_id,
    create_time,
    command,
    is_done,
    parts_to_do
FROM clusterAllReplicas('default_cluster', system.mutations)
WHERE is_done = 0;

解决方案

先看能不能是kill MUTATION ，确定一下是不是所有节点里都KILL了，如果所有节点都确定KILL了这个队列还堵在那就只能删ZK。

KILL MUTATION on cluster default_cluster  WHERE database = 'default' AND table = 'table';

二、副本同步阻塞

现象

写入副本表后，查询数据量不一致或是很长时间才能一致。例如原表8968w，写入sql都已经执行完成，查询只有6629w。集群没有阻塞时会直接查询到全量数据。

CREATE TABLE tmp.dwm_we_search_query_ad_data_v5_copy_20230815_local ( 
 `f000_date` Nullable(Date),
 `row_key` Int64,
 `day_` Nullable(String),
 `hour_` Nullable(String),
 `position_id` String,
 `query` String,
 `aid` Int64,
 `advertiser_id` String,
 `query_classify_res` Nullable(Int64),
 `imp_fail_cnt` Nullable(Int64),
 `imp_pv` Nullable(Int64)
 ) 
ENGINE = ReplicatedReplacingMergeTree('/clickhouse/default_cluster/tables/{shard}/tmp/dwm_we_search_query_ad_data_v5_copy_20230815_local', '{replica}') 
PARTITION BY ds_ 
ORDER BY (ds_, position_id,query,aid,advertiser_id,row_key) 
SETTINGS index_granularity = 8192

在这里插入图片描述

验证

查询 system.replication_queue 表的数量，如果记录很多，说明正在同步的任务多，数据达到一致的延迟大。

-- 查询同步队列数
SELECT count() FROM system.replication_queue;
-- 查询同步表详情
SELECT * FROM system.replication_queue LIMIT 1 FORMAT Vertical;

解决方案

首先确认同步队列中的表是否正常业务需要的，集群的io是否正常。如果确实有大量的写入业务，就需要调整副本并行的线程大小replicated_max_parallel_fetches_for_host，如果发现大量没用/测试的表在同步，可删除，这也是快速解决问题的方案。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/913457.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

clickhouse（十四、分布式DDL阻塞及同步阻塞问题）

文章目录

一、分布式ddl 阻塞、超时

现象

验证方法

解决方案

二、副本同步阻塞

现象

验证

解决方案

相关文章

第9章：聚类

vue插入重复的html内容

非常好用的Python单行代码详解

docker之Consul环境的部署

神仙般的css动画参考网址，使用animate.css

4、Spring_IOC注解开发

第 6 章递归(2)(迷宫问题)

MySQL数据库：内置函数

畜牧兽医虚拟仿真｜病禽解剖VR模拟操作演练系统

基于MATLAB开发AUTOSAR软件应用层Code mapping专题-part 4 Data store标签页介绍

【计算机网络篇】TCP协议

Linux系统使用service设置程序自启动

基于Vue3.0的优秀低代码项目

基于Singularity 安装 AmpliconSuite-pipeline

如何截掉图片中的一部分？

分布式核心知识以及常见微服务框架

C语言刷题训练DAY.10

Stream流报错Duplicate key

LLM赋能产业数智化业务系统升级的思考

【日常积累】Cookie和Session的区别