Starocks中的一致性检查ConsistencyChecker

news2024/11/13 9:44:32

背景

本文基于Starrocks 3.1.7

结论

SR一致性检查主要是涉及两个部分:
 1. tablet元数据的一致性检查
    每间隔两个两个小时进行检查,检查TabletInvertedIndex LocalMetastore的tablet的一致性,如果tablet既不在当前catalog中也不在回收站里,就直接从当前的TabletInvertedIndex 删除掉
 2. tablet的数据的一致性检查
    从 23点到4点 一直循环进行 一致性检查,如果上一批还没完,则等待上一批的全部检查完才进行下一批的一致性检查,
    以db/table/partition/index/tablet这种层次 按照 lastCheckTime 从远到近排序,选择最多100个tablet进行一致性校验, 选择的tablet条件为:
    1. 不是 olap table以及不是物化视图的的 Normal表不校验
    2. 分区副本数据为1的不校验
    3. 已经校验的tablet不校验

其中涉及到的 变量为 consistency_check_end_time consistency_check_start_time 以及 MAX_JOB_NUM

分析

涉及到的数据链路如下:

getConsistencyChecker().start();
  ||
  \/
 Daemon.runOneCycle
  ||
  \/
 ConsistencyChecker.runAfterCatalogReady

主要的逻辑也是在runAfterCatalogReady中:

  if (System.currentTimeMillis() - lastTabletMetaCheckTime > Config.consistency_tablet_meta_check_interval_ms) {
      checkTabletMetaConsistency();
      lastTabletMetaCheckTime = System.currentTimeMillis();
  }

  // for each round. try chose enough new tablets to check
  // only add new job when it's work time
  if (itsTime() && getJobNum() == 0) {
      List<Long> chosenTabletIds = chooseTablets();
      for (Long tabletId : chosenTabletIds) {
          CheckConsistencyJob job = new CheckConsistencyJob(tabletId);
          addJob(job);
      }
  }

  jobsLock.writeLock().lock();
  try {
      // handle all jobs
      Iterator<Map.Entry<Long, CheckConsistencyJob>> iterator = jobs.entrySet().iterator();
      while (iterator.hasNext()) {
          Map.Entry<Long, CheckConsistencyJob> entry = iterator.next();
          CheckConsistencyJob oneJob = entry.getValue();

          JobState state = oneJob.getState();
          switch (state) {
              case PENDING:
                  if (!oneJob.sendTasks()) {
                      clearJob(oneJob);
                      iterator.remove();
                  }
                  break;
              case RUNNING:
                  int res = oneJob.tryFinishJob();
                  if (res == -1 || res == 1) {
                      // cancelled or finished
                      clearJob(oneJob);
                      iterator.remove();
                  }
                  break;
              default:
                  break;
          }
      } // end while
  } finally {
      jobsLock.writeLock().unlock();
  }
    
  • 进行tabllet元数据的检查,间隔为两个小时,主要是在checkTabletMetaConsistency方法中,该方法的主要就是判断如果tablet既不在当前catalog中也不在回收站
    里,就直接从当前的TabletInvertedIndex 删除掉,逻辑比较清晰。
  • tablet数据的一致性检查
    • 首先是判断是否是处于一致性检查的时间断,consistency_check_start_time(默认是23),consistency_check_end_time(默认是4),也就是每天的23点到4点之间进行一致性检查 且等待上一批次的一致性检查任务都结束了才进行下一轮的检查
    • 再次是选择进行一致性检查的tablet,见方法 chooseTablets ,这块逻辑也很清晰,以db/table/partition/index/tablet这种层次 按照 lastCheckTime 从
      远到近排序,选择最多100个tablet进行一致性校验
    • 组装成 CheckConsistencyJob ,并放入到jobs中
    • 调用sendTasks方法,从jobs中 构造AgentBatchTask,并提交給backend,进行一致性检查
        AgentBatchTask batchTask = new AgentBatchTask();
        ...
        for (Replica replica : tablet.getImmutableReplicas()) {
           // 1. if state is CLONE, do not send task at this time
           if (replica.getState() == ReplicaState.CLONE
                   || replica.getState() == ReplicaState.DECOMMISSION) {
               continue;
           }
      
           if (replica.getDataSize() > maxDataSize) {
               maxDataSize = replica.getDataSize();
           }
      
           CheckConsistencyTask task = new CheckConsistencyTask(null, replica.getBackendId(),
                   tabletMeta.getDbId(),
                   tabletMeta.getTableId(),
                   tabletMeta.getPartitionId(),
                   tabletMeta.getIndexId(),
                   tabletId, checkedSchemaHash,
                   checkedVersion);
      
           // add task to send
           batchTask.addTask(task);
      
           // init checksum as '-1'
           checksumMap.put(replica.getBackendId(), -1L);
      
           ++sentTaskReplicaNum;
        }
        ...
         for (AgentTask task : batchTask.getAllTasks()) {
              AgentTaskQueue.addTask(task);
          }
          AgentTaskExecutor.submit(batchTask);
      
      • 构建AgentBatchTask实例,
      • 对于每一个tablet的replica副本,构建CheckConsistencyTask,并加到AgentBatchTask中去,并在最后添加到AgentTaskQueue队列中,便于进行跟踪
      • 调用AgentTaskExecutor.submit(batchTask)把任务提交到后端的backend中去执行,主要代码在AgentBatchTask.run方法中
           public void run() {
             for (Long backendId : this.backendIdToTasks.keySet()) {
                 BackendService.Client client = null;
                 TNetworkAddress address = null;
                 boolean ok = false;
                 try {
                     ComputeNode computeNode = GlobalStateMgr.getCurrentSystemInfo().getBackend(backendId);
                     if (RunMode.getCurrentRunMode() == RunMode.SHARED_DATA && computeNode == null) {
                         computeNode = GlobalStateMgr.getCurrentSystemInfo().getComputeNode(backendId);
                     }
        
                     if (computeNode == null || !computeNode.isAlive()) {
                         continue;
                     }
        
                     String host = computeNode.getHost();
                     int port = computeNode.getBePort();
        
                     List<AgentTask> tasks = this.backendIdToTasks.get(backendId);
                     // create AgentClient
                     address = new TNetworkAddress(host, port);
                     client = ClientPool.backendPool.borrowObject(address);
                     List<TAgentTaskRequest> agentTaskRequests = new LinkedList<TAgentTaskRequest>();
                     for (AgentTask task : tasks) {
                         agentTaskRequests.add(toAgentTaskRequest(task));
                     }
                     client.submit_tasks(agentTaskRequests);
        
        • 根据每个tablet的backend的host和port,构建Thrift client,并调用toAgentTaskRequest把每个AgentTask转换为thridt格式的请求
        • 调用client.submit_tasks提交到backend执行CHECK_CONSISTENCY任务

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2237381.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ThingsBoard规则链节点:RPC Call Reply节点详解

引言 1. RPC Call Reply 节点简介 2. 节点配置 2.1 基本配置示例 3. 使用场景 3.1 设备控制 3.2 状态查询 3.3 命令执行 4. 实际项目中的应用 4.1 项目背景 4.2 项目需求 4.3 实现步骤 5. 总结 引言 ThingsBoard 是一个开源的物联网平台&#xff0c;提供了设备管理…

动态规划(简单多状态 dp 问题 1.按摩师 2.打家劫舍 II 3. 删除并获得点数 4.粉刷房子 5.买卖股票的最佳时机(全系列))

面试题 17.16. 按摩师213. 打家劫舍 II740. 删除并获得点数LCR 091. 粉刷房子 &#xff08;原&#xff1a;剑指 Offer II 091. 粉刷房子&#xff09;309. 买卖股票的最佳时机含冷冻期714. 买卖股票的最佳时机含手续费123. 买卖股票的最佳时机 III188. 买卖股票的最佳时机 IV 1.…

【VBA实战】用Excel制作排序算法动画续

为什么会产生用excel来制作排序算法动画的念头&#xff0c;参见【VBA实战】用Excel制作排序算法动画一文。这篇文章贴出我所制作的所有排序算法动画效果和源码&#xff0c;供大家参考。 冒泡排序&#xff1a; 插入排序&#xff1a; 选择排序&#xff1a; 快速排序&#xff1a;…

关于Markdown的一点疑问,为什么很多人说markdown比word好用?

markdown和word压根不是一类工具&#xff0c;不存在谁比谁好&#xff0c;只是应用场景不一样。 你写博客、写readme肯定得markdown&#xff0c;但写合同、写简历肯定word更合适。 markdown和word类似邮箱和微信的关系&#xff0c;这两者都可以通信&#xff0c;但微信因为功能…

区块链技术在数字版权管理中的应用

&#x1f493; 博客主页&#xff1a;瑕疵的CSDN主页 &#x1f4dd; Gitee主页&#xff1a;瑕疵的gitee主页 ⏩ 文章专栏&#xff1a;《热点资讯》 区块链技术在数字版权管理中的应用 区块链技术在数字版权管理中的应用 区块链技术在数字版权管理中的应用 引言 区块链技术概述 …

基于Spring Boot的在线装修管理系统的设计与实现,LW+源码+讲解

摘 要 互联网发展至今&#xff0c;无论是其理论还是技术都已经成熟&#xff0c;而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播&#xff0c;搭配信息管理工具可以很好地为人们提供服务。针对信息管理混乱&#xff0c;出错率高&#xff0c;信息安全性差&#…

Ollama 0.4 发布!支持 Llama 3.2 Vision,实现多模态 RAG

“ 阅读本文大概需要5分钟。 前言 最近&#xff0c;Ollama 推出了 0.4 版本&#xff0c;其中最大的亮点就是支持了 Llama 3.2 Vision 模型&#xff0c;该模型具备多模态特性&#xff0c;也就是说能够理解图像并将图像纳入提示词中进行处理&#xff0c;让模型更智能地处理RAG中…

关于若依500验证码问题的求助

关于若依框架中验证码出现500错误的问题&#xff0c;这通常表示服务器内部错误。以下是一些可能的原因及解决方案&#xff1a; 一、配置文件问题 .env.production文件&#xff1a; 确保.env.production文件中的VUE_APP_BASE_API已经修改成服务器上的域名地址&#xff0c;而不…

使用HtmlAgilityPack+PuppeteerSharp+iText7抓取IdentityServer4帮助文档

需要学习IdentityServer4的用法&#xff0c;但是在IdentityServer4帮助文档网站&#xff08;参考文献1&#xff09;中没有找到下载离线文档的地方&#xff0c;准备使用HtmlAgilityPackPuppeteerSharpiText7将网站内容抓取生成离线PDF文档&#xff0c;便于本机学习、查看。   …

fpga开发原理图设计仿真分析

目录 原理图设计方法的流程 仿真分析 method1. 基于向量波形的仿真方法 method2. 基于testbench的仿真方法 在Quartus Prime开发环境下&#xff0c;进行EDA设计的基本流程如图所示。 包括五个主要任务: (1) 建立工程 (2) 设计输入 (3) 编译、综合与适配 (4) 引脚…

Node.js——fs模块-路径补充说明

1、相对路径&#xff1a; ./座右铭.txt 当前目录下的座右铭.txt座右铭.txt 等效于上面的写法../座右铭.txt 当前目录的上一级目录中的座右铭.txt 2、绝对路径 D&#xff1a;/Program File Windows系统下的绝对路径/usr/bin Linux系统…

从0开始搭建一个生产级SpringBoot2.0.X项目(十)SpringBoot 集成RabbitMQ

前言 最近有个想法想整理一个内容比较完整springboot项目初始化Demo。 SpringBoot集成RabbitMQ RabbitMQ中的一些角色&#xff1a; publisher&#xff1a;生产者 consumer&#xff1a;消费者 exchange个&#xff1a;交换机&#xff0c;负责消息路由 queue&#xff1a;队列…

比流计算资源效率最高提升 1000 倍,“增量计算”新模式能否颠覆数据分析?

作者 | 关涛 云器科技CTO 数据平台领域发展 20 年&#xff0c;逐渐成为每个企业的基础设施。作为一个进入“普惠期”的领域&#xff0c;当下的架构已经完美了吗&#xff0c;主要问题和挑战是什么&#xff1f;在 2023 年 AI 跃变式爆发的大背景下&#xff0c;数据平台又该如何演…

MySQL性能测试方案设计

在现代互联网系统中&#xff0c;数据库性能直接影响到整体应用的速度和用户体验。而MySQL作为广泛使用的关系型数据库&#xff0c;随着数据量和并发请求的增长&#xff0c;其性能问题也日益突出。今天我们将深入探讨如何设计一套高效的MySQL性能测试方案&#xff0c;帮助你精准…

彻底解决单片机BootLoader升级程序失败问题

文章目录 1、引言2、MicroBoot&#xff1a;优雅的解决升级问题问题1&#xff1a;bootloader 在跳转到app前没有清理干净存在的痕迹问题2&#xff1a; 需要 APP 传递信息给 Bootloader问题3&#xff1a; APP单独运行没有问题&#xff0c;通过Bootloader跳转到APP运行莫名死机问题…

Oracle OCP认证考试考点详解082系列17

题记&#xff1a; 本系列主要讲解Oracle OCP认证考试考点&#xff08;题目&#xff09;&#xff0c;适用于19C/21C,跟着学OCP考试必过。 81. 第81题&#xff1a; 题目 81.Examine these SOL statements which execute successfully Which two statements are true after exec…

【EFK】Linux集群部署Elasticsearch最新版本8.x

【EFK】Linux集群部署Elasticsearch最新版本8.x 摘要环境准备环境信息系统初始化启动先决条件 下载&安装修改elasticsearch.yml控制台启动Linux服务启动访问验证查看集群信息查看es健康状态查看集群节点查询集群状态 生成service token验证service tokenIK分词器下载 摘要 …

基于python的天气数据采集与可视化分析,对20个城市的天气适宜出行度分析

摘要 本项目旨在基于Python对20个城市的天气数据进行采集与可视化分析&#xff0c;以评估天气的适宜出行度。该分析通过四个主要指标进行量化&#xff0c;这些指标分别是天气状况良好率、空气质量优良率、气温适宜率和安全天气率。通过这些指标&#xff0c;我们能够有效地判断…

外贸管理利器7选,助力高效办公

推荐7款外贸管理软件&#xff0c;包括ZohoBooks、ZohoCRM、富通天下等&#xff0c;各具特色&#xff0c;满足外贸企业不同需求&#xff0c;提高管理效率&#xff0c;助力企业全球化竞争。、 一、Zoho Books Zoho Books是一款外贸财务管理软件&#xff0c;不仅为用户提供了一个…

【JWT】Asp.Net Core中JWT刷新Token解决方案

Asp.Net Core中JWT刷新Token解决方案 前言方案一:当我们操作某个需要token作为请求头的接口时,返回的数据错误error.response.status === 401,说明我们的token已经过期了。方案二:实现用户无感知的刷新token值,我们希望当响应返回的数据是401身份过期时,响应阻拦器自动帮我…