9.29学习

9.29学习

news2025/4/17 16:25:14

1.线上问题rebalance

因集群架构变动导致的消费组内重平衡，如果kafka集内节点较多，比如数百个，那重平衡可能会耗时导致数分钟到数小时，此时kafka基本处于不可用状态，对kafka的TPS影响极大

产生的原因

①组成员数量发生变化

②订阅主题数量发生变化

③订阅主题的分区数发生变化

组成员崩溃和组成员主动离开是两个不同的场景。因为在崩溃时成员并不会主动地告知coordinator此事，coordinator有可能需要一个完整的session.timeout周期(心跳周期)才能检测到这种崩溃，这必然会造成consumer的滞后。可以说离开组是主动地发起rebalance；而崩溃则是被动地发起rebalance。

解决方案

加大超时时间 session.timout.ms=6s

加大心跳频率 heartbeat.interval.ms=2s

增长推送间隔 max.poll.interval.ms=t+1 minutes

2.Zookeeper的作用

目前，Kafka 使用 ZooKeeper 存放集群元数据、成员管理、Controller 选举，以及其他一些管理类任务。之后，等 KIP-500 提案完成后，Kafka 将完全不再依赖于 ZooKeeper。

●存放元数据是指主题分区的所有数据都保存在 ZooKeeper 中，其他“人”都要与它保持对齐。

●成员管理是指 Broker 节点的注册、注销以及属性变更等。

●Controller 选举是指选举集群 Controller，包括但不限于主题删除、参数配置等。

一言以蔽之:KIP-500 ，是使用社区自研的基于 Raft 的共识算法，实现 Controller 自选举。

同样是存储元数据，这几年基于Raft算法的etcd认可度越来越高

越来越多的系统开始用它保存关键数据。比如，秒杀系统经常用它保存各节点信息，以便控制消费 MQ 的服务数量。还有些业务系统的配置数据，也会通过 etcd 实时同步给业务系统的各节点，比如，秒杀管理后台会使用 etcd 将秒杀活动的配置数据实时同步给秒杀 API 服务各节点。

3.Replica副本的作用

Kafka 只有 Leader 副本才能对外提供读写服务，响应 Clients 端的请求。Follower 副本只是采用拉(PULL)的方式，被动地同步 Leader 副本中的数据，并且在 Leader 副本所在的 Broker 宕机后，随时准备应聘 Leader 副本。

●自 Kafka 2.4 版本开始，社区可以通过配置参数，允许 Follower 副本有限度地提供读服务。

●之前确保一致性的主要手段是高水位机制，但高水位值无法保证 Leader 连续变更场景下的数据一致性，因此，社区引入了 Leader Epoch 机制，来修复高水位值的弊端。

4.为什么不支持读写分离

●自 Kafka 2.4 之后，Kafka 提供了有限度的读写分离。

●场景不适用。读写分离适用于那种读负载很大，而写操作相对不频繁的场景。

●同步机制。Kafka 采用 PULL 方式实现 Follower 的同步，同时复制延迟较大。

5.如何防止重复消费

●代码层面每次消费需提交offset

●通过Mysql的唯一键约束，结合Redis查看id是否被消费，存Redis可以直接使用set方法

●量大且允许误判的情况下，使用布隆过滤器也可以

6.如何保证数据不会丢失

●生产者生产消息可以通过comfirm配置ack=all解决

●Broker同步过程中leader宕机可以通过配置ISR副本+重试解决

●消费者丢失可以关闭自动提交offset功能，系统处理完成时提交offset

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2178140.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【C++并发入门】摄像头帧率计算和多线程相机读取（上）：并发基础概念和代码实现

【C++并发入门】摄像头帧率计算和多线程相机读取（上）：并发基础概念和代码实现

前言高帧率摄像头往往应用在很多opencv项目中，今天就来通过简单计算摄像头帧率，抛出一个单线程读取摄像头会遇到的问题，同时提出一种解决方案，使用多线程对摄像头进行读取。同时本文介绍了线程入门的基础知识，讲解了…

阅读更多...

2-107 基于matlab的hsv空间双边滤波去雾图像增强算法

2-107 基于matlab的hsv空间双边滤波去雾图像增强算法

基于matlab的hsv空间双边滤波去雾图像增强算法，原始图像经过光照增强后，将RGB转成hsv，进行图像增强处理，使图像更加清晰。程序已调通，可直接运行。下载源程序请点链接： 2-107 基于matlab的hsv空间双边滤…

阅读更多...

“找不到emp.dll,无法继续执行代码”需要怎么解决呢？分享6个解决方法

“找不到emp.dll,无法继续执行代码”需要怎么解决呢？分享6个解决方法

在日常使用电脑玩游戏的过程中，我们可能会遇到一些错误提示，其中最常见的就是“emp.dll丢失”。那么，emp.dll到底是什么？它为什么会丢失？丢失后会对我们的电脑产生什么影响？本文将为您详细解析emp.dll的概念…

阅读更多...

超详细的华为ICT大赛报名流程

超详细的华为ICT大赛报名流程

1、访问华为人才在线官网，点击右上角“登录/注册“，登录华为账号。报名链接： https://e.huawei.com/cn/talent/cert/#/careerCert?navTypeauthNavKey ▲如已有华为Uniportal账号，完成实名认证后方可报名大赛。 ▲如没有华为…

阅读更多...

【有啥问啥】具身智能（Embodied AI）：人工智能的新前沿

【有啥问啥】具身智能（Embodied AI）：人工智能的新前沿

具身智能（Embodied AI）：人工智能的新前沿引言在人工智能（AI）的进程中，具身智能（Embodied AI）正逐渐成为研究与应用的焦点。具身智能不仅关注于机器的计算能力，更强调…

阅读更多...

需求5：增加一个按钮

需求5：增加一个按钮

在之前的几个需求中，我们逐步从修改字段到新增字段，按部就班地完成了相关工作。通过最近的文章，不难看出我目前正在处理前端的“未完成”和“已完成”按钮。借此机会，我决定趁热打铁，重新梳理一下之前关于按钮实现的需…

阅读更多...

4、MapReduce编程实践

4、MapReduce编程实践

目录 1、创建文件2、启动HDFS3、启动eclipse 创建项目并导入jar包file->new->java project导入jar包finish 4、编写Java应用程序5、编译打包应用程序（1）查看直接运行结果（2）打包程序（3）查看 JAR 包是…

阅读更多...

软硬协同方案破解IT瓶颈，龙蜥衍生版KOS助力内蒙古大学成功迁移10+业务软件 | 龙蜥案例

软硬协同方案破解IT瓶颈，龙蜥衍生版KOS助力内蒙古大学成功迁移10+业务软件 | 龙蜥案例

2024 云栖大会上，龙蜥社区发布了《龙蜥操作系统生态用户实践精选 V2》，为面临 CentOS 迁移的广大用户提供成熟实践样板。截至目前，阿里云、浪潮信息、中兴通讯 | 新支点、移动、联通、龙芯、统信软件等超 12 家厂商基于龙蜥操作系统发布商业衍…

阅读更多...

【在Linux世界中追寻伟大的One Piece】命名管道

【在Linux世界中追寻伟大的One Piece】命名管道

目录 1 -> 命名管道 1.1 -> 创建一个命名管道 1.2 -> 匿名管道与命名管道的区别 1.3 -> 命名管道的打开规则 1.4 -> 例子 1 -> 命名管道管道应用的一个限制就是只能在具有共同祖先(具有亲缘关系)的进程间通信。如果我们想在不相关的进程之间交换数据&…

阅读更多...

串行化执行、并行化执行

串行化执行、并行化执行

文章目录 1、串行化执行2、并行化测试（多线程环境）3、任务的执行是异步的，但主程序的继续执行是同步的可以将多个任务编排为并行和串行化执行。也可以处理编排的多个任务的异常，也可以返回兜底数据。 1、串行化执行顺序执行、…

阅读更多...

C++类和对象(下) 初始化列表、static成员、友元、内部类等等

C++类和对象(下) 初始化列表、static成员、友元、内部类等等

1.再探构造函数之前使用构造函数时都是在函数体内初始化成员变量，还有一种构造函数的用法，叫做初始化列表；那么怎么使用呢？ 使用方法用冒号开始(" : ")要写多个就用逗号(" , ")隔开数据成队列每个成员变量后…

阅读更多...

DC00023基于jsp+MySQL新生报到管理系统

DC00023基于jsp+MySQL新生报到管理系统

1、项目功能演示 DC00023基于jsp新生报到管理系统java webMySQL新生管理系统 2、项目功能描述基于jspMySQL新生报到管理系统项目分为学生、辅导员、财务处和系统管理员四个角色。 2.1 学生功能 1、系统登录 2、校园新闻、报到流程、学校简介、在线留言、校园风光、入校须知…

阅读更多...

解决Qt每次修改代码后首次运行崩溃，后几次不崩溃问题

解决Qt每次修改代码后首次运行崩溃，后几次不崩溃问题

在使用unique_ptr声明成员变量后，我习惯性地在初始化构造列表中进行如下构造： 注意看，我将m_menuBtnGroup的父类指定为ui->center_menu_widget，这便是导致崩溃的根本原因，解决办法便是先用this初始化，后…

阅读更多...

pdf页面尺寸裁减

pdf页面尺寸裁减

1、编辑pdf 2、点击裁减页面，并在空白区域双击裁减 3、输入裁减数据：

阅读更多...

calibre-web浏览器标题icon修改

calibre-web浏览器标题icon修改

calibre-web浏览器标题icon修改 Windows安装calibre-web，Python-CSDN博客文章浏览阅读537次，点赞10次，收藏11次。pip install calibreweb报错：error: Microsoft Visual C 14.0 or greater is required. Get it with "Microso…

阅读更多...

Springboot中基于注解实现公共字段自动填充

Springboot中基于注解实现公共字段自动填充

1.使用场景当我们有大量的表需要管理公共字段，并且希望提高开发效率和确保数据一致性时，使用这种自动填充方式是很有必要的。它可以达到一下作用统一管理数据库表中的公共字段：如创建时间、修改时间、创建人ID、修改人ID等，这些…

阅读更多...

视频剪辑软件哪个好？剪辑更高效用这些

视频剪辑软件哪个好？剪辑更高效用这些

众所周知，视频已经成为我们记录生活、表达自我的重要方式。无论是制作旅行Vlog，还是剪辑短片分享故事，优秀的视频剪辑软件是让创意变为现实的利器。那么，如何在众多免费软件中做出明智选择，成为剪辑高手呢&#xf…

阅读更多...

通信工程学习：什么是SISO单入单出

通信工程学习：什么是SISO单入单出

SISO：单入单出 SISO，即单输入单输出（Single-Input Single-Output）系统，也被称为单变量系统。在这种系统中，输入量与输出量各为一个，是控制理论中的一个基本概念。以下是对SISO系统的详细解释&am…

阅读更多...

为什么说函数传递参数最好小于四个

为什么说函数传递参数最好小于四个

有一个说法说是函数传递参数最好不超过四个，原因有一个是参数太多难以维护，另一个重要的原因就是函数传递小于四个参数时候效率会更高，其实这个说法也不全对，在不同的结构下不太一样，也不一定是4 其实那么下面将探究函…

阅读更多...

【RocketMQ】消费失败重试与死信消息

【RocketMQ】消费失败重试与死信消息

🎯 导读：本文档详细介绍了RocketMQ中的重试机制与死信消息处理方法。对于生产者而言，文档提供了如何配置重试次数的具体示例；而对于消费者，它解释了默认情况下消息消费失败后的重试策略，并展示了如何通过代…

阅读更多...

推荐文章

最新文章