Kafka可用与可靠机制

news2024/10/5 21:59:17

文章目录

  • kafka的副本机制
      • ACKS
      • In-Sync Replicas(ISR)
      • Unclean leader election
      • min.insync.replicas
    • acks=1的情况
    • acks=-1的情况
    • acks=-1和min.insync.replicas=2的情况
  • 同步机制
      • 1.follower不对外提供服务的原因
      • 2.幂等性的实现

kafka的副本机制

假如3分区,3副本的topic数据分布:
在这里插入图片描述

ACKS

请求完成之前,生产者要求收到的应答数量,可以控制发送数据是否持久化。

  • acks=0:生产者不会等待broker返回确认信息(生产者只要发送完数据即认为已经写入成功)。在这种情况下,无法保证服务器已收到记录,重试配置也不会生效(因为客户端通常不会知道任何故障)。
  • acks=1:此时只会等待leader将数据写入到本地日志后发送确认,不会等待所有follower的确认。在这种情况下,如果leader在确认记录后立即失败(follower还未同步数据),数据将丢失。
  • acks=all或-1:会等待leader和所有处于ISR集合中的follower发送确认。all和-1相同,唯一区别在于如果需要启用幂等性,则需要设置为all。

In-Sync Replicas(ISR)

ISR简单来讲就是与leader保持同步状态的副本的集合。ISR集合里包含leader副本和0到多个follower副本。

如果一个follower在设定的replica.lag.time.max.ms时间周期内时刻保持与leader的数据更新,则认为该follower是同步的,它将被leader保留在ISR列表中,反之将被从ISR中剔除。
在下列场景中follower将会被移除ISR列表:

  • 与zookeeper的会话断开(zookeeper.session.timeout.ms)
  • follower未在指定时间内向leader发出fetch操作请求(replica.fetch.wait.max.ms,需要小于lag.time)
  • follower的数据更新时间与leader落后太多(replica.lag.time.max.ms)

Unclean leader election

是否允许将新leader切换到数据不同步的follower(故障切换时,unclean.leader.election.enable)
默认false,不允许将leader切换到不同步的follower。

min.insync.replicas

生产者acks设置为all或-1时,指定必须写入成功的最小副本数。如果不能满足最小值,生产者将抛出异常。

acks=1的情况

生产者只会等待leader写入就返回。此时如果leader所在节点发生故障

  • 如果副本均在ISR中,只要ISR中有一个follower与leader同步,可以发生故障切换,不会丢数据
  • 如果副本均在ISR中,但follower均落后一点leader,此时如果发生切换,会丢数据。如果不允许切换,会停止服务。只需恢复broker,就不会丢数据

acks=-1的情况

生产者会等待leader和所有follower写入才返回。此时如果leader所在节点发生故障

  • 如果副本均在ISR中,可以正常切换,不会丢数据
  • 如果在之前有副本因为落后被踢出ISR集合,导致ISR集合中仅剩leader,此时如果发生切换,会丢数据。如果不允许切换,会停止服务。

此时如果副本均在ISR中,但稍微落后leader时,会增加对应的写入延迟。

acks=-1和min.insync.replicas=2的情况

生产者会等待leader和所有follower写入才返回。此时如果leader所在节点发生故障

  • 如果副本集合中仅剩leader时,此时写入会直接抛出异常

同步机制

HighWatermark
标识特定的消息偏移量(offset)。

  • 消费者只能消费到HW所在的位置
  • 取分区ISR集合中最小的LEO为HW

Log End Offset
标识当前日志文件中下一条待写入的消息偏移量(offset)。

  • 每个分区副本都各自有LEO,Leader和follower各自负责更新自己的LEO

在这里插入图片描述

1.刚开始,此时HW=2
leader和follower的LEO=2
2.生产者写入消息到leader,此时HW=2
leadeLEO=4,follower0和1 LEO=2
3.部分数据同步之后,HW=3
leader LEO=4,follower0 LEO=3,follower1 LEO=3
4.完全同步之后,HW=4
leader LEO=4,follower0 LEO=4,follower1 LEO=4

1.follower不对外提供服务的原因

由于副本同步不是完全同步的,ISR集合也随时在变化。

  • 可能出现follower还没有从leader处拉取到最新消息,此时如果follower对外提供服务,客户端会看不到最新写入的消息。
  • 也可能出现多个follower的数据不同步,此时如果多次消费看到的数据会产生不一致性。

2.幂等性的实现

引入PID(ProducerID)和SequenceNumber来避免消息重复发送
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1507388.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux/Windows下部署OpenCV环境(Java/SpringBoot/IDEA)

环境 本文基于Linux(CentOS 7)、SpringBoot部署运行OpenCV 4.5.5,并顺带记录Windows/IDEA下如何调试SpringBoot调用OpenCV项目。 Windows下调试 首先我们编写代码,并在Windows/IDEA下调试通过。 下载Windows版安装包&#xff0…

OD_2024_C卷_200分_6、六_连续出牌数量【JAVA】【回溯算法】

题目描述 package odjava;import java.util.Arrays; import java.util.Scanner;public class 六_连续出牌数量 {// 定义扑克牌类static class Card {int num; // 牌号char color; // 花色public Card(int num, String color) {this.num num;this.color color.charAt(0); // 取…

网络套接字1

网络套接字1 📟作者主页:慢热的陕西人 🌴专栏链接:Linux 📣欢迎各位大佬👍点赞🔥关注🚓收藏,🍉留言 本博客主要内容讲解了udp的Linux环境下的使用&#xff0c…

JVM3_数据库连接池虚引用ConnectionFinalizerPhantomReference引起的FullGC压力问题排查

背景 XOP服务运行期间,查看Grafana面板,发现堆内存周期性堆积,观察FullGC的时间,xxx,需要调查下原因 目录 垃圾收集器概述 常见的垃圾收集器分区收集策略为什么CMS没成为默认收集器 查看JVM运行时环境分析快照 Pha…

msfconsole中db_namp的使用方法以及如何让msf连接数据库

一、db_nmap使用方法 1.打开数据库 1.1查看数据库postgresql连接状态 systemctl status postgresql查看数据库postgresql连接状态、 1.2启动postgresql systemctl start postgresql启动postgresql 1.3初始化 msfdb init初始化 2.C段扫描(db_nmap的使用) 2.1 db_nmap -sP 192…

AIGC实战——GPT(Generative Pre-trained Transformer)

AIGC实战——GPT 0. 前言1. GPT 简介2. 葡萄酒评论数据集3. 注意力机制3.1 查询、键和值3.2 多头注意力3.3 因果掩码 4. Transformer4.1 Transformer 块4.2 位置编码 5. 训练GPT6. GPT 分析6.1 生成文本6.2 注意力分数 小结系列链接 0. 前言 注意力机制能够用于构建先进的文本…

windows和linux系统安装redis

Redis安装 Redis安装与启动windows服务 Redis 安装 这样安装完在系统服务中并没有redis服务 redis服务启动 Redis安装与启动Linux服务 1.下载压缩包到服务器 我下载的是最新版本7.0.12,这里我是直接下载到了root目录下 wget https://github.com/redis/redis…

ChatGPT逐步进入留学圈但并不能解决留学规划的问题

2022 年底,一个能像人类一样对话的AI软件ChatGPT,在5天内突破一百万用户,风靡全球,如今用户已达1.8亿。 四个月后,ChatGPT进化为GPT4版本。该版本逻辑、数学推理能力卓越。拿留美标准化考试举例,GPT4能够在…

图论练习6

[NOIP2013]车站分级 Here 解题思路 由于起始点之间所选的站号,相互之间一定满足那么对于起始点间未选择的站号,一定满足选择的站号考虑用边来维护信息,表示的级别大于按题意,则车站会被分为几个联通块,且保证块内无环…

使用Java和PostGis的全国A级风景区数据入库实战

目录 前言 一、数据介绍 1、空间数据 2、属性表说明 3、QGIS数据预览 二、PostGIS空间数据库设计 1、空间表结构 三、Java空间入库 1、实体定义 2、数据操作Mapper 3、业务层实现 4、入库 5、数据入库验证 总结 前言 星垂平野阔,月涌大江流”“晴川历历…

WinoGrande数据集分享

来源: AINLPer公众号(每日干货分享!!) 编辑: ShuYini 校稿: ShuYini 时间: 2024-3-11 该数据集由华盛顿大学的研究人员提出,它是一个大规模的常识推理挑战数据集,包含约44,000个问题,旨在评估和…

【实战项目】网络编程:在Linux环境下基于opencv和socket的人脸识别系统--C++实现

🌞前言 这里我们会实现一个项目:在linux操作系统下基于OpenCV和Socket的人脸识别系统。 目录 🌞前言 🌞一、项目介绍 🌞二、项目分工 🌞三、项目难题 🌞四、实现细节 🌼4.1 关…

【APP逆向】酒仙网预约茅台程序,包含逆向过程详解

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 所属的专栏:爬虫实战,零基础、进阶教学 景天的主页:景天科技苑 文章目录 酒仙网预约抢购茅台1.抓包分析,账户名和密码登录2.短信登录3.登录+茅台预约 密码登录酒仙网预约抢购茅台 目标:账号登…

重启 explorer 进程的正确做法(二)

重启资源管理器进程的方法不唯一,但长期以来大家对实施方法用的不到位。 在上一篇中我认为:“我们往往使用 TerminateProcess 并传入 PID 和特殊结束代码 1 或者 taskkill /f /im 等方法重启资源管理器( explorer.exe ),其实这是不正确的。我…

jdk17出现错误无法初始化主类 和NoClassDefFoundError:Vector的解决方法

概述:网上流传文章大多都是编译和运行都加下面这串代码 --add-modulesjdk.incubator.vector我估计他们大多都是复制粘贴的文章,这种东西就是电子垃圾,在idea中,大多人都习惯用maven来构建java项目,接下来我将讲解使用…

Android14音频进阶:AudioTrack如何巧妙衔接AudioFlinger(五十七)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒体系统工程师系列【原创干货持续更新中……】🚀 人生格言: 人生从来没有捷径,只…

设计模式十:原型模式

文章目录 1、原型模式1.1 类创建过程1.2 浅拷贝1.3 深拷贝 2、示例2.1 简单形式2.2 复杂形式 3、spring中的原型模式3.1 ArrayList的原型模式3.2 spring中的原型模式 1、原型模式 原型模式就是从一个对象再创建另外一个可定制的对象, 而且不需要知道任何创建的细节。…

前端解决跨域问题( 6种方法 )

本专栏是汇集了一些HTML常常被遗忘的知识,这里算是温故而知新,往往这些零碎的知识点,在你开发中能起到炸惊效果。我们每个人都没有过目不忘,过久不忘的本事,就让这一点点知识慢慢渗透你的脑海。 本专栏的风格是力求简洁…

使用JDBC操作数据库

意志、工作和等待是成功的金字塔的基石。 Will, work and wait are the pyramidal cornerstones for success. 文章目录 JDBC简介:JDBC访问数据库步骤StatementPreparedStatement JDBC简介: 在Java应用程序中,JDBC(Java Database…

CSS 入门指南(二)CSS 常用样式及注册页面案例

CSS 常用样式 颜色属性 常见样式的颜色属性: color:定义文本的颜色border-color:定义边框的颜色background-color:设置背景色 颜色属性值设置方式: 十六进制值 - 如:#FF0000一个RGB值 - 如…