【kafka系列】Kafka如何保证消息不丢失?

news2025/3/14 11:04:02

目录

1. 生产者端:确保消息成功发送到Broker

核心机制:

关键步骤:

2. Broker端:持久化与副本同步

核心机制:

关键源码逻辑:

3. 消费者端:可靠消费与Offset提交

核心机制:

关键步骤:

4. 全链路保障流程

消息丢失的典型场景与规避

总结


  1. 生产者端
    • 设置acks=all确保所有ISR副本写入成功。
    • 启用重试(retries)和幂等性(enable.idempotence=true,依赖ProducerIdSequenceNumber)。
  1. Broker端
    • 副本数replication.factor≥3,ISR最小副本数min.insync.replicas≥2
    • 使用flush机制定期刷盘(通过log.flush.interval.messages配置)。
  1. 消费者端
    • 手动提交Offset(enable.auto.commit=false),处理完消息后调用commitSync()

Kafka通过生产者端确认机制Broker端持久化与副本同步消费者端可靠消费三个核心环节保障消息不丢失。以下是具体实现机制与步骤:


1. 生产者端:确保消息成功发送到Broker

核心机制
  • acks确认机制
    • acks=0:生产者不等待Broker确认,可能丢失消息(不推荐)。
    • acks=1:Leader副本写入即确认,若Leader宕机且未同步到其他副本,可能丢失。
    • acks=all(或acks=-1:必须等待所有ISR副本写入成功,才返回确认(最高可靠性)。
  • 重试机制
    • 配置retries=N(如3次),在Broker临时故障时自动重试。
    • 幂等性(enable.idempotence=true):通过Producer IDSequence Number去重,避免网络重试导致消息重复。
关键步骤
// 生产者配置示例
Properties props = new Properties();
props.put("acks", "all");          // 必须所有ISR副本确认
props.put("retries", 3);           // 重试次数
props.put("enable.idempotence", "true"); // 开启幂等性

2. Broker端:持久化与副本同步

核心机制
  • 副本机制(Replication)
    • 每个Partition有多个副本(replication.factor≥3),Leader处理读写,Follower同步数据。
    • ISR(In-Sync Replicas):只有与Leader保持同步的副本才属于ISR集合。
    • min.insync.replicas=2:至少需要2个ISR副本写入成功,否则生产者抛出NotEnoughReplicasException
  • 持久化策略
    • 页缓存(Page Cache):依赖操作系统缓存加速写入,数据异步刷盘。
    • 强制刷盘:通过log.flush.interval.messageslog.flush.interval.ms控制刷盘频率(高可靠性场景建议启用)。
  • Leader选举与数据恢复
    • 若Leader宕机,Controller从ISR中选举新Leader,确保数据不丢失。
    • 若所有ISR副本宕机,需配置unclean.leader.election.enable=false(禁止非ISR副本成为Leader)。
关键源码逻辑
  • 副本同步:Leader通过ReplicaFetcherThread向Follower同步数据(源码见kafka.server.ReplicaFetcherThread)。
  • ISR管理:Broker定期检查Follower的同步状态,延迟超过replica.lag.time.max.ms的副本会被移出ISR。

3. 消费者端:可靠消费与Offset提交

核心机制
  • 手动提交Offset
    • 关闭自动提交enable.auto.commit=false),在消息处理完成后手动调用commitSync()commitAsync()
    • 若消费者崩溃,下次启动时从最后提交的Offset恢复,避免消息丢失。
  • 事务性消费
    • 结合Kafka事务(isolation.level=read_committed),仅消费已提交的事务消息。
关键步骤
// 消费者配置示例
props.put("enable.auto.commit", "false"); // 关闭自动提交
while (true) {
    ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
    for (ConsumerRecord<String, String> record : records) {
        processRecord(record); // 处理消息
        consumer.commitSync(); // 处理完成后提交Offset
    }
}

4. 全链路保障流程

  1. 生产者发送
    • 消息发送后等待acks=all确认。
    • 若Broker未确认,按retries重试。
  1. Broker持久化
    • Leader和ISR副本将消息写入日志文件。
    • 根据配置决定是否强制刷盘。
  1. 消费者消费
    • 处理消息后手动提交Offset。
    • 若消费者崩溃,从已提交Offset恢复。

消息丢失的典型场景与规避

场景

规避措施

生产者acks=1

,Leader宕机

使用acks=all

+ min.insync.replicas=2

ISR副本不足导致写入失败

增加replication.factor

,确保min.insync.replicas

≤ 当前ISR副本数。

消费者自动提交Offset,消息未处理

关闭自动提交,处理完成后手动提交。

磁盘故障导致数据丢失

使用RAID或分布式存储,确保多副本分布在不同物理节点。


总结

Kafka通过以下组合策略保障消息不丢失:

  1. 生产者端acks=all + 幂等性 + 重试。
  2. Broker端:多副本同步 + ISR管理 + 强制刷盘。
  3. 消费者端:手动提交Offset + 事务性消费。

正确配置后,Kafka可提供至少一次(At-Least-Once)或精确一次(Exactly-Once) 的语义保障。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2299274.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

新建github操作

1.在github.com的主页根据提示新建一个depository。 2.配置用户名和邮箱 git config --global user.name "name" git config --global user.email "email" 3.生成ssh秘钥 ssh-keygen -t rsa 找到public key 对应的文件路径 cat /root/.ssh/id_rsa 复制显…

第 15 天:数据存储,打造存档 读取系统!

&#x1f3af; 目标&#xff1a; ✅ 掌握 UE5 SaveGame 存档系统 ✅ 在 C 创建存档类&#xff0c;存储游戏数据 ✅ 实现存档 & 读取功能&#xff0c;让游戏状态可持久化 ✅ 在 BP_PlayerCharacter 里实现&#xff1a; * 游戏开始时自动加载存档 * 玩家受到伤害时自动存档 …

Flutter 异步编程利器:Future 与 Stream 深度解析

目录 一、Future&#xff1a;处理单次异步操作 1. 概念解读 2. 使用场景 3. 基本用法 3.1 创建 Future 3.2 使用 then 消费 Future 3.3 特性 二、Stream&#xff1a;处理连续异步事件流 1. 概念解读 2. 使用场景 3. 基本用法 3.1 创建 Stream 3.2 监听 Stream 3.…

Java短信验证功能简单使用

注册登录阿里云官网&#xff1a;https://www.aliyun.com/ 搜索短信服务 自己一步步申请就可以了 开发文档&#xff1a; https://next.api.aliyun.com/api-tools/sdk/Dysmsapi?version2017-05-25&languagejava-tea&tabprimer-doc 1.引入依赖 <dependency>…

React进阶之React核心源码解析(一)

React核心源码解析 react 特点CPU卡顿IO 卡顿 新老 react 架构对比v15v16.8Scheduler 调度器Reconciler 协调器 React fiber原理更新dommount 构建过程 render阶段 — scheduler reconcilerreact源码解析react-domreact-dom/src/client/ReactDOMRoot.js react-reconcilerreact-…

【Vue】打包vue3+vite项目发布到github page的完整过程

文章目录 第一步&#xff1a;打包第二步&#xff1a;github仓库设置第三步&#xff1a;安装插件gh-pages第四步&#xff1a;两个配置第五步&#xff1a;上传github其他问题1. 路由2.待补充 参考文章&#xff1a; 环境&#xff1a; vue3vite windows11&#xff08;使用终端即可&…

类加载机制及双亲委派模型

一、引言 二、类加载流程 1. 加载 2. 连接 2.1 验证 2.2 准备 2.3 解析 3. 初始化 三、类加载器 类加载器的类型 双亲委派模型 打破双亲委派模型 双亲委派模型优点 一、引言 在 Java 的运行机制中&#xff0c;类加载是一个至关重要的环节。它不仅决定了 Java 程序的动态…

尚硅谷课程【笔记】——大数据之Hadoop【一】

课程视频链接&#xff1a;尚硅谷Hadoop3.x教程 一、大数据概论 1&#xff09;大数据概念 大数据&#xff08;Big Data&#xff09;&#xff1a;指无法再一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合&#xff0c;是需要新处理模式才能具有更强的决策力、洞察发…

DockerFile优化镜像体积

title: DockerFile优化镜像体积 date: 2025-02-15 15:22:40 tags: DockerFile优化镜像体积DockerFile优化镜像体积 DockerFile优化镜像体积前文回顾:一、细数优化镜像体积的思路与方式二、优化Dockfile文件编辑 Dockerfile2文件三、构建镜像四、运行镜像五、查看运行效果原文 …

题解:洛谷 P4113 [HEOI2012] 采花

题目https://www.luogu.com.cn/problem/P4113 运用类似于P1972 [SDOI2009] HH的项链的操作&#xff0c;将数据离线下来处理。 按照区间右端点从小到大排序。 问题是数量大于等于 的时候才能算进去。 于是乎我们用两个数组维护倒数第二次出现和最后一次出现的地方。 每次在…

easyexcel快速使用

1.easyexcel EasyExcel是一个基于ava的简单、省内存的读写Excel的开源项目。在尽可能节约内存的情况下支持读写百M的Excel 即通过java完成对excel的读写操作&#xff0c; 上传下载 2.easyexcel写操作 把java类中的对象写入到excel表格中 步骤 1.引入依赖 <depen…

android studio下载安装汉化-Flutter安装

1、下载android studio官方地址&#xff1a;&#xff08;这个网址可能直接打不开&#xff0c;需要VPN&#xff09; https://developer.android.com/studio?hlzh-cn mac版本分为X86和arm版本&#xff0c;电脑显示芯片是Inter的就是x86的&#xff0c;显示m1和m2的就是arm的 …

Seaweedfs(master volume filer) docker run参数帮助文档

文章目录 进入容器后执行获取weed -h英文中文 weed server -h英文中文 weed volume -h英文中文 关键点测试了一下&#xff0c;这个-volume.minFreeSpace string有点狠&#xff0c;比如设置值为10&#xff08;10%&#xff09;&#xff0c;它直接给系统只留下10%的空间&#xff0…

【工业安全】-CVE-2022-35555- Tenda W6路由器 命令注入漏洞

文章目录 1.漏洞描述 2.环境搭建 3.漏洞复现 4.漏洞分析 4.1&#xff1a;代码分析  4.2&#xff1a;流量分析 5.poc代码&#xff1a; 1.漏洞描述 漏洞编号&#xff1a;CVE-2022-35555 漏洞名称&#xff1a;Tenda W6 命令注入 威胁等级&#xff1a;高危 漏洞详情&#xff1…

C#(Winform)通过添加AForge添加并使用系统摄像机

先展示效果 AForge介绍 AForge是一个专门为开发者和研究者基于C#框架设计的, 也是NET平台下的开源计算机视觉和人工智能库 它提供了许多常用的图像处理和视频处理算法、机器学习和神经网络模型&#xff0c;并且具有高效、易用、稳定等特点。 AForge主要包括: 计算机视觉与人…

【LeetCode: 611. 有效三角形的个数 + 排序 + 双指针】

&#x1f680; 算法题 &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&#xff0c;…

每日十题八股-补充材料-2025年2月15日

1.TCP是如何保证消息的顺序和可靠的&#xff1f; 写得超级好的文章 首先肯定是三次握手和四次挥手保证里通讯双方建立了正确有效的连接。 其次是校验和、序列号&#xff0c;ACK消息应答机制还有重传机制&#xff0c;保证了消息顺序和可靠。 同时配合拥塞机制和流量控制机制&am…

国内已经部署DeepSeek的第三方推荐

大家好&#xff0c;我是苍何。 最近DeepSeek爆火&#xff0c;我也说点心里话&#xff0c;其实就我们普通人而言&#xff0c;要想用好 DeepSeek&#xff0c;其实无非就是要利用好工具为我们自己提效。 比如你是搞编程的&#xff0c;你就得学会如何用 DeepSeek 更快速的辅助你编…

Windows环境下使用Ollama搭建本地AI大模型教程

注&#xff1a;Ollama仅支持Windows10及以上版本。 安装Ollama 去 ollama官网 下载对应平台及OS的安装包。 运行安装包&#xff0c;点击“安装”按钮即可开始安装。Ollama会自动安装到你的 C:\Users\<当前用户名>\AppData\Local\Programs\Ollama 目录上。 安装完成后&…

2024年认证杯SPSSPRO杯数学建模A题(第二阶段)保暖纤维的保暖能力全过程文档及程序

2024年认证杯SPSSPRO杯数学建模 A题 保暖纤维的保暖能力 原题再现&#xff1a; 冬装最重要的作用是保暖&#xff0c;也就是阻挡温暖的人体与寒冷环境之间的热量传递。人们在不同款式的棉衣中会填充保暖材料&#xff0c;从古已有之的棉花、羽绒到近年来各种各样的人造纤维。不…