kafka日志清理配置

news2024/11/18 13:05:47

log.retention.bytes 是 Apache Kafka 配置文件中的一个参数,用于指定 Kafka 日志文件的最大存储大小。该参数控制每个日志主题分区(log partition)可以保留的最大字节数。

详细解释:

在 Kafka 中,消息以日志(log)的形式保存在磁盘上,每个日志主题有一个或多个分区,每个分区会存储消息数据。为了控制存储空间的使用,Kafka 允许设置日志的保留策略。

log.retention.bytes 参数指定了 单个分区 中日志数据的最大字节数。也就是说,当一个日志分区的大小达到这个值时,Kafka 将会删除旧的日志文件来为新的日志腾出空间。

作用:

  • 控制日志大小:此配置用于限制每个分区的日志存储空间。当分区的大小达到此值时,Kafka 会根据保留策略删除旧的日志数据。
  • 自动清理旧数据:当日志文件大小超出该限制时,Kafka 会根据保留策略删除最旧的日志消息,以保持分区的存储大小在指定的限制内。

默认值:

log.retention.bytes 默认值为 -1,表示没有大小限制,即不通过大小来控制日志的保留。Kafka 会依赖 log.retention.ms(日志保留时间)来控制数据的删除。

配置示例:

 
 

propertiesCopy Code

log.retention.bytes=1073741824

这个配置会将每个分区的日志文件大小限制为 1 GB(1 GB = 1073741824 字节)。当一个分区的日志大小达到 1 GB 时,Kafka 将会删除最旧的消息,直到日志文件大小不再超过这个限制。

组合使用 log.retention.ms 和 log.retention.bytes

  • log.retention.ms:控制消息的最大保留时间(例如:7 天)。这是时间维度的清理策略。
  • log.retention.bytes:控制每个分区的最大日志大小(字节)。这是大小维度的清理策略。

如果同时配置了这两个参数,Kafka 将会根据这两个条件之一触发日志清理。也就是说,日志会在 满足时间条件达到大小限制 时被删除。

使用场景:

  • 磁盘空间有限的情况:如果 Kafka 集群的磁盘空间有限,配置 log.retention.bytes 可以防止日志文件占满磁盘空间。
  • 高吞吐量的集群:在吞吐量较高的 Kafka 集群中,日志数据会迅速积累,配置此参数可以有效控制存储压力,避免磁盘空间耗尽。
  • 与 log.retention.ms 配合使用:通过合理设置时间和大小的结合,能够精细化控制日志数据的存储方式。

配置示例:

假设你有一个 Kafka 集群,并且希望每个分区的日志最大保持 5 GB,而日志文件的最大保留时间为 3 天,可以配置如下:

 
 

propertiesCopy Code

log.retention.bytes=5368709120 # 5 GB log.retention.ms=259200000 # 3 天 (3 * 24 * 60 * 60 * 1000 毫秒)

这样,Kafka 会在日志文件达到 5 GB 或 3 天时,根据设置的策略删除旧的消息。

需要注意的事项:

  1. 避免过低设置:如果设置的 log.retention.bytes 太小,可能会导致频繁删除数据,这可能会影响消费者的消费进度,尤其是在有高吞吐量或者消费者消费较慢的场景下。
  2. 磁盘性能考虑:频繁的日志清理会增加磁盘 I/O 负担,影响集群的性能。因此需要根据实际的硬件和业务需求调整此参数。

总结:

log.retention.bytes 主要用于控制 Kafka 日志分区的最大存储空间,当分区日志的大小达到该限制时,Kafka 会清理最旧的消息来保持分区大小。与时间保留策略(log.retention.ms)配合使用,可以精细控制数据的存储和清理策略,避免过多的磁盘占用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2242825.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何在Mysql中生成0-23完整的小时数据

目录 1. 创建表2. 插入0-23小时的数据3. 查询并合并数据 在数据分析中,我们经常需要对特定时间段内的数据进行统计和分析。 例如,在名片进线的场景中,我们可能需要了解一天内每小时的名片进线数量。 然而,由于某些时间点可能没有数…

【GeekBand】C++设计模式笔记12_Singleton_单件模式

1. “对象性能” 模式 面向对象很好地解决了 “抽象” 的问题, 但是必不可免地要付出一定的代价。对于通常情况来讲,面向对象的成本大都可以忽略不计。但是某些情况,面向对象所带来的成本必须谨慎处理。典型模式 SingletonFlyweight 2. Si…

架构篇(理解架构的模式2)

目录 一、管理和监控 大使模式:创建代表消费者服务或应用程序发送网络请求的帮助服务 反腐模式:在现代应用程序和遗留系统之间实现装饰或适配器层 外部配置存储:将应用程序部署包中的配置信息移动到中心化的位置 网关聚合模式&#xff1…

20241116解决在WIN11和ubuntu20.04通过samba共享时出现局域网千兆带宽拉满的情况

20241116解决在WIN11和ubuntu20.04通过samba共享时出现局域网千兆带宽拉满的情况 2024/11/16 13:42 缘起:最近需要通过iperf3打流,因此在ubuntu20.04服务器上常开sudo nethogs监控流量。 但是发现一个异常,ubuntu20.04服务器上发送的流量过大…

DevOps工程技术价值流:打造卓越项目协作的优化宝典

一、引言 解锁项目协作的无限潜力,覆盖全链路实现流畅高效。 在当今瞬息万变的商业环境中,项目协作的效率和效果直接关系到企业的竞争力和市场响应速度。DevOps工程技术价值流中的项目协作优化,不仅是技术层面的革新,更是团队协…

WSL--无需安装虚拟机和docker可以直接在Windows操作系统上使用Linux操作系统

安装WSL命令 管理员打开PowerShell或Windows命令提示符,输入wsl --install,然后回车 注意:此命令将启用运行 WSL 和安装 Linux 的 Ubuntu 发行版所需的功能。 注意:默认安装最新的Ubuntu发行版。 注意:默认安装路径是…

⾃动化运维利器Ansible-基础

Ansible基础 一、工作原理二、快速入门2.1 测试所有资产的网络连通性2.2 发布文件到被管理节点(资产) 三、资产(被管理节点)3.1 静态资产3.1.1 自定义资产3.1.2 自定义资产的使用3.1.3 资产选择器 四、Ansible Ad-Hoc 命令4.1 模块类型4.1.1 command & shell 模块4.1.2 cop…

简易实现自动签到并发送通知邮件

环境准备 Windows操作系统adbshell1.0.40pyhon3.7visual stdio code stableandroid手机数据线,并配置环境变量 打卡程序 需要定位屏幕坐标 import os import timea0os.popen("adb shell input keyevent 26") ##ba0.read() ##print(b) time.sleep(5) …

机器学习(贝叶斯算法,决策树)

朴素贝叶斯分类 贝叶斯分类理论 假设现有两个数据集,分为两类 我们现在用p1(x,y)表示数据点(x,y)属于类别1(图中红色圆点表示的类别)的概率,用p2(x,y)表示数据点(x,y)属于类别2(图中蓝色三角形表示的类别)的概率,那么对于一个新数据点(x,y)…

[ACTF2020]Upload 1--详细解析

信息收集 题目告诉我们是一道upload,也就是文件上传漏洞题目。 进入界面,是一个灯泡,将鼠标放在图标上就会出现文件上传的相应位置: 思路 文件上传漏洞,先看看有没有前端校验。 在js源码中找到了前端校验&#xff…

网络常用特殊地址-127.0.0.1

借用Medium博客的一张图 经常在问题解答群里留意到如下关于127.0.0.1的消息 ”如果单机版,不需要配置IP,所有配置IP的地方都写死127.0.0.1就可以” “ip: 根据实际情况填写(在 xxx-init.conf 里可以给一个默认值 127.0.0.1 ,方便…

Scala-字符串(拼接、printf格式化输出等)-用法详解

Scala 一、 使用 号连接字符串 在 Scala 中, 运算符实际上会调用 String 类的 concat 方法或者使用字符串的加法操作,生成一个新的字符串。 字符串是不可变的,每次拼接都会创建一个新的字符串。 Mr. yuTips: 性能相对较差&…

软考教材重点内容 信息安全工程师 第 4 章 网络安全体系与网络安全模型

4,1 网络安全体系的主要特征: (1)整体性。网络安全体系从全局、长远的角度实现安全保障,网络安全单元按照一定的规则,相互依赖、相互约束、相互作用而形成人机物一体化的网络安全保护方式。 (2)协同性。网络安全体系依赖于多种安全机制,通过各…

【数据库】如何保证数据库迁移过程中数据的一致性?

在数据库迁移过程中,保证数据的一致性是非常重要的,尤其是在涉及到多个表、多个数据库或分布式系统的情况下。以下是一些确保数据一致性的最佳实践和方法: 1. 备份数据 在开始迁移之前,进行全面的数据备份是确保数据一致性的第…

github 模型下载方法

github 模型权重,如果是项目下载,pth文件有时下载后只有1kb 本人测试ok下载方法: 点击view raw,然后可以下载模型权重文件了。

spring-data-elasticsearch 3.2.4 实现桶bucket排序去重,实现指定字段的聚合搜索

一、背景 es索引有一个文档CourseIndex,下面是示意: creatorIdgradesubjectnameno1002270英语听力课程一N00232DS91004380数学口算课程N00209DK71003480物理竞赛课程N00642XS21002280英语听力课程二N00432WS31002290英语听力课程三N002312DP5 在搜索的时候&#…

QQ 小程序已发布,但无法被搜索的解决方案

前言 我的 QQ 小程序在 2024 年 8 月就已经审核通过,上架后却一直无法被搜索到。打开后,再在 QQ 上下拉查看 “最近使用”,发现他出现一下又马上消失。 上线是按正常流程走的,开发、备案、审核,没有任何违规&#xf…

快速搭建Android开发环境:Docker部署docker-android并实现远程连接

目录 前言 1. 虚拟化环境检查 2. Android 模拟器部署 3. Ubuntu安装Cpolar 4. 配置公网地址 5. 远程访问 小结 6. 固定Cpolar公网地址 7. 固定地址访问 作者简介: 懒大王敲代码,计算机专业应届生 今天给大家聊聊快速搭建Android开发环境&#x…

大麦抢票科技

仅供学习参考,切勿再令您所爱的人耗费高昂的价格去购置黄牛票 ⚠️核心内容参考: 据悉,于购票环节,大麦凭借恶意流量清洗技术,于网络层实时甄别并阻拦凭借自动化手段发起下单请求的流量,强化对刷票脚本、刷票软件以及…

【STM32】基于SPI协议读写SD,详解!

文章目录 0 前言1 SD卡的种类和简介1.1 SD卡的种类1.2 SD卡的整体结构1.3 SD卡运行机制——指令和响应2 SD卡的通信总线2.1 SDIO2.2 SPI3 硬件连接4 代码实践【重点】4.1 HAL库移植4.2 标准库移植4.3 遇到的问题和解决方案5 扩展阅读0 前言 因为项目需要,使用stm32读写sd卡,这…