kafka 四 Kafka读写流程、LEO log end offset、物理存储稠密索引稀疏索引、Kafka物理存储、深入了解读数据流程、删除消息

kafka 四 Kafka读写流程、LEO log end offset、物理存储稠密索引稀疏索引、Kafka物理存储、深入了解读数据流程、删除消息

news2025/7/2 1:43:52

目录

Kafka读写流程

LEO log end offset

物理存储稠密索引稀疏索引

Kafka物理存储

深入了解读数据流程

删除消息

Kafka读写流程

写流程：

通过zookeeper 找leader
分配开始读写
Isr中的副本同步数据，并返回给leader ack
返回给分片ack

读流程：

通过zookeeper 找leader
通过zookeeper 找到消费者对应的offset
然后从offset顺序拉去
提交offset 自动提交手动提交

LEO log end offset

文件默认最大1个G

物理存储稠密索引稀疏索引

- 稀疏索引需要的空间小，占用内存也小，但是查询次数更多，速度较慢。

- 稠密索引占用空间大，但是查询次数更少，速度更快。

Offset 找对应的数据
全局offset 找到对应的分片，分片对应offset 对应多个文件每个文件对应单独的offset
对应稀疏索引俩层索引寻址

分片油多个文件组成，每个文件设置大小默认1G

Segment 段包含 index log timeindex snapshot

Kafka物理存储

Topic
Parition
Segment
1. Log数据文件
2. Index索引文件
3. Timeindex 稀疏索引

深入了解读数据流程

消费者offset 针对一个分片找到全局offset
根据这个全局offset找到对应的segment组的局部offset
根据全局的offset可以从index稀疏索引找到对应数据的位置
开始顺序读取

删除消息

Kafka定期清理数据，一次删除对应的 segment段的数据

Kafka日志管理器会根据配置删除

ok

持续更新

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/627588.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

2023高考语文，用ChatGPT挑战全国卷作文，已达到双一流高校学生水平？

2023高考语文，用ChatGPT挑战全国卷作文，已达到双一流高校学生水平？

前言 2023年高考语文结束啦，今天我们用ChatGPT来挑战高考作文，一起来看看它的表现如何？ChatGPT突然爆火网络，它真的会取代人类的工作吗？ 什么是ChatGPT？ ChatGPT是由OpenAI开发的，OpenAI是一家…

阅读更多...

BBA EDI 项目数据库方案开源介绍

BBA EDI 项目数据库方案开源介绍

近期为了帮助广大用户更好地使用 EDI 系统，我们根据以往的项目实施经验，将成熟的 EDI 项目进行开源。用户安装好知行之桥EDI系统之后，只需要下载我们整理好的示例代码，并放置在知行之桥指定的工作区中，即可开始使用。 …

阅读更多...

排序算法的复杂度及稳定性详解（内含记忆小窍门）

排序算法的复杂度及稳定性详解（内含记忆小窍门）

排序算法的复杂度及稳定性一、排序算法分类二、概念2.1 时间复杂度2.2 空间复杂度2.3 稳定性三、表格比较注意四、部分排序分析4.1 直接插入排序图示代码 4.2 冒泡排序图示代码 4.3 快速排序图示代码五、结构化记忆（小窍门）5.1 结构化5.2 我的结构化…

阅读更多...

2023 如何备考系统架构师？

2023 如何备考系统架构师？

高级系统架构设计师难度还是有的，所以一般千万不要裸考！！要时间充足，至少要接触过，反正没有基础的尽量还是不要去裸考了！ 一、系统架构设计师考试题型考试科目分为综合题（选择题）&a…

阅读更多...

Stable Diffusion最全保姆级安装教程(建议收藏)

Stable Diffusion最全保姆级安装教程(建议收藏)

Midjourney 因细致的画图风格备受大家的欢迎，但由于其网络环境以及会员费，导致入门门槛过高，拦住了很多对AIGC感兴趣的小伙伴。今天阿良就教大家，不需要魔法，也不用交会员费，尽情玩转AI出图的保姆级安装教…

阅读更多...

力扣算法系统刷题详细题解记录二（字符串、双指针法、栈与队列）

力扣算法系统刷题详细题解记录二（字符串、双指针法、栈与队列）

力扣算法系统刷题题解记录二（字符串、双指针法、栈与队列） 前言参考顺序和资料：《代码随想录》二刷要认真做笔记啦，加油！ 笔记模板： #### 解题思路#### 示意图#### 代码四、字符串 344.字符串反转编…

阅读更多...

求最小生成树（Kruskal算法和Prim算法）

求最小生成树（Kruskal算法和Prim算法）

目录一、前言二、相关概念 1、最小生成树 2、Prim算法（对结点进行操作） 3、kruskal 算法（对边进行操作） 三、例题 1、修建公路（lanqiaoOJ题号1124） 1、Prim算法题解 2、Kruskal算法一、前言很…

阅读更多...

PyToch 深度学习 || 卷积神经网络分类

PyToch 深度学习 || 卷积神经网络分类

卷积神经网络分类 import torch import torch.nn as nn import torchvision import numpy as np from torch.autograd import Variable import matplotlib.pyplot as plt import torch.nn.functional as F import torch.utils.data as Data from torchvision import datasets,…

阅读更多...

【业务功能篇20】Springboot java逻辑实现动态行转列需求

【业务功能篇20】Springboot java逻辑实现动态行转列需求

在此前，我也写过一个行转列的文章，是用存储过程sql处理的一个动态的逻辑 Mysql 存储过程\Mybatis框架call调用实现动态行转列那么后面我们同样又接收了业务的一个新需求，针对的是不同的业务数据，做的同样的一个展示数据报表&…

阅读更多...

【C++11】 initializer_list | 右值引用 | 移动构造 | 完美转发

【C++11】 initializer_list | 右值引用 | 移动构造 | 完美转发

文章目录 1. 统一的列表初始化{ } 初始化initializer_list 2. 引用左值引用右值引用左值引用与右值引用的相互转换右值引用的真正使用场景移动构造 C98与C11传值返回问题注意事项总结 3. 完美转发 1. 统一的列表初始化 { } 初始化 C11 扩大了括号括起的列表(初始化列表)的使用…

阅读更多...

使用PHP导出Excel时处理复杂表头的万能方法

使用PHP导出Excel时处理复杂表头的万能方法

使用PHP导出Excel时，如果是一级表头处理起来很简单，但如果碰到复杂一点的表头，比如二级、三级，甚至更多级别的表头要怎么办呢？ 就像下面这个表头，有三层，并且每层都不太规则—— 难道我们每次处…

阅读更多...

动态绑定v-model,并解决输入框无法输入和无法双向绑定问题

动态绑定v-model,并解决输入框无法输入和无法双向绑定问题

问题：在界面中想要动态获取数据库中返回的数据，作为下拉的值，每个下拉值中又包含不同的属性信息，给输入框动态绑定v-model，但是绑定成功后输入框内无法输入内容，且没有双向绑定解决思路：1.双向…

阅读更多...

SIM：基于搜索的用户终身行为序列建模

SIM：基于搜索的用户终身行为序列建模

SIM：基于搜索的用户终身行为序列建模论文：《Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction》下载地址：https://arxiv.org/abs/2006.05639 1、用户行为序列建模回顾 1…

阅读更多...

在 AWS 上使用 OpenText 实现业务关键型应用程序的现代化

在 AWS 上使用 OpenText 实现业务关键型应用程序的现代化

通过在云中进行信息管理建立持久的竞争优势创新在云中发生的速度比以往任何时候都快。企业面临着数字经济快速转型的挑战，充分释放业务信息的能力对于建立持久的竞争优势至关重要。为分散的员工扩大安全可靠的协作范围将是生产力和创新的关键驱动力。如今大多…

阅读更多...

Web UI自动化测试之元素定位

Web UI自动化测试之元素定位

目前，在自动化测试的实际应用中，接口自动化测试被广泛使用，但UI自动化测试也并不会被替代。让我们看看二者的对比： 接口自动化测试是跳过前端界面直接对服务端的测试，执行效率和覆盖率更高，维护成本更低&am…

阅读更多...

【EtherCAT】一、入门基础

【EtherCAT】一、入门基础

什么是EtherCAT？ 介绍简介特点和优势EtherCAT系统组成主站从站硬件EtherCAT主站芯片EtherCAT从站芯片 EtherCAT应用层协议工具软件介绍简介 EtherCAT（Ethernet Control Automation Technology）是一种高性能实时以太网通信协议&#xff…

阅读更多...

Ubuntu20.04设置开机自启动脚本

Ubuntu20.04设置开机自启动脚本

1.建立开机启动服务 sudo vim /lib/systemd/system/rc-local.service 在末尾添加 [Install] WantedBymulti-user.target Aliasrc-local.service2.创建 /etc/rc.local sudo touch /etc/rc.local && sudo chmod 755 /etc/rc.local #!/bin/bash cd /home/docker-data/ss…

阅读更多...

前端框架笔记

前端框架笔记

Vue.js的安装安装Vue.js有两种方法： （1）类似于Bootstrap或jQuery，直接通过HTML文件中的标签引用。为了方便开发者使用，Vue.js提供了相关的CDN，通过如下代码可以引用最新版本的Vue.js： <sc…

阅读更多...

小黑回到学校，跟小老黑中老黑阿黄一起度过最后在学校的日子的leetcode之旅:3. 无重复字符的最长子串

小黑回到学校，跟小老黑中老黑阿黄一起度过最后在学校的日子的leetcode之旅:3. 无重复字符的最长子串

双指针动态滑动窗口 class Solution:def lengthOfLongestSubstring(self, s: str) -> int:# 字符串长度n len(s)# 双指针left 0right 0# 存储集合set_ set()# 当前子串长度cur_len 0# 结果result 0# 分别遍历每一个右指针while right < n:# 该字符是重复的&#x…

阅读更多...

向量相似搜索绕不开的局部敏感哈希

向量相似搜索绕不开的局部敏感哈希

在搜索推荐中，通常使用相似Embedding进行推荐，此时就会有一个问题：如何快速找到与一个Embedding相近的其他Embedding。如果两个Embedding在同一个向量空间中，我们就可以通过很多种方式（内积、余弦、欧氏距离等&#…

阅读更多...

推荐文章

最新文章