【面试篇】Kafka

news2025/4/11 7:54:15

一、基础概念类

问题:请简述 Kafka 是什么,以及它的主要应用场景有哪些?
答案:Kafka 是一个分布式流处理平台,它以高吞吐量、可持久化、可水平扩展等特性而闻名。其主要应用场景包括:
日志收集:可以收集和聚合来自不同来源的日志数据,方便进行集中存储和分析。
消息队列:作为异步消息传递系统,解耦生产者和消费者,提高系统的可扩展性和响应性能。
实时流处理:实时处理如金融交易数据、物联网设备产生的数据等,进行实时分析和决策。
问题:Kafka 中的主题(Topic)、分区(Partition)和副本(Replica)分别是什么含义,它们之间有什么关系?
答案:
主题(Topic):是消息的逻辑分类,生产者发送消息到特定主题,消费者从主题中订阅消息。
分区(Partition):每个主题可以被划分为多个分区,分区是物理存储单元,消息以追加的方式存储在分区中。分区可以分布在不同的 Broker 上,实现并行处理和水平扩展。
副本(Replica):为了保证数据的可靠性,每个分区可以有多个副本。其中一个副本是领导者(Leader)副本,负责处理读写请求,其他副本是追随者(Follower)副本,它们从领导者副本同步数据。当领导者副本出现故障时,追随者副本中的一个会被选举为新的领导者副本。
关系:一个主题包含一个或多个分区,每个分区有零个或多个副本。

生产者与消费者类

问题:Kafka 生产者如何保证消息的可靠性发送?
答案:
设置合适的 acks 参数:acks = 0 时,生产者发送消息后不等待任何确认,速度快但可能丢失消息;acks = 1 时,生产者等待领导者副本确认,若领导者副本确认前崩溃,消息可能丢失;acks = all 时,生产者等待所有同步副本确认,确保消息不会丢失,但性能相对较低。
重试机制:生产者发送消息失败时,通过配置 retries 参数设置重试次数,避免因网络等瞬时故障导致消息发送失败。
幂等性:从 Kafka 0.11.0.0 版本开始,生产者支持幂等性,通过设置 enable.idempotence 为 true,保证即使在重试的情况下,相同消息也只会被成功写入 Kafka 一次,避免重复消息。
问题:Kafka 消费者如何实现精准一次消费(Exactly Once)?
答案:
从生产者角度:利用生产者的幂等性和事务特性。生产者开启幂等性(enable.idempotence = true),对于跨分区的事务,通过事务 API(如 initTransactions、beginTransaction、sendOffsetsToTransaction 等方法)确保一批消息要么全部成功写入 Kafka,要么全部失败。
从消费者角度:通过设置 enable.auto.commit = false,关闭自动提交消费偏移量。消费者在处理完消息后,手动提交偏移量,并且将偏移量提交操作包含在事务中,确保消息处理和偏移量提交的原子性。这样当消费者重启后,不会重复消费已经处理过的消息,从而实现精准一次消费。

集群与架构类

问题:Kafka 集群中 Zookeeper 的作用是什么?
答案:
集群管理:存储 Kafka 集群的元数据信息,如主题、分区、Broker 等信息,帮助 Kafka 集群中的节点了解整个集群的状态。
领导者选举:在 Kafka 集群中,当某个分区的领导者副本出现故障时,Zookeeper 协助选举出新的领导者副本。它通过临时节点和 Watch 机制来监测 Broker 和分区的状态变化,触发选举流程。
Broker 注册:Kafka Broker 在启动时会在 Zookeeper 中注册自己,并且定期发送心跳信息保持连接,Zookeeper 根据这些信息来判断 Broker 的存活状态。
问题:Kafka 集群是如何实现水平扩展的?
答案:
添加 Broker:在已有的 Kafka 集群中,通过增加新的 Broker 节点来扩展集群的处理能力。新的 Broker 启动后会向 Zookeeper 注册自己,集群中的其他节点会感知到新节点的加入。
重新分配分区:使用 Kafka 提供的工具(如 kafka-reassign-partitions.sh),可以将现有主题的分区重新分配到新加入的 Broker 上。通过合理地分配分区,使得集群的负载更加均衡,提高整体的处理能力。例如,对于一个有大量读写操作的主题,可以将部分分区迁移到新的 Broker 上,减轻原有 Broker 的压力。
生产者和消费者的自动感知:生产者和消费者在与 Kafka 集群交互时,能够自动感知到集群的变化。当新的 Broker 加入或分区重新分配后,生产者可以将消息发送到新的分区,消费者也能从新的分区拉取消息,无需手动修改配置,从而实现无缝的水平扩展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2328119.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

零基础玩转树莓派5!从系统安装到使用VNC远程控制树莓派桌面实战

文章目录 前言1.什么是Appsmith2.Docker部署3.Appsmith简单使用4.安装cpolar内网穿透5. 配置公网地址6. 配置固定公网地址总结 前言 你是否曾因公司内部工具的开发周期长、成本高昂而头疼不已?或是突然灵感爆棚想给团队来点新玩意儿,却苦于没有专业的编…

【MyBatis】深入解析 MyBatis:关于注解和 XML 的 MyBatis 开发方案下字段名不一致的的查询映射解决方案

注解查询映射 我们再来调用下面的 selectAll() 这个接口,执行的 SQL 是 select* from user_info,表示全列查询: 运行测试类对应方法,在日志中可以看到,字段名一致,Mybatis 就成功从数据库对应的字段中拿到…

图像退化对目标检测的影响 !!

文章目录 引言 1、理解图像退化 2、目标检测中的挑战 3、应对退化的自适应方法 4、新兴技术与研究方向 5、未来展望 6、代码 7、结论 引言 在计算机视觉领域,目标检测是一项关键任务,它使计算机能够识别和定位数字图像中的物体。这项技术支撑着从自动驾…

《AI大模型应知应会100篇》第57篇:LlamaIndex使用指南:构建高效知识库

第57篇:LlamaIndex使用指南:构建高效知识库 摘要 在大语言模型(LLM)驱动的智能应用中,如何高效地管理和利用海量知识数据是开发者面临的核心挑战之一。LlamaIndex(原 GPT Index) 是一个专为构建…

目标检测中COCO评估指标中每个指标的具体含义说明:AP、AR

《------往期经典推荐------》 一、AI应用软件开发实战专栏【链接】 项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.【…

如何利用ATECLOUD测试平台的芯片测试解决方案实现4644芯片的测试?

作为多通道 DC-DC 电源管理芯片的代表产品,4644 凭借 95% 以上的转换效率、1% 的输出精度及多重保护机制,广泛应用于航天航空(卫星电源系统)、医疗设备(MRI 梯度功放)、工业控制(伺服驱动单元&a…

《继电器:机械骑士的电磁战甲》

点击下面图片带您领略全新的嵌入式学习路线 🔥爆款热榜 88万阅读 1.6万收藏 第一章:千年契约的青铜誓言 在电气王国的熔炉深处,电磁铁与簧片的盟约已镌刻千年。电磁铁身披螺旋铜线编织的斗篷,其胸膛中沉睡着一道可召唤磁力的古…

快速求平方根

1. 前置知识 建议首先阅读我的另外一篇文章《雷神之锤 III 竞技场》快速求平方根倒数的计算探究》。建议大家自己看过《雷神之锤 III 竞技场》快速求平方根倒数的计算探究》学会快速求平方根倒数算法后,不看我这篇文章,自己推导一篇快速求平方根的算法&…

C语言基础要素(019):输出ASCII码表

计算机以二进制处理信息,但二进制对人类并不友好。比如说我们规定用二进制值 01000001 表示字母’A’,显然通过键盘输入或屏幕阅读此数据而理解它为字母A,是比较困难的。为了有效的使用信息,先驱者们创建了一种称为ASCII码的交换代…

CI/CD(九) Jenkins共享库与多分支流水线准备

后端构建 零:安装插件 Pipeline: Stage View(阶段视图)、SSH Pipeline Steps(共享库代码中要调用sshCommond命令) 一、上传共享库 二、Jenkins配置共享库 3、新增静态资源与修改配置 如果是docker和k8s启动&#xf…

pip安装timm依赖失败

在pycharm终端给虚拟环境安装timm库失败( pip install timm),提示你要访问 https://rustup.rs/ 来下载并安装 Rust 和 Cargo 直接不用管,换一条命令 pip install timm0.6.13 成功安装 简单粗暴

详解隔离级别(4种),分别用表格展示问题出现的过程及解决办法

选择隔离级别的时候,既需要考虑数据的一致性,避免脏数据,又要考虑系统性能的问题。下面我们通过商品抢购的场景来讲述这4种隔离级别的区别 未提交读(read uncommitted) 未提交读是最低的隔离级别,其含义是…

NO.63十六届蓝桥杯备战|基础算法-⼆分答案|木材加工|砍树|跳石头(C++)

⼆分答案可以处理⼤部分「最⼤值最⼩」以及「最⼩值最⼤」的问题。如果「解空间」在从⼩到⼤的「变化」过程中,「判断」答案的结果出现「⼆段性」,此时我们就可以「⼆分」这个「解空间」,通过「判断」,找出最优解。 这个「⼆分答案…

深层储层弹塑性水力裂缝扩展机理

弹性与弹塑性储层条件下裂缝形态对比 参考: The propagation mechanism of elastoplastic hydraulic fracture in deep reservoir | International Journal of Coal Science & Technology

循环神经网络 - 机器学习任务之异步的序列到序列模式

前面我们学习了机器学习任务之同步的序列到序列模式:循环神经网络 - 机器学习任务之同步的序列到序列模式-CSDN博客 本文我们来学习循环神经网络应用中的第三种模式:异步的序列到序列模式! 一、基本概述: 异步的序列到序列模式…

什么是检索增强生成(RAG)

1、什么是检索增强生成(RAG) 1.1 检索增强生成的概念 检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了信息检索和文本生成技术的新型自然语言处理方法。这种方法增强了模型的理解和生成能力。 相较于经典生成…

MATLAB 控制系统设计与仿真 - 33

状态反馈控制系统 -全维状态观测器的实现 状态观测器的建立解决了受控系统不能测量的状态重构问题,使得状态反馈的工程实现成为可能。 考虑到系统的状态方程表达式,如果{A,B}可控,{A,C}可观,且安装系统的性能指标,可…

企业管理系统的功能架构设计与实现

一、企业管理系统的核心功能模块 企业管理系统作为现代企业的中枢神经系统,涵盖了多个核心功能模块,以确保企业运营的顺畅与高效。这些功能模块通常包括: 人力资源管理模块:负责员工信息的录入、维护、查询及统计分析&#xff0c…

覆盖学术、职场、生活的专业计算工具

软件介绍 今天要给大家介绍一款超给力的工具软件——CalcKit 计算器。它就像是你口袋里的智能计算专家,轻松化解日常生活中的各类计算难题。无论是简单的数字加减乘除,还是复杂的专业运算,它都不在话下。 这款软件内置了极为强大的计算功能…

【大模型系列篇】大模型基建工程:基于 FastAPI 自动构建 SSE MCP 服务器 —— 进阶篇

🔥🔥🔥 上期 《大模型基建工程:基于 FastAPI 自动构建 SSE MCP 服务器》中我们使用fastapi-mcp自动挂载fastapi到mcp工具,通过源码分析和实践,我们发现每次sse请求又转到了内部fastapi RESTful api接口&…