《Kafka 源码实战》看完面试不慌!

news2024/10/5 18:28:00

Kafka 一开始是 LinkedIn 公司开发的消息队列,随着 Kafka 代码被贡献给 Apache 软件基金会后,就成功孵化成 Apache 顶级项目,世界上有越来越多的公司和个人开始使用 Kafka,所以 Kafka 使用的范围是很普遍的。 同时,值得强调的是,在大数据领域 Kafka 是当之无愧的 No.1,对 Spark、Flink 等大数据流计算系统都有很完善的支持,并且 Kafka 的 Connect 可以提供与其他系统之间进行扩展的、可靠的流式传输数据的工具。 总之,正是鉴于 Kafka 高吞吐、高可用的特性,以及良好的生态环境和社区的大力支持,Kafka 才有了非常旺盛的生命力,对于大数据也有很好的支持,各个互联网大厂爱用它也就不奇怪了。而从另一个角度来看,你学习好 Kafka 也是很有必要的,这对于提升你在职场上的竞争力非常有帮助。

那么,如何学习Kafka源码??

我觉得最高效的方式就是去读最核心的源码,先看一张 Kafka结构图 以及 Kafka 源码全景图

梳理一下关于 Kafka 框架,找到学习的重点。

其次,我要说的就是一个Kafka源码解析的文档——《Kafka源码解析与实战》

篇幅原因,这边只能大概的介绍一下 ☛ 原件

前5章分别是:Kafka简介、Kafka的架构、Broker概述、Broker的基本模块、Broker的控制管理模块

  • 第1章 Kafka简介:介绍Kafka诞生的背景、Kafka在LinkedIn内部的应用、Kafka 的主要设计目标以及为什么使用消息系统

  • 第2章 Kafka的架构:介绍Kafka的基本组成、拓扑结构及其内部的通信协议

  • 第3章 Broker概述:描述Kafka集群组成的基本元素Broker Server的启动以及内部的模块组成

  • 第4章 Broker的基本模块:描述Broker Server内部的九大基本模块: SocketServer 、KafkaRequestHandlerPool 、LogManager、ReplicaManager 、OffsetManager、KafkaScheduler. KafkaApis 、KafkaHalthcheck和TopicConfigManager

  • 第5章 Broker的控制管理模块:介绍BrokerServer的控制管理模块KafkaController,这个模块负责整个Kafka集群的管理,例如:Topic的新建和删除.分区状态和副本状态的转换、集群的负载均衡管理等

后5章分别是 Topic的管理工具、生产者、消费者、Kafka的典型应用、Kafka的综合案例

  • 第6章 Topic的管理工具 :介绍三个维护脚本: kafka-topics.sh 、kafka-reassign-partitions.sh 和kafka preferredreplica-election.sh,它们分别涉及Topic的生命周期管理、Topic分区的重分配和分区首选副本的选择。

  • 第7章 生产者 :从设计原则、示例代码、模块组成和发送模式四个部分介绍有关消息生产者的相关知识,从设计原则至客户端编程,从客户端编程到内部实现原理,由浅人深,循序渐进地讲解。

  • 第8章 消费者 :分别介绍两种消费者:简单消费者和高级消费者。针对每种消费者都将依次从设计原则、消费者流程、示例代码以及原理解析四个部分介绍消费者的相关知识。

  • 第9章 Kafka的典型应用 :介绍Kafka与典型大数据系统的集成,包括: Kafka和Storm的集成、Kafka 和ELK的集成、Kafka和Hadoop的集成以及Kafka和Spark的集成。

  • 第10章 Kafka的综合案例 :用综合实例描述了Kafka的应用,案例描述Kafka作为数据总线在安防整体解决方案中的作用,通过车辆人脸图片数据的入库、视频数据的入库、数据延时的监控、数据质量的监控、布控统计和容灾备份6个业务,简要阐述内部的实现原理。

再者就是关于Kafka的面试

Kafka面试专题解析

  1. Kafka 的设计时什么样的呢?

  2. 数据传输的事物定义有哪三种?

  3. Kafka 判断一个节点是否还活着有那两个条件?

  4. producer 是否直接将数据发送到 broker 的 leader(主节点)?

  5. Kafa consumer 是否可以消费指定分区消息?

  6. Kafka 消息是采用 Pull 模式,还是 Push 模式?

  7. Kafka 存储在硬盘上的消息格式是什么?

  8. Kafka 高效文件存储设计特点

  9. Kafka 与传统消息系统之间有三个关键区别

  10. Kafka 创建 Topic 时如何将分区放置到不同的 Broker 中

  11. Kafka 新建的分区会在哪个目录下创建

  12. partition 的数据如何保存到硬盘

  13. kafka 的 ack 机制

  14. Kafka 的消费者如何消费数据

  15. 消费者负载均衡策略

  16. 数据有序

  17. kafaka 生产数据时数据的分组策略

复习学习必备44个Kafka知识点(基础+进阶+高级)

Kafka基础篇知识点(17)

Kafka进阶篇知识点(15)

Kafka高级篇知识点(12)

44个Kafka知识点(基础+进阶+高级)解析如下

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/37641.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue实现文件上传压缩优化处理

vue js实现文件上传压缩优化处理 两种方法 : 第1种是借助canvas的封装的文件压缩上传第2种(扩展方法)使用compressorjs第三方插件实现 目录 vue js实现文件上传压缩优化处理 借助canvas的封装的文件压缩上传 1.新建imgUpload.js 2.全局引…

grafana变量使用

注:基于Grafana v8.3.6编写 1 添加变量 在dashboard界面点击setting,就能进入设置页面, 再点击Variables tab,就可以添加变量 比如我们添加一个系统架构的变量,用于区分Linux和Windows系统,通过node_una…

这可能是2022年把微服务讲的最全了:SpringBoot+Cloud+Docker

前言 最近几年,微服务可谓是大行其道。在业务模型不完善,超大规模流量的冲击的情况下,许多企业纷纷抛弃了传统的单体架构,拥抱微服务。这种模式具备独立开发、独立部署、可扩展性、可重用性的优点的同时,也带来这样一…

【云原生】K8S master节点更换IP以及master高可用故障模拟测试

文章目录一、前言二、配置 多个master 节点1)节点信息1)安装docker或containerd2)安装kubeadm,kubelet和kubectl1、配置k8s yum源2、修改sandbox_image 镜像源3、配置containerd cgroup 驱动程序systemd4、开始安装kubeadm&#x…

SpringBoot SpringBoot 原理篇 1 自动配置 1.7 bean 的加载方式【五】

SpringBoot 【黑马程序员SpringBoot2全套视频教程,springboot零基础到项目实战(spring boot2完整版)】 SpringBoot 原理篇 文章目录SpringBootSpringBoot 原理篇1 自动配置1.7 bean 的加载方式【五】1.7.1 register1 自动配置 1.7 bean 的…

FAIRNESS IN MACHINE LEARNING: A SURVEY 阅读笔记

论文链接 刚读完一篇关于机器学习领域研究公平性的综述,这篇综述想必与其有许多共通之处,重合部分不再整理笔记,可详见上一篇论文的笔记: A Survey on Bias and Fairness in Machine Learning 阅读笔记_Catherine_he_ye的博客 S…

红队隧道加密之MSF流量加密(二)

前言 如今大多数企业的内网都部署了流量审计服务, 用来专门分析流量特征, 比如后门特征和行为特征 若直接使用Metasploit对内网进行横向渗透, 其产生的流量会很容易被内网防护工具检测出来, 因此需对流量进行加密来绕过检测 这里介绍使用OpenSSL对MSF流量进行加密 演示步骤 …

这么高颜值的Kubernetes管理工具Lens,难道还不能C位出道吗

一直使用官方的Kubernetes Dashboard来管理k8s,也算很友好的一款UI工具,但显示的资源不全、查看日志有限、时间久了要重要登陆,所以找了一款外观漂亮,用户体验很好的管理平台Lens。 2 特性与安装 2.1 特性 Lens的优势主要有&…

齐聚绿城 | 锦江都城酒店聚焦中高端酒店投资新方向

提起广西,不少人能想到 “桂林山水甲天下”的桂林,亦或因一碗螺蛳粉闻名全国的柳州。又或荣登《国家地理》的涠洲岛。但在你不知晓的时候,南宁这座城在静静的等你发掘。南宁——南疆安宁,是山环水绕的“绿城”,也是北回…

windows系统cmake生成动态库无lib文件解决方法

作为cmake初学者,在windows系统下使用cmake生成c动态库时出现了下图所示问题,是关于lib文件。找了一圈,也没发现生成有lib文件。 在google上查,才发现windows系统下动态库生成lib文件,还需要添加以下命令: …

java 同步锁synchronized 解决线程共享数据重复操作问题

我们先来写一个买票程序 我们先创建一个包 在包下创建两个类 customException 线程类 负责编写抢票的主要逻辑 参考代码如下 public class customException implements Runnable {private int tickets 100;public void run () {while (tickets > 0){if(tickets > 0) {…

【语音增强】多维谱自适应小波语音信号去噪【含Matlab源码 1972期】

⛄一、自适应小波语音信号去噪 1 引言 语音信号在传输过程中,容易受到环境噪声和其他语音的干扰,降低了语音通信质量,影响了语音处理系统工作。所以,语音的净化处理技术,在现代语音通信和数字音频广播系统中起到愈来愈…

特殊的转义字符—— \b 退格字符 ASCII 08

引入 我们在写 C 语言题目时,经常会碰见这样的输出 11 123 1236 123410如果用循环的话,这个加号是个大问题,如果直接用 printf("%d"),最后会多一个加号,用 printf("%d") 则前面会多一个加号。想…

Qt编写视频监控管理平台(支持海康/大华/宇视/华为/天地伟业/H264/H265等)

一、前言 海康大华等厂家自己的客户端软件,基本上都是支持自家的设备,不支持其他家的摄像机和硬盘录像机,并不是因为技术上做不到,这些大厂要实现支持兼容其他的家的(他们家的服务端或者收费的都是支持其他家的&#…

写个rpc调用,试试自己了解多少

什么是rpc rpc即是远程过程调用,简单来说就是调用其他服务的接口像调用自己的本地方法一样,通常我们的调用的时候不需要关心调用过程和底层的通信即可实现调用其他的服务; 大概流程就是服务模块双方都会向注册中心注册自己的服务&#xff0c…

开发工具vim

一、开发工具vim vim的安装:yum install -y vim 指令:vim --version可以查看当前的版本信息,没有弹出信息就是没有安装。 装的vim是没有相关配置文件的,配置文件需要后面自己装。 之前说过,vs2019是集成软件编译…

【畅购商城】购物车模块之修改购物车以及结算

目录 购物车操作:修改 分析 接口 后端实现:更新 前端实现:修改 前端实现:全选 后端实现:删除数据 结算 跳转页面 购物车操作:修改 分析 接口 PUT http://localhost:10010/cart-service/carts 后…

python数学基础——单词统计

这个练习使用的是英文的单词统计,使用split通过单词中间的空格来做区分,在遍历的过程中通过对【字典】类型进行【字典推导式】的处理来计算每个单词出现的频次。但是由于过程中我们通过re的正则表达式来替换掉了很多的符号,并没有替换成空&am…

【网页设计】web前端期末大作业html+css

🎉精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

Day12--自定义组件-渲染my-search组件的基本结构

1.自定义搜索组件 我的操作: 1》在uni_modules中右键新建uni_modules插件: 2》看看效果图: ************************************************************************************************************** 2.在分类页面的 UI 结构中&…