Kafka详解(一)

news2025/1/23 3:21:58

第1章 Kafka概述

1.1 定义

在这里插入图片描述

1.2 消息队列

目前企业中比较常见的消息队列产品主要有Kafka、ActiveMQ、RabbitMQ、RocketMQ等。Message Queue
② 在大数据场景主要采用Kafka作为消息队列
② 在JavaEE开发中主要采用ActiveMQ、RabbitMQ、RocketMQ
Kafka存储数据,且保证数据一致性,存取速度都很快!

1.2.1 传统消息队列的应用场景

  1. 传统的消费队列的主要应用场景有:缓存/削峰、解耦、异步通信。
  2. 在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

1.2.2 消息队列的两种模式

消息队列主要分为两种模式:点对点模式和发布/订阅模式。
在这里插入图片描述

1.3 Kafka基础架构

在这里插入图片描述
1)Producer :消息生产者,就是向kafka broker发消息的客户端;
2)Consumer :消息消费者,向kafka broker取消息的客户端;
3)Consumer Group (CG):消费者组,由多个consumer组成。消费者组内每个消费者负责消费不同分区的数据,一个topic下的一个分区只能被一个消费者组内的一个消费者所消费;消费者组之间互不影响。消费者组是逻辑上的一个订阅者。
4)Broker :一台kafka服务器就是一个broker。一个broker可以容纳多个topic。
5)Topic :可以理解为一个队列,生产者和消费者面向的都是一个topic;
6)Partition:为了实现扩展性,一个非常大的topic可以分布到多个broker(即服务器)上,一个topic可以分为多个partition,每个partition是一个有序的队列;
7)Replica:副本,为保证集群中的某个节点发生故障时,该节点上的partition数据不丢失,且kafka仍然能够继续工作,kafka提供了副本机制,一个topic的每个分区都有若干个副本,一个leader和若干个follower。
8)leader:每个分区副本中的“主”,生产者发送数据的对象,以及消费者消费数据的对象都是leader。
9)follower:每个分区副本中的“从”,实时与leader副本保持同步,在leader发生故障时,成为新的leader。

第2章 Kafka快速入门

2.1 安装部署

2.1.1 集群规划

在这里插入图片描述

2.1.2 集群部署

  1. 官方下载地址:http://kafka.apache.org/downloads.html
  2. 上传安装包到102的/opt/software目录下
    [aa@hadoop102 software]$ ll
    -rw-rw-r–. 1 atguigu atguigu 86486610 3月 10 12:33 kafka_2.12-3.0.0.tgz
  3. 解压安装包到/opt/module/目录下
    [aa@hadoop102 software]$ tar -zxvf kafka_2.12-3.0.0.tgz -C /opt/module/
  4. 进入到/opt/module目录下,修改解压包名为kafka
    [a@hadoop102 module]$ mv kafka_2.12-3.0.0 kafka
  5. 修改config目录下的配置文件server.properties内容如下
    [aa@hadoop102 kafka]$ cd config/
    [aa@hadoop102 config]$ vim server.properties
#broker的全局唯一编号,不能重复,只能是数字。
broker.id=102
#处理网络请求的线程数量
num.network.threads=3
#用来处理磁盘IO的线程数量
num.io.threads=8
#发送套接字的缓冲区大小
socket.send.buffer.bytes=102400
#接收套接字的缓冲区大小
socket.receive.buffer.bytes=102400
#请求套接字的缓冲区大小
socket.request.max.bytes=104857600
#kafka运行日志(数据)存放的路径,路径不需要提前创建,kafka自动帮你创建,可以配置多个磁盘路径,路径与路径之间可以用","分隔
log.dirs=/opt/module/kafka/datas
#topic在当前broker上的分区个数
num.partitions=1
#用来恢复和清理data下数据的线程数量
num.recovery.threads.per.data.dir=1
# 每个topic创建时的副本数,默认时1个副本
offsets.topic.replication.factor=1
#segment文件保留的最长时间,超时将被删除
log.retention.hours=168
#每个segment文件的大小,默认最大1G
log.segment.bytes=1073741824
# 检查过期数据的时间,默认5分钟检查一次是否数据过期
log.retention.check.interval.ms=300000
#配置连接Zookeeper集群地址(在zk根目录下创建/kafka,方便管理)
zookeeper.connect=hadoop102:2181,hadoop103:2181,hadoop104:2181/kafka

  1. 配置环境变量
[aa@hadoop102 kafka]$ sudo vim /etc/profile.d/my_env.sh
#KAFKA_HOME
export KAFKA_HOME=/opt/module/kafka
export PATH=$PATH:$KAFKA_HOME/bin
[atguigu@hadoop102 kafka]$ source /etc/profile

  1. 分发环境变量文件并source
[aa@hadoop102 kafka]$ xsync /etc/profile.d/my_env.sh
==================== hadoop102 ====================
sending incremental file list

sent 47 bytes  received 12 bytes  39.33 bytes/sec
total size is 371  speedup is 6.29
==================== hadoop103 ====================
sending incremental file list
my_env.sh
rsync: mkstemp "/etc/profile.d/.my_env.sh.Sd7MUA" failed: Permission denied (13)

sent 465 bytes  received 126 bytes  394.00 bytes/sec
total size is 371  speedup is 0.63
rsync error: some files/attrs were not transferred (see previous errors) (code 23) at main.c(1178) [sender=3.1.2]
==================== hadoop104 ====================
sending incremental file list
my_env.sh
rsync: mkstemp "/etc/profile.d/.my_env.sh.vb8jRj" failed: Permission denied (13)

sent 465 bytes  received 126 bytes  1,182.00 bytes/sec
total size is 371  speedup is 0.63
rsync error: some files/attrs were not transferred (see previous errors) (code 23) at main.c(1178) [sender=3.1.2],
# 这时你觉得适用sudo就可以了,但是真的是这样吗?
[aa@hadoop102 kafka]$ sudo xsync /etc/profile.d/my_env.sh
sudo: xsync:找不到命令
# 这时需要将xsync的命令文件,copy/usr/bin/下,sudo(root)才能找到xsync命令
[aa@hadoop102 kafka]$ sudo cp /home/atguigu/bin/xsync /usr/bin/
[aa@hadoop102 kafka]$ sudo xsync /etc/profile.d/my_env.sh
# 在每个节点上执行source命令,如何你没有xcall脚本,就手动在三台节点上执行source命令。
[aa@hadoop102 kafka]$ xcall source /etc/profile

  1. 分发安装包
[aa@hadoop102 module]$ xsync kafka/
  1. 修改配置文件中的brokerid
    分别在hadoop103和hadoop104上修改配置文件server.properties中broker.id=103、broker.id=104

注:broker.id不得重复
[atguigu@hadoop103 kafka]$ vim config/server.properties
broker.id=103 [atguigu@hadoop104 kafka]$ vim config/server.properties
broker.id=104

  1. 启动集群
    ① 先启动Zookeeper集群
[aa@hadoop102 kafka]$ zk.sh start 

② 依次在hadoop102、hadoop103、hadoop104节点上启动kafka

[aa@hadoop102 kafka]$ bin/kafka-server-start.sh -daemon config/server.properties	
[aa@hadoop103 kafka]$ bin/kafka-server-start.sh -daemon config/server.properties	
[aa@hadoop104 kafka]$ bin/kafka-server-start.sh -daemon config/server.properties

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/630933.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

虚函数+多态实现原理(一个冷门知识)

目录 多态实现 虚函数定义 先说原理 抛出问题 探究多态底层 冷门知识 多形态的大海 多态实现 完成类多态体现,多态两个条件: 虚函数重写 父类指针或者引用去调用虚函数。 虚函数定义 虚函数重写/覆盖条件 : 函数 三同 (函数名、参数、返回值) 不符合重写&…

【板栗糖GIS】——如何使用插件将微信读书笔记同步到notion

【板栗糖GIS】——如何使用插件将微信读书笔记同步到notion 注:本文创意以及插件开发皆是B站的【三此君】 视频链接如下: 全网唯一支持图文导出的微信读书插件,升级啦!主打一个惊艳。_哔哩哔哩_bilibili ,我只是记录…

阿里内部人手一份的Spring Cloud Alibaba手册

“微服务架构经验你有吗?” 前段时间一个朋友去面试,阿里面试官一句话问倒了他。实际上,不在 BAT 这样的大厂工作,是很难接触到支撑千亿级流量微服务架构项目的。但也正是这种难得,让各个大厂都抢着要这样的人才&…

linux(信号结尾)

目录: 1.可重入函数 2.volatile关键字 3.SIGCHLD信号 -------------------------------------------------------------------------------------------------------------------------------- 1.可重入函数----------用来描述一个函数的特点的 1.在单进程当中也存…

【数据结构】图的遍历、图的应用

以下是对王道数据结构图的部分选择题的纠错 图的遍历 对于一个非连通无向图G,采用DFS访问所有顶点,在DFSTraverse函数中调用DFS的次数正好等于连通分量个数 一次遍历必然会将一个连通图中的所有顶点都访问到,对于已被访问的顶点不在调用DFS&…

APP测试中ios和Android的区别是什么~

01、常识性区别 02、导航方式 iOS:Tab放在页面底部,不能通过滑动来切换,只能点击。也有放在上面的,也不能滑动,但有些Tab本身可以滑动,比如天猫的。还有新闻类的应用。 Android:一般放在页面…

数据库实验五 函数

任务描述 本关任务:对表达式取整 相关知识 四舍五入的函数 ROUND(X,D) 返回X,其值保留到小数点后D位,而第D位的保留方式为四舍五入。 若D的值为0,则对小数部分四舍五入。 若将D设为负值,保留X值小数点左边的D位 TRUNCATE(X,D)…

《剑指 Offer--LeetCode 学习计划》-- 字符串

剑指 Offer 05. 替换空格&#xff08;Easy&#xff09; 题目描述 请实现一个函数&#xff0c;把字符串 s 中的每个空格替换成"%20"。限制&#xff1a;0 < s 的长度 < 10000。 举例说明 示例 1&#xff1a; 输入&#xff1a;s “We are happy.”。输出&…

K210图像检测(1~8)数字卡片识别

前言 第一次使用该平台。想先找一个简单的识别&#xff0c;来走走流程。就想到了&#xff0c;前几年的送药小车的数字卡片识别。花了半天收集标记图片。在运行时要注意摄像头与数字卡片的高度。不过也有些不足&#xff0c;可能是收集某个数字的训练集的时候&#xff0c;拍摄高度…

文件智能归类,让文件分类变得简单易行

在数字化信息时代&#xff0c;我们经常需要处理各种类型的文件&#xff0c;如文档、图片、视频等&#xff0c;而这些文件可能存在于不同的文件夹、不同的磁盘之间&#xff0c;管理起来十分繁琐。为了解决这个问题&#xff0c;文件智能归类管理应运而生。这种文件管理方式采用智…

公司新招了几个00后,我愿称之为卷王之王

前几天我们公司一下子也来了几个新人&#xff0c;这些年轻人是真能熬啊&#xff0c;本来我们几个老油子都是每天稍微加会班就打算走了&#xff0c;这几个新人一直不走&#xff0c;搞得我们也不好走。 2023年秋招就要开始了&#xff0c;最近内卷严重&#xff0c;各种跳槽裁员&a…

水中声源级SL的求解应用举例

水中声源级SL的求解应用举例 在水声学中&#xff0c;经常会遇到声源级的概念&#xff0c;并根据声源级的大小估计其他重要参数&#xff0c;本文举例说明声源级的概念和定义。 一、声源级的定义 声源级用来描述声音辐射源所产生声信号或噪声在1m距离处的声强量级。其定义为 S …

安卓大作业 书籍列表APP

系列文章 安卓大作业 书籍列表APP 文章目录 系列文章1&#xff0e;背景2&#xff0e;功能3. 源代码获取 1&#xff0e;背景 我做的项目是一个可以查看到书籍列表以及详情效果的内容&#xff0c;主要使用到的技术有Intent数据传递以及数据库存储的应用&#xff0c;其次使用的组…

【笔试强训选择题】Day23.习题(错题)解析

作者简介&#xff1a;大家好&#xff0c;我是未央&#xff1b; 博客首页&#xff1a;未央.303 系列专栏&#xff1a;笔试强训选择题 每日一句&#xff1a;人的一生&#xff0c;可以有所作为的时机只有一次&#xff0c;那就是现在&#xff01;&#xff01;&#xff01; 文章目录…

【编译、链接、装载四】汇编知识补充——ATT 汇编语法、寄存器、指令、栈、栈帧

【编译和链接四】编译器后端——生成汇编代码 一、AT&T 汇编语法1、Intel 汇编2、AT&T汇编 二、x86寄存器1、x86通用寄存器2&#xff0e;其他寄存器3、寄存器的具体用途 三、常见的x86指令四、栈和栈帧 一、AT&T 汇编语法 AT&T VS Intel 基于 x86 架构 的处理…

PyCaret初学者指南

&#x1f680;分类 PyCaret的分类模块是一个监督机器学习模块&#xff0c;用于将元素分类到组中。 目标是预测离散和无序的类别标签。一些常见的用例包括预测客户违约&#xff08;是或否&#xff09;、预测客户流失&#xff08;客户将离开或留下&#xff09;、发现疾病&#x…

深入理解深度学习——注意力机制(Attention Mechanism):基础知识

分类目录&#xff1a;《深入理解深度学习》总目录 相关文章&#xff1a; 注意力机制&#xff08;AttentionMechanism&#xff09;&#xff1a;基础知识 注意力机制&#xff08;AttentionMechanism&#xff09;&#xff1a;注意力汇聚与Nadaraya-Watson核回归 注意力机制&#…

『DevOps』如何使用 Webhook 在 Jenkins 项目中实现自动构建

&#x1f4e3;读完这篇文章里你能收获到 全文采用图文形式讲解在Jenkins配置Webhook实现代码推送时Jenkins自动构建感谢点赞收藏&#xff0c;避免下次找不到~ 文章目录 一、插件安装及配置1. 安装Generic Webhook Trigger Plugin2. 配置Webhook接收器 二、代码托管平台设置1. …

从新手到专家——我对于计算机科学专业的经验分享

在我的计算机科学专业学习之旅中&#xff0c;我遇到了无数的难题和挑战&#xff0c;但也因此积累了许多宝贵的经验。今天&#xff0c;我想要分享我在这个领域中的经验和看法&#xff0c;希望能够对即将进入计算机科学专业的后辈们有所帮助。 坚持动手实践 计算机科学是一个实…

Python调试串口设备Ortec 974A

Ortec 974A四通道100HMz计时/计数器的介绍在以下连接中&#xff1a; O​​​​​​​Ortec -- 974A 四通道100-MHz计时器/计数器_yuyuyuliang00的博客-CSDN博客 1、调试准备工作 1&#xff09;一个串口服务器 根据Ortec 974A的串行通信参数&#xff0c;对串口服务器进行设…