大数据 - Kafka系列《一》- Kafka基本概念

news2024/11/25 2:54:24

目录

🐶1.1 什么是kafka

🐶1.2 Kafka可以用来做什么

🐶1.3 kafka的特点

🥙1. 高吞吐量、低延迟

🥙2. 可扩展性

🥙3. 持久性、可靠性

🥙4. 容错性

🥙5. 高并发

🐶1.4 Kafka的基本架构

1. 🥙Producer:生产者

2. 🥙Broker:中间组件,存储数据

Topic:主题。类似于表的概念

partition:分区。类似于hbase里面的region的概念

3. 🥙Consumer:消费者

4. 🥙Zookeeper


🐶1.1 什么是kafka

Kafka 最初是由 LinkedIn 即领英公司基于 Scala 和 Java 语言开发的分布式消息发布-订阅系统,现已捐献给Apache 软件基金会。其具有高吞吐、低延迟的特性,许多大数据实时流式处理系统比如 Storm、Spark、Flink等都能很好地与之集成。

一句话概括:Kafka 是一个分布式的基于发布/订阅模式的消息中间件,遵循先进先出的原则,分区内严格有序,但是不能保证全局的有序。

在业界主要应用于大数据实时流式计算领域,起解耦合和削峰填谷的作用。

🐶1.2 Kafka可以用来做什么

总的来讲,Kafka 通常具有 3 重角色:

  • 存储系统:通常消息队列会把消息持久化到磁盘,防止消息丢失,保证消息可靠性。Kafka 的消息持久化机制和多副本机制使其能够作为通用数据存储系统来使用。正常在公司都是存储的json串。

  • 消息系统Kafka 和传统的消息队列比如 RabbitMQ、RocketMQ、ActiveMQ 类似,支持流量削峰、服务解耦、异步通信等核心功能。

  • 流处理平台(不主流)Kafka 不仅能够与大多数流式计算框架完美整合,并且自身也提供了一个完整的流式处理库,即 Kafka Streaming。Kafka Streaming 提供了类似 Flink 中的窗口、聚合、变换、连接等功能。

 

🐶1.3 kafka的特点

🥙1. 高吞吐量、低延迟

kafka每秒可以处理几十万条消息,它的延迟最低只有几毫秒,每个topic可以分多个partition, 由多个consumer group 对partition进行consume操作。

🥙2. 可扩展性

kafka集群支持热扩展

热扩展是指在系统运行时,无需停机或中断服务的情况下,向系统添加新的资源或节点。对于Kafka集群来说,热扩展意味着可以在不影响正在进行的生产和消费操作的情况下,动态地增加新的Broker节点来提高系统的吞吐量和容量。

🥙3. 持久性、可靠性

消息被持久化到本地磁盘,并且支持数据备份防止数据丢失

🥙4. 容错性

允许集群中有节点失败(若副本数量为n,则允许n-1个节点失败)

🥙5. 高并发

支持数千个客户端同时读写

Kafka在各种应用场景中,起到的作用可以归纳为这么几个术语:削峰填谷,解耦

在大数据流式计算领域中,kafka主要作为计算系统的前置缓存和输出结果缓存;

🐶1.4 Kafka的基本架构

1. 🥙Producer:生产者

往broker里面写入数据

2. 🥙Broker:中间组件,存储数据
Topic:主题。类似于表的概念
partition:分区。类似于hbase里面的region的概念

副本:leader,follower

3. 🥙Consumer:消费者

从broker里面读出数据

4. 🥙Zookeeper

用来和kafka一起管理整个集群,存储元数据信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1393883.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

国产阿里的Copilot能提效30%吗?

国产阿里的Copilot能提效30%吗? Copilot简介 GitHub 和 OpenAI 共同打造的一款编程神器–Copilot, 这是一款立足于人工智能技术的编程助手。在此基础上,借助于 GitHub 庞大的代码库和来自全球的开源社区帮助,搭配 OpenAI 在自然…

日志项目1

文章目录 【C - 基于多设计模式下的同步&异步日志系统】项目介绍 前置技术1. 项目介绍2. 开发环境3. 核心技术4. 环境搭建5. 日志系统介绍5.1 为什么需要日志系统5.2 日志系统技术实现5.2.1 同步写日志5.2.2 异步写日志 6. 前置技术补充6.1 不定参函数6.1.1 不定参宏函数6…

7.6 MySQL基本函数的使用(❤❤❤)

7.6 MySQL基本函数的使用 1. 提要2. 数字函数3. 字符函数3.1 替换字符3.2 左填充字符及截取字符串 4. 日期函数4.1 日期函数4.2 表达式占位符4.3 日期偏移计算4.4 日期间隔 5. 条件函数5.1 IF语句5.2 case...when语句 1. 提要 2. 数字函数 3. 字符函数 3.1 替换字符 -- INSERT…

FPGA引脚选择(Select IO)--认知1

主要考虑功能角度(速度,电平匹配,内部程序编写)去找研究芯片内部资源 1. 关键字 HP I/O Banks, High performance The HP I/O banks are deisgned to meet the performance requirements of high-speed memory and other chip-to-…

软件测试|使用Python轻松裁剪视频

简介 裁剪视频是在视频编辑和处理中常见的任务之一,Python提供了多种库和工具,可以用来裁剪视频。在本文中,我们将详细讨论如何使用Python来裁剪视频,并提供示例代码。 步骤1:环境准备 首先,我们要安装必…

如何使用CureIAM自动清理GCP基础设施中的IAM账号权限

关于CureIAM CureIAM是一款针对GCP基础设施的账号权限安全检查与管理工具,该工具易于使用,是一个功能强大且易于使用的可靠高性能引擎。在该工具的帮助下,广大研究人员能够以自动化的形式在GCP云基础设施上实践最低权限原则。 CureIAM可以允…

如何在Linux运行RStudio Server并实现Web浏览器远程访问

🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ​💫个人格言:“没有罗马,那就自己创造罗马~” 文章目录 前言1. 安装RStudio Server2. 本地访问3. Linux 安装cpolar4. 配置RStudio server公网访问地址5. …

自建服务器如何备案?

随着互联网的普及和发展,越来越多的人开始考虑自建服务器。然而,在中国大陆地区,自建服务器需要进行备案。本文将介绍自建服务器备案的流程、所需材料以及注意事项。 一、备案流程 确定备案地区 根据《中华人民共和国计算机信息网络国际联网…

khbc靶场小记(upload 666靶场)

尝试上传正常的png jpg gif php的格式的文件发现老是提示烦人的消息(上传不成功); 通过抓包对MIME进行爆破没爆出来,当时可能用成小字典了; 猜测可能是把后缀名和MIME绑定检测了; 反正也没思路,…

归并排序(C语言)

目录 1.归并排序图解 2.归并排序(递归版) 3.归并排序(非递归版) 1.归并排序图解 归并排序的核心思想是让左右两边有序的部分进行合并比较排序,具体什么意思呢?分两点: 1.分:左右两边…

SwitchyOmega插件管理海外動態IP代理設置教程

SwitchyOmega插件很好解決了管理多個代理並在它們之間切換的問題,通過本文來全面瞭解SwitchyOmega,比如SwitchyOmega插件的用途、它的主要功能和應用、怎麼下載和使用,如何管理海外動態IP代理。 SwitchyOmega插件有什麼用途? Swit…

扫描电子显微镜在材料失效分析中的主要作用

扫描电子显微镜(Scanning Electron Microscope,简称SEM)是一种高分辨率的显微镜,能够在纳米级别上观察样品的表面形貌和微观结构。在材料失效分析中,SEM起着至关重要的作用,为深入理解材料的性质和失效机制…

excel统计分析——Scheffe法多重比较

参考资料:生物统计学 Scheffe法(雪费法)多重比较和LSD法一致,但通过k-1作为F分布的第一自由度对临界值进行调整: 其中,k为处理水平数,df为误差自由度;为 excel操作步骤如下&#xf…

ADSelfService Plus 推出离线多因素身份验证以提升远程工作安全性

采用先进验证方法,确保在任何时间、地点或连接问题下对业务数据的合法访问即使远程用户未连接到身份验证服务器或互联网,也可通过MFA安全认证。 MFA 得克萨斯州德尔瓦雷 — 2023年5月3日 — Zoho Corporation 旗下的企业IT管理部门ManageEngine今日宣布…

rust让你的python飞起来!

Note: 本文作为入门教程,抛砖引玉,帮你初步了解如何使用rust为python写扩展模块,涉及从头到尾的详细步骤,基于此,剩下的只有深入rust,才能做得更好。 众所周知,python性能比较差,尤其…

自动驾驶轨迹规划之碰撞检测(三)

欢迎大家关注我的B站: 偷吃薯片的Zheng同学的个人空间-偷吃薯片的Zheng同学个人主页-哔哩哔哩视频 (bilibili.com) 目录 1.基于圆覆盖 2.BVH 3.MATLAB自动驾驶工具箱 4 ROS内置的模型 自动驾驶轨迹规划之碰撞检测(一)-CSDN博客 自动驾…

性价比高的宠物空气净化器有哪些?五款猫用空气净化器测评推荐!

作为一位经验丰富的铲屎官,我深切理解养猫后家里到处都是猫毛和异味的困扰。养猫后,家里的空气质量往往变得不佳,猫毛和皮屑漫天飞舞。而如今,室内空气质量普遍较差,受到雾霾、螨虫和甲醛等污染。长期处于低质量的室内…

postman测试文件上传接口设置说明

Postman介绍及下载链接地址 Download Postman | Get Started for Free 打开postman 选择POST方法,然后设置goform 设置Header参数 设置Body参数,选择数据form-data 添加文件, 选择为文件属性 添加需要上传的文件

【备战蓝桥杯】吃奶酪问题 / 超硬核,文附template拓展知识!

蓝桥杯备赛 | 洛谷做题打卡day9 文章目录 蓝桥杯备赛 | 洛谷做题打卡day9再来了解一下状压dp**简介(Introduction)****描述(Description)** - 吃奶酪题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 提示数据规模与约定提示 * template拓展知识我的一些话 【引入】今天…

sftp配置互信:sftp免密登录

一、安装ssh 使用yum命令安装或者去ssh官网下载进行安装 yum install openssh.x86_64二、设置免密 在asd(192.168.47.130)通过ssh或者sftp登录demo(192.168.47.140) shh免密登录有俩种方式 1、生成ssh公钥以及私钥 俩台服务器都不要生成 ssh-keygen在asd执行 在demo执行 …