关于消息队列的那些事

news2025/1/11 4:52:16

目录

  • 为什么需要消息队列
    • 1.异步处理
    • 2.服务解耦
    • 3.流量控制
  • 消息队列
    • 1.两种模型
    • 2.基本原理
    • 3.常见问题

本篇文章参考文献如下:

面试题:如何保证消息不丢失?处理重复消息?消息有序性?消息堆积处理? (qq.com)

超详细的RabbitMQ入门,看这篇就够了!-阿里云开发者社区 (aliyun.com)

在这里插入图片描述

为什么需要消息队列

在日常当中,消息队列往往指的是消息中间件,它主要的功能就是用来存放消息,便于应用之间的消息通信

”对象之间的关系远比对象本身要重要“

在过去业务量小的时候,企业用的都是单机架构,直接一台单机就能满足日常业务的需求了

随着互联网的不断发展,公司的业务体量不断扩大,老旧的单机架构已经不能满足日常需求了,于是分布式、微服务这些新架构新方法不断涌现出来

这也意味着成千上百服务之间的依赖、调用关系越来越复杂,这时候我们迫切的需要一个【中间件】来解耦服务之间的关系,控制资源的合理合时分配以及缓冲流量高峰等等

消息队列应运而生,消息队列的三大经典场景——异步处理、服务解耦、流量控制

1.异步处理

你负责公司的一个电商项目,业务初期只是一个很简单的流程:用户下单支付—>扣库存—>下单成功

在这里插入图片描述
后面来了个产品经理跟你说要搞个积分系统,问题不大,流程里多加一步就行了

结果你发现产品经理并不满足于此,又来找你说要搞个优惠券系统,你咬咬牙说:行!整就完事了

再后来产品经理一脸邪笑的找到你,下单成功之后我们需要给用户发送短信,再搞个短信服务吧嘿嘿嘿

你薅了薅自己日渐稀疏的发顶,不禁感叹世事无常大肠包小肠…

到后面你的项目流程就如下图右边所示(在现实的电商项目中,涉及到的流程可比这个复杂多了)

在这里插入图片描述
如果按照这个流程来执行,时间可不是一般的长,用户到时候就会发现我在你这买个东西要花几十秒,什么垃圾软件,爬!

既然流程长了会导致时间变长,但我们可以将其中一些流程同时做呀——用户下单成功之后,我去检验优惠券的同时还能去增减积分,还能发个短信

怎么实现异步呢?消息队列!

在这里插入图片描述
相对于扣库存和下单,积分和短信是没有必要这么的“及时”,因此你只需要在支付后的那个流程,扔个消息到消息队列当中就可以直接返回响应给客户端了,不需要再等待积分、优惠券、短信服务

而积分、优惠券、短信服务就可以去消费这条消息,执行之后的流程

有了消息队列,用户只需要很短时间内就知道自己支付成功了,至于短信和积分这些非必要服务,迟几秒并不会特别影响用户的使用体验

2.服务解耦

上面的电商场景中已经有了——积分服务、优惠券服务、短信服务

万一后面可能又来个营销服务、活动期间再弄个促销服务等等等等…

随着服务越来越多,就需要经常的修改支付服务的下游接口,任何一个下游服务接口的变更都可能会影响到订单服务的代码

为了解决服务之间的依赖关系,降低服务间的耦合度,我们可以在支付服务和下游的服务中间加一个消息队列

支付服务只需要把订单、支付相关消息塞到消息队列当中,下游的服务谁需要这个消息自己去获取就行了

这样无论下游添加了什么服务,都不会影响上游的订单服务

在这里插入图片描述

3.流量控制

在平常的业务场景中,你的流量很低,但是一旦遇到秒杀活动、双十一活动这些大流量的场景

尤其是在某一时刻(例如 00:00)流量如洪水猛兽一样疯狂怼进来,你的服务器、MySQL、Redis各自的性能都是不一样的

你肯定不能将全部的流量请求照单全收,很容易会将性能低的服务器直接打挂

所以需要引入一个中间件来做缓冲,消息队列是一个很好的选择

先将请求放到消息队列当中,后端服务就尽自己最大的能力去消息队列中消费请求,对于超时的请求,可以直接返回错误。这样可以防止在高峰期大量的请求直接导致后端服务器崩溃

总结:

  • 消息队列通常指的是消息队列中间件,它负责存放消息,便于应用之间的消息通信(可以理解为情报中转站)
  • 消息队列三大应用场景:异步、削峰、解耦

消息队列

看看维基百科是怎么描述的

In computer science, message queues and mailboxes are software-engineering components typically used for inter-process communication (IPC), or for inter-thread communication within the same process. They use a queue for messaging – the passing of control or of content. Group communication systems provide similar kinds of functionality.

消息是指两个应用间传递的数据,数据的类型有很多种,可能只是文本、也有可能是对象

消息队列指的是在消息传输的过程中用来保存消息的容器(组件)

消息队列中,有下面两个角色:

  • 生产者(producer):负责生产数据并传输到消息队列,至于谁去取消息,生产者并不关心
  • 消费者(consumer):负责从消息队列中取出数据,至于数据是谁生产的,消费者并不关心

在这里插入图片描述
市面上主流的消息队列中间件

特性ActiveMQRabbitMQRocketMQKafka
单机吞吐量万级;比RaabitMQ、Kafka低一个数量级同ActiveMQ十万级;支持高吞吐十万级、高吞吐;一般配合大数据类的系统来进行实时数据计算、日志采集等场景
topic数量对吞吐量的影响\\topic可以达到几百/几千级别,吞吐量会有较小幅度的下降topic从几十到几百的时候,吞吐量会大幅度下降;同等机器下尽量保证topic 数量不要过多
时效性毫秒级微秒级、延迟最低 RabbitMQ特性毫秒级毫秒级以内
可用性高,基于主从架构高,基于主从架构非常高 分布式架构非常高、分布式、一个数据多个副本
消息可靠性有较低的概率丢失数据基本不丢可以通过参数优化做到零丢失基本不丢
功能支持功能完备性能好,延时低功能完善功能简单
社区活跃度

1.两种模型

  • 队列模型

生产者往某个队列里发送消息,一个队列可以存储多个生产者的消息,一个队列也可以有多个消费者

但是消费者之间是竞争关系,即每条消息只能被一个消费者消费

在这里插入图片描述

  • 发布/订阅模型

在队列模型中,每条消息只能被一个消费者所消费,为了解决这一问题,让一条消息能被多个消费者消费,发布/订阅模型诞生了

在发布/订阅模型当中,会将消息发送到一个 topic(主题)中,所有订阅了这个 topic 的消费者都能消费到这条消息

在这里插入图片描述
就好比队列模型就是你在微信上跟别人私聊,你发送的消息只能被你私聊的那个人收到;发布/订阅模型就相当于你创建了一个群聊,把大家都拉进群里,只要是在群里的(订阅了 topic)都能收到你发的消息

那有的人就会想,我对好多人私聊,并且发的都是相同的信息,不是也能够实现一条消息被多个消费者消费的功能吗

很聪明!在队列模型里,可以使用多队列来全量存储相同的消息,然后不同的消费者去不同的队列里消费

通过数据的冗余实现一条消息被多个消费者消费的功能

RabbitMQ 中通过 exchange 模块将消息发送到多个队列,解决一条消息能被多个消费者消费的问题

总结:

  • 队列模型中,一条消息只能被一个消费者消费;发布/订阅模型中,一条消息可以被多个消费者消费
  • 队列模型中,可以通过数据冗余(一条消息存储到多个队列当中)来实现一条消息可以被多个消费者消费(RabbitMQ就是采用这种模式)
  • RabbitMQ 采用队列模型、RocketMQ 和 Kafka 采用发布/订阅模型

2.基本原理

生产者:Producer

消费者:Consumer

消息队列服务端:Broker

消息由 Producer 发往 Broker,Broker 将消息存储至本地,然后 Consumer 从 Broker拉取消息,或者由 Broker 推送消息给 Consumer,最后实现消费

发布/订阅模型中,为了提高并发,还会引入队列或者分区的概念——将消息发往一个 topic 中的某个队列或者某个分区(队列和分区本质一样,叫法不一样)

例如某个 topic 下有 n 个队列,那么这个主题的并发度就提高 n,同时可以支持 n 个消费者并行消费该 topic 中的消息

通常采用轮询 或者 key hash 取余等策略来将同一个 topic 的消息分配到不同的队列当中

既然是一对多的关系,那么消费者一般都有组的概念(Consumer group),即一条消息会发送到订阅了这个 topic 的消费组

例如现在有 Group1 和 Group 2 两个消费组,都订阅了 topic1 ,如果有一条消息发送到 topic1,那么这两个消费组都能接收到这条消息;消息其实是存储到了 topic1 中的某个队列当中,消费组的某个消费者对应消费一个队列的消息

实际上,一条消息在 Broker 中只会有一份,每个 Consumer group 会有自己的 offset (偏移量)来标识消费到的位置

在 offset 前的消息表示已经消费过了,每个 Consumer group 都会维订阅的 topic 下的每个队列的 offset

在这里插入图片描述

3.常见问题

如何保证消息不丢失

我们知道,从生产者生产消息到消费者消费消息,会经历三个阶段——生产消息、存储消息、消费消息。为了让消息不丢失,我们需要从这三个阶段进行考虑

  • 生产消息

producer 发送消息到 broker ,需要处理 broker 的响应,无论是同步还是异步发送消息,都需要处理好 broker 的响应

如果 broker 返回写入失败等错误消息,需重新发送,当多次发送失败后需要进行故障处理

  • 存储消息

在这个阶段,broker 需要在消息刷盘之后再给 producer 响应

假设消息写到缓存中就给 producer 响应,这个时候 broker 突然断电或者故障,就会导致消息丢失,而 producer 接收到 broker 的响应就会认为该消息已经发送成功了

如果 broker 是分布式架构的话,有副本机制(即消息不仅要写入当前 broker,还要写入副本机)那就应该设置成至少写入两台 broker 后再给 producer 响应

这样基本上就能保证存储的可靠性了

  • 消费消息

Consumer 应该在执行完过程之后再给 broker 返回响应,而不是在拿到消息并放到内存后就立马给 broker 返回响应,这才是真正的消费了

万一这个时候 Consumer 出现故障或者断电,这条消息其实是没有走完整个业务流程的,而 broker 以为 Consumer 已经拿到数据并处理了

如何处理重复消息

先来看看为什么会有消息重复

假设 producer 发送消息不管 broker 的响应,只管生产,这样的情况下是不会出现消息重复的

但这样会导致另一个问题——消息不可靠

所以我们规定消息至少得发到 broker 上,并等待 broker 的响应,那么就有可能出现这个问题——消息已经发送到 broker 上并且 broker 返回响应给 producer ,但是由于网络问题这个响应并没有被 producer 收到,然后 producer 由重发了一次,这时候消息就会重复了

又假设 consumer 已经拿到消息了,并且走完业务流程此时需要更新 offset ,好巧不巧的是这个 consumer 挂掉了,另一个 consumer 来顶上,但这个 consumer 是没有消费的,于是会拿到刚刚那条消息重新走一遍业务,于是消息又重复了

由此可见——为了保证消息的可靠性,消息重复是无法避免的

那么如何处理重复消息呢?

幂等处理重复消息,幂等指的是任意多次执行所产生的影响均与一次执行的影响相同

通俗来讲,就是说通过幂等的方法来处理重复消息,无论你用同样的参数调用这个接口调用多少次的结果都是一个

比如说:

  • 通过数据库的约束(唯一键)
  • 记录关键的 key,对于一些关键的 key,给它一个唯一 ID

如何保证消息的有序性

  • 全局有序

如果要保证消息的全局有序,首先只能有 producer 往 topic 发送消息,并且一个 topic 内部只能有一个队列(分区)

consumer 也必须是单线程消费这个队列

在这里插入图片描述

  • 部分有序

为了实现部分有序,我们将 topic 内部划分出多个队列,然后通过特定策略将消息发往固定队列当中

每个队列对应一个单线程处理的 consumer ,这样既能够实现部分有序,又能够提高并发

在这里插入图片描述
如何处理消息堆积

往往 consumer 的消费速度跟 producer 的生产速度不一致(consumer消费能力弱 or consumer 消费失败导致反复重试)就会导致消息堆积的问题

一方面,对 consumer 进行优化。先定位消费慢的原因,是因为 consumer 的业务出现 bug 还是说本身消费能力就不太行,例如消费逻辑是一条一条处理或者说是单线程处理,那我们就可以在这方面进行优化

或者增加 consumer 的数量,水平扩容来实现暴力解决问题

另一方面,对 broker 进行优化。增加 topic 的队列(分区)数

PS:队列数增加后要相应地增加 consumer 的数量,不然生产的数据没人来消费

使用消息队列后会带来什么问题

凡是都有两面性,虽然消息队列可以帮助我们很好地提高系统性能,降低耦合度,但是依旧会带来一些不可避免的问题

  1. 可用性降低

在没有使用消息队列中间件之前,你不需要考虑消息丢失或者消息队列中间件出现故障宕机这些情况,使用了之后你就要去考虑如何保证消息队列中间件的高可用

  1. 复杂性提高

使用了消息队列中间件之后,需要考虑消息有没有被重复消费、消息是不是有序传递,如何处理消息丢失的情况等等问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/28349.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据通信】具有路由 WSN 模拟器的随机方式移动(Matlab代码实现)

👨‍🎓个人主页:研学社的博客 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜…

Yolov5的类激活图

在本教程中,我们将了解如何将 EigenCAM(无梯度方法之一)用于 YOLO5。 这是https://github.com/jacobgil/pytorch-grad-cam/blob/master/tutorials/Class Activation Maps for Object Detection With Faster RCNN.ipynb 中 适用于 YOLO5的教程…

堆排序(算法实现)

文章目录堆排序-算法实现1. 向上调整和向下调整比较2. 堆排序1. 升序2. 降序堆排序-算法实现 前面介绍了堆的基本功能实现(https://blog.csdn.net/m0_46343224/article/details/127986662),了解了堆,这里用堆实现排序 1. 向上调整和向下调整比较 思考&a…

1. pip和conda的区别

Pip 或者 conda的时候经常被混合使用,这两者也通常被认为是几乎相同的,尽管他们的很多功能是重叠的,但它们的设计和使用目的不同。所以这次参考官方的解释,来进行如下总结和归纳:附上官方解释:conda和pip的…

关于Python的局部变量和全局变量使用介绍

局部变量:在函数中定义的变量,作用域是当前函数,只对当前函数起作用。 全局变量:在代码开头定义的变量,作用域是整段代码,对整段代码起作用。 先看下面的实例, 最后给结论。 name ‘PythonTa…

月薪9K和年薪30W的职位,有什么区别?

【浙江杭州】加速科技 测试开发工程师(15-30W/年) 岗位职责: 1、根据产品的需求编写测试用例,搭建软硬件联合测试环境; 2、对研发的模块/系统进行测试并输出测试报告; 3、整理并定期提交buglist&#…

我的PFC岩土颗粒流离散元分析攻略(附赠学习资料)

作者 | Lobby ,仿真秀专栏作者 导读:lobby曾是国内“双一流“”院校本硕连读土木专业的大学生,现在从事土木相关的研发工作。目前在仿真秀官网发布过数十篇付费文章,含金量颇高,受到用户的好评。本期我们将带来lobby老…

差分 【一维差分和二维差分】

全文目录🤔一维差分😕差分数组的构建🤔二维差分😕差分矩阵的构建🤔一维差分 首先来了解一下差分的性质,差分是前缀和的逆运算,如果说前缀和是:S f(n) ,那么差分就是 D …

轻松拿下——类的默认成员函数

六大默认成员函数: 1、初始化:构造函数主要完成初始化工作 2、清理:析构函数主要完成清理工作 3、拷贝复制:拷贝构造是使用同类对象初始化创建对象 4、拷贝复制:赋值重载主要是把一个对象赋值给另一个对象&#xff…

linux文件压缩、解压缩以及归档

一、文件压缩、解压缩 1.linux compress命令(compress/uncompress) (1)压缩文件: [rootserver ~]# du -sh passwd1---查看文件大小 [rootserver ~]# time compress passwd1---time:查看时间 compress&…

医学主题词表(Medical Subject Headings, MeSH)

Medical Subject Headings 简称MeSH,由美国国立医学图书馆(NLM出版),是目前最权威最常用的标准医学主题词表。 MeSH由范畴表(Categories and Subcategories)、字顺表(Alphabetic listing&#…

AI 边缘计算平台 - 爱芯元智 AX620A 爱芯派开箱

最近疫情有点猛,宅在家里,没事找点事干,撸撸板子吧。 拿出来趁着双 11 优惠,花了 520 RMB / 块,买的两块爱芯派(套餐),来个开箱贴,顺便测试一下开发板的串口、网口、音频…

智慧井盖解决方案-最新全套文件

智慧井盖解决方案-最新全套文件一、建设背景行业痛点二、建设思路三、建设方案四、获取 - 智慧井盖全套最新解决方案合集一、建设背景 城市井盖是每个城市管理的难点,井盖数量多,容易发生井盖破损或丢失后出现人员与财产损失。给群众生命财产带来损害。…

基于Netty的高性能API网关设计

0. 本文目的 对于网关设计,业界已有很多成熟的解决方案,开箱即用或者稍作自定义都能满足需求。本文主要是通过网关需求了解底层netty的使用,所以重心在netty的实践使用上。 1. 什么是网关 网关(Gateway)又称网间连接器、协议转换器。网关在…

基于球向量的粒子群优化(SPSO)算法在无人机路径规划中的实现(Matlab代码实现)

👨‍🎓个人主页:研学社的博客 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜…

PyTorch for Audio + Music Processing(2/3/4/5/6/7) :构建数据集和提取音频特征

基于Torchaudio构建数据集 文章目录基于Torchaudio构建数据集前言02 Training a feed forward network03 Making predictions04 Creating a custom dataset05 Extracting Mel spectrograms06 Padding audio files07 Preprocessing data on GPU一、下载数据集文件目录标注格式二…

19 【RTK Query】

19 【RTK Query】 1.目前前端常见的发起 ajax 请求的方式 1、使用原生的ajax请求2、使用jquery封装好的ajax请求3、使用fetch发起请求4、第三方的比如axios请求5、angular中自带的HttpClient 就目前前端框架开发中来说我们在开发vue、react的时候一般都是使用fetch或axios自…

web前端期末大作业【 大学生抗疫感动专题网页设计】HTML+CSS

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

Prometheus 使用cadvisor采集docker容器监控数据

Prometheus采集主机监控参考部署下载,图形生成 系统安装Grafana downloadWindows参考图形生成参考win_exporterLinux参考node_exporterMysql参考Mysql_exporterSQL Server参考SQL exporterRedis 参考Redis_exportercadvisor参考cadvisor snmp_exporter 参考图形展示…

Redis详细教程

【尚硅谷】2021最新版Redis详细教程(基于Redis 6.2.x版本) 文章目录 一、前言二、NoSQL数据库简介 1.技术发展 1.1 Web1.0时代1.2 Web2.0时代1.3 解决CPU及内存压力1.4 解决IO压力 2.NoSQL数据库 2.1 NoSQL数据库概述2.2 NoSQL适用场景2.3 NoSQL不适用…