文章目录
- 1 消息队列
- 1.1 MQ的概念
- 基本介绍
- 使用原因
- MQ分类
- 如何选择
- 1.2 RabbitMQ
- RabbitMQ核心
- 工作原理
- 安装教程
1 消息队列
1.1 MQ的概念
基本介绍
- MQ本质是个队列,FIFO 先入先出,只不过队列中存放的内容是 message 而已
- 是一种跨进程的通信机制,用于上下游传递消息。
- 在互联网架构中,MQ 是一种常见的上下游“逻辑解耦+物理解耦”的消息通信服务。
- 使用 MQ 之后,消息发送上游只需要依赖 MQ,不 用依赖其他服务。
使用原因
流量消峰
订单系统为例
如果订单系统最多能处理一万次订单,这个处理能力应付正常时段的下单时绰绰有余,正常时段我们下单一秒后就能返回结果。
但是在高峰期,如果有两万次下单操作系统是处理不了的,只能限制订单超过一万后不允许用户下单。使用消息队列做缓冲,我们可以取消这个限制,把一秒内下的订单分散成一段时间来处理,这时有些用户可能在下单十几秒后才能收到下单成功的操作,但是比不能下单的体验要好。
应用解耦
电商应用为例,
应用中有订单系统、库存系统、物流系统、支付系统。用户创建订单后,如果耦合调用库存系统、物流系统、支付系统,任何一个子系统出了故障,都会造成下单操作异常。
当转变成基于消息队列的方式后,系统间调用的问题会减少很多,比如物流系统因为发生故障,需要几分钟来修复。在 这几分钟的时间里,物流系统要处理的内存被缓存在消息队列中,用户的下单操作可以正常完成。当物流 系统恢复后,继续处理订单信息即可,中单用户感受不到物流系统的故障,提升系统的可用性。
异步处理
有些服务间调用是异步的,例如 A 调用 B,B 需要花费很长时间执行,但是 A 需要知道 B 什么时候可以执行完,
A 调用 B 服务后,只需要监听 B 处理完成的消息,当 B 处理完成后,会发送一条消息给 MQ,MQ 会将此 消息转发给 A 服务。这样 A 服务既不用循环调用 B 的查询 api,也不用提供 callback api。同样 B 服务也不 用做这些操作。A 服务还能及时的得到异步处理成功的消息。
MQ分类
ActiveMQ
-
优点:
- 单机吞吐量万级,时效性 ms 级,可用性高,基于主从架构实现高可用性,消息可靠性较低的概率丢失数据
-
缺点:
- 官方社区现在对 ActiveMQ 5.x 维护越来越少,高吞吐量场景较少使用。
Kafka
-
优点: 性能卓越,单机写入 TPS 约在百万条/秒
- 最大的优点,就是吞吐量高。
- 时效性 ms 级可用性非常高,kafka 是分布式的,一个数据多个副本,少数机器宕机,不会丢失数据,不会导致不可用,消费者采 用 Pull 方式获取消息,消息有序,通过控制能够保证所有消息被消费且仅被消费一次
- 有优秀的第三方 Kafka Web 管理界面 Kafka-Manager
- 在日志领域比较成熟,被多家公司和多个开源项目使用;
-
缺点:
- Kafka 单机超过 64 个队列/分区,Load 会发生明显的飙高现象,队列越多,load 越高,发送消息响应时间变长,使用短轮询方式,实时性取决于轮询间隔时间,消费失败不支持重试;
- 支持消息顺序, 但是一台代理宕机后,就会产生消息乱序,社区更新较慢;
-
功能支持:
- 功能较为简单,主要支持简单的 MQ 功能,在大数据领域的实时计算以及日志采集被大规模使用
RocketMQ
-
优点:
- 单机吞吐量十万级,可用性非常高,分布式架构,消息可以做到 0 丢失
- MQ 功能较为完善,还是分 布式的,扩展性好,支持10 亿级别的消息堆积,不会因为堆积导致性能下降
-
缺点:
- 支持的客户端语言不多,目前是 java 及 c++
- 社区活跃度一般,没有在 MQ 核心中去实现 JMS 等接口,有些系统要迁移需要修改大量代码
RabbitMQ
-
优点:
- 由于 erlang 语言的高并发特性,性能较好
- 吞吐量到万级,MQ 功能比较完备,健壮、稳定、易用、跨平台、支持多种语言 如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP 等,支持 AJAX 文档齐全
- 开源提供的管理界面非常棒,用起来很好用,社区活跃度高
- 更新频率相当高
-
缺点:
- 商业版需要收费,学习成本较高
如何选择
Kafka
Kafka 主要特点是基于 Pull 的模式来处理消息消费,追求高吞吐量,一开始的目的就是用于日志收集 和传输,适合产生大量数据的互联网服务的数据收集业务。
RocketMQ
天生为金融互联网领域而生,对于可靠性要求很高的场景,尤其是电商里面的订单扣款,以及业务削峰,在大量交易涌入时,后端可能无法及时处理的情况。RoketMQ 在稳定性上可能更值得信赖
RabbitMQ
结合 erlang 语言本身的并发优势,性能好时效性微秒级,社区活跃度也比较高,管理界面用起来十分方便
1.2 RabbitMQ
RabbitMQ概念
RabbitMQ是由erlang语言开发,基于AMQP(Advanced Message Queue 高级消息队列协议)协议实现的消息队列,它是一种应用程序之间的通信方法,消息队列在分布式系统开发中应用非常广泛
核心概念
生产者
产生数据发送消息的程序是生产者
交换机
- 一方面它接收来自生产者的消息,另一方面它将消息推送到队列中
- 交换机必须确切知道如何处理它接收到的消息,是将这些消息推送到特定队列还是推送到多个队列,亦或者是把消息丢弃,这个得有交换机类型决定
消费者
消费者大多时候是一个等待接收消息的程序。请注意生产者,消费者和消息中间件很多时候并不在同一机器上。同一个应用程序既可以是生产者又是可以是消费者。
队列
- 队列是 RabbitMQ 内部使用的一种数据结构,尽管消息流经 RabbitMQ 和应用程序,但它们只能存 储在队列中
- 队列仅受主机的内存和磁盘限制的约束,本质上是一个大的消息缓冲区
- 许多生产者可 以将消息发送到一个队列,许多消费者可以尝试从一个队列接收数据。这就是我们使用队列的方式
RabbitMQ核心
工作原理
Connection:
publisher/consumer 和 broker 之间的 TCP 连接
Channel:
- 如果每一次访问 RabbitMQ 都建立一个 Connection,在消息量大的时候建立 TCP Connection 的开销将是巨大的,效率也较低
- Channel 是在 connection 内部建立的逻辑连接,如果应用程序支持多线程,通常每个 thread 创建单独的 channel 进行通讯,AMQP method 包含了 channel id 帮助客 户端和 message broker 识别 channel,所以 channel 之间是完全隔离的
- Channel 作为轻量级的 Connection 极大减少了操作系统建立 TCP connection 的开销
Broker:
接收和分发消息的应用,RabbitMQ Server 就是 Message Broker
Virtual host:
- 出于多租户和安全因素设计的,把 AMQP 的基本组件划分到一个虚拟的分组中,类似于网络中的 namespace 概念
- 当多个不同的用户使用同一个 RabbitMQ server 提供的服务时,可以划分出 多个 vhost,每个用户在自己的 vhost 创建 exchange/queue 等 》
Exchange:
- message 到达 broker 的第一站,根据分发规则,匹配查询表中的 routing key,分发 消息到 queue 中去。
- 常用的类型有:direct (point-to-point), topic (publish-subscribe) and fanout (multicast)
Queue:
消息最终被送到这里等待 consumer 取走
Binding:
exchange 和 queue 之间的虚拟连接,binding 中可以包含 routing key,Binding 信息被保 存到 exchange 中的查询表中,用于 message 的分发依据
安装教程
windows环境下安装RabbitMQ(超详细)