RabbitMQ持久化
- 1、概念
- 2、队列持久化
- 3、消息持久化
- 4、不公平分发
- 5、预取值
1、概念
默认情况下 RabbitMQ 退出或由于某种原因崩溃时,它忽视队列和消息,除非告知它不要这样做。确保消息不会丢失需要做两件事:我们需要将队列和消息都标记为持久化
2、队列持久化
也就是在声明队列的时候开启持久化就行
Queue.DeclareOk queueDeclare(String queue,
//这个就是开启持久化的参数
boolean durable,
boolean exclusive,
boolean autoDelete,
Map<String, Object> arguments) throws IOException;
但是需要注意的就是如果之前声明的队列不是持久化的,需要把原先队列先删除,或者重新创建一个持久化的队列,不然就会出现错误如下
删除操作
重新创建后持久化和没持久化队列的区别
即使MQ重启队列不会消失
3、消息持久化
想让消息实现持久化需要在消息生产者推送消息的方法中修改参数,MessageProperties.PERSISTENT_TEXT_PLAIN
添加这个属性。
void basicPublish(
String exchange,
String routingKey,
//这里修改的就是这个参数
BasicProperties props,
byte[] body) throws IOException;
//示例
channel.basicPublish("",TASK_QUEUE_NAME, MessageProperties.PERSISTENT_TEXT_PLAIN,msg.getBytes("UTF-8"));
将消息标记为持久化并不能完全保证不会丢失消息。尽管它告诉 RabbitMQ 将消息保存到磁盘,但是这里依然存在当消息刚准备存储在磁盘的时候 但是还没有存储完,消息还在缓存的一个间隔点。如果MQ宕机,那此时并没有真正写入磁盘。持久性保证并不强,但是对于我们的简单任务队列而言,这已经绰绰有余了。
4、不公平分发
在轮询分发的时候在某种场景下这种策略并不是很好,比方说有两个消费者在处理任务,其中有个消费者 1 处理任务的速度非常快,而另外一个消费者 2 处理速度却很慢,这个时候我们还是采用轮训分发的化就会到这处理速度快的这个消费者很大一部分时间处于空闲状态,而处理慢的那个消费者一直在干活,这种分配方式在这种情况下其实就不太好,但是RabbitMQ 并不知道这种情况它依然很公平的进行分发
为了避免这种情况,我们可以设置参数 channel.basicQos()
;
// prefetchCount : 服务器将传递的最大消息数量,如果不受限制则为0
int prefetchCount = 1;
channel.basicQos(prefetchCount);
这里相当于设置了消费者的信道的容量也就是分发给你的消息数量,0是无限大也就是平均分配所有队列,1个就是分发消息一个,2就是两个,分发方式其实还是轮询,不过如果看容量满了,他就会跳过不分发给他,在没有应答MQ后是不会再重新给你分发消息
5、预取值
概念:其实也就是上面 basicQos(prefetchCount);
这个方法的参数。
文绉绉的概念解释:本身消息的发送就是异步发送的,所以在任何时候,channel 上肯定不止只有一个消息另外来自消费者的手动确认本质上也是异步的。因此这里就存在一个未确认的消息缓冲区,因此希望开发人员能限制此缓冲区的大小,以避免缓冲区里面无限制的未确认消息问题。这个时候就可以通过使用 basic.qos 方法设置“预取计数”值来完成的。该值定义通道上允许的未确认消息的最大数量。一旦数量达到配置的数量,RabbitMQ 将停止在通道上传递更多消息,除非至少有一个未处理的消息被确认,例如,假设在通道上有未确认的消息 5、6、7,8,并且通道的预取计数设置为 4,此时RabbitMQ 将不会在该通道上再传递任何消息,除非至少有一个未应答的消息被 ack。比方说 tag=6 这个消息刚刚被确认 ACK,RabbitMQ 将会感知这个情况到并再发送一条消息。消息应答和 QoS 预取值对用户吞吐量有重大影响。常增加预取将提高向消费者传递消息的速度。虽然自动应答传输消息速率是最佳的,但是,在这种情况下已传递但尚未处理的消息的数量也会增加,从而增加了消费者的 RAM 消耗(随机存取存储器)应该小心使用具有无限预处理的自动确认模式或手动确认模式,消费者消费了大量的消息如果没有确认的话,会导致消费者连接节点的内存消耗变大,所以找到合适的预取值是一个反复试验的过程,不同的负载该值取值也不同 100 到 300 范围内的值通常可提供最佳的吞吐量,并且不会给消费者带来太大的风险。预取值为 1 是最保守的。当然这将使吞吐量变得很低,特别是消费者连接延迟很严重的情况下,特别是在消费者连接等待时间较长的环境中。对于大多数应用来说,稍微高一点的值将是最佳
这里假设5个消息 1,2,3,4,5,给消费者1和消费者2 ,消费者1设置预取值2,消费者2设置预取值3,这个时候还是轮询分发不过如果消费者没有应答就不会分发新消息也就是消费者1拿到消息1,3,消费者拿到消息2,4,5,这里注意如果消息进行了应答,那么就会可以再分发消息也就是消费者1比较快可以 1,3,5,而消费者2比较慢只有2,4