Redis核心技术与实战【学习笔记】 - 12.Redis删除数据后,为什么内存占用率还是很高?

news2024/11/20 3:22:00

前言

在使用 Redis 是,经常会遇到一个问题:明明做了数据删除,数据量不大,但是 使用 top 命令查看时,发现 Redis 还是占用了很多内存。

这是因为,当删除数据后,Redis 释放的内存空间会由内存分配器管理,并不会立即返回操作系统,所以,操作系统操作系统仍然会记录这给 Redis 分配了大量内存。

这往往会伴随一个潜在的风险点: Redis 释放的内存空间可能并不是联系的,那么,这些不连续的内存空间可能处于一种闲置的状态。这会导致一个问题:虽然有空闲时间,Redis 却无法用来保存数据。

所以,本章就聊聊 Redis 的内存空间存储效率问题,为什么数据明明已经删除了,但内存却闲置着没有用,以及相应的解决办法。


1. 内存碎片

通常,内存空间闲置是因为操作系统发生了严重的内存碎片。
那么,什么是内存碎片?

为方便理解,举个高铁的车厢座位的例子。假设一节车厢的座位共有 60 个,现在已经卖了 57 张票,有 3 个朋友要一起乘坐高铁出行,刚好需要三张连载一起的票。但是,在选座位时,发现已经买不到连续的座位了。于是,你们只好换了一趟车。这样一来,这 3 个朋友就要改变出行时间,而且这趟车就空置了三个座位。

其实,这趟车的空座和朋友们的人数是匹配的,只是这些空座位是分散的,如下所示:
在这里插入图片描述
我们把这些分散的空座位叫作“车厢座位碎片”。基于上面的例子,操作系统的内存碎片就很容易理解了。虽然,操作系统的剩余内存空间总量足够,但是应用申请的是一块连续地址空间的 N 字节,但是剩余内存中,没有大小为 N 字节的连续空间了,那么,这些剩余的空间就是内存碎片。

2.Redis的内存碎片是如何形成的?

其实,内存碎片的形成有内因和外因两个层面的原因。

简单来说,内因是操作系统的内存分配机制,外因是 Redis 的负载特征。

2.1 内因:内存分配器的分配策略

内存分配器的分配策略就决定了操作系统无法做到“按需分配”。这是因为,内存分配器一般是按固定大小来分配内存,而不是完全按照应用程序申请的内存空间大小来进行分配。

Redis 可以使用 libc、jemalloc、tcmalloc 多种内存分配器来分配内存,默认使用 jemelloc。下面我们就解释下 jemalloc 的分配策略和问题,其他分配器也存在类似的问题。

jemalloc 的分配策略是按照一系列固定的大小分配内存空间,例如 8 字节、16 字节、32 字节、…、2KB、4KB、8KB 等等。当程序申请的内存最近接某个固定值时,jemalloc 会给它分配相应大小的空间。

这样的分配方式本身是为了减少分配的次数。例如,Redis 申请一个 20 字节的空间报错数据,jemalloc 就会分配 32 字节,此时,如果应用还要写入 10 字节数据,Redis 就不用再向操作系统申请空间了,这就避免了一次分配的操作。

但是,如果 Redis 每次向分配器申请的内存空间大小不一样,这种分配方式就会有形成碎片的风险,而这正好来源于 Redis 的外因了。

2.2 外因:键值对大小不一样和删改操作

Redis 通常作为共有的缓存系统或键值数据库对外提供服务,所以,不同业务应用的数据都可能保存在 Redis 中,这就会带来不同大小的键值对。这样一来,Redis 申请内存空间分配时,本身就会有大小不一的空间需求。这是第一个外因。

上面刚刚讲过,内存分配器只能按固定大小分配内存,所以分配的空间一般都会比申请的空间大,不会完全一致,这本身就会造成一定的内存碎片,降低内存空间存储效率。

比如说,应用 A 保存 6 字节数据,jemalloc 按分配策略会分配 8 字节。如果应用 A 不再保存新数据,那么,这里多出来的 2 字节空间就是内存碎片了。

在这里插入图片描述

第二个外因是,这些键值对会被修改和删除,这会导致空间的扩容和释放。具体来说,一方面,如果修改后的键值对变大或变小了,就需要占用额外的空间或者释放不用的空间。另一方面,删除的键值对就不再需要内存空间了,此时,就会把空间释放出来,形成空闲空间。

在这里插入图片描述

  • 一开始,应用 A、B、C、D 分别保存了 3、1、2、4 字节的数据,并占据了相应的内存空间。
  • 然后,应用 D 删除了 1 字节,这 1 字节的内存空间就空出来了。
  • 紧接着,应用 A 修改了数据,从 3 字节变为 4 字节。为了保持 A 数据空间的连续性,操作系统就把 B 的数据拷贝到别的空间,比如拷贝到 D 刚刚是否的空间中。
  • 此时,应用 C 和 D 也分别删除了 2 字节和 1 字节的数据,整个内存空间上就分别出现了 2 字节和 1 字节的空闲碎片。
  • 如果 E 想要一个 3 字节的连续空间,显然是不能满足的。因为虽然空间总量足够,但是确实碎片空间,并不是连续的。

好了,我们知道了造成内存碎片的内因和外因,其中内存分配器的策略是内因,而 Redis 的负载属于外因,包括了大小不一的键值对和键值对修改删除带来的内存空间变化。

大量的内存碎片会造成 Redis 的内存实际利用率变低,接下来,我们就要来解决这个问题了。不过在解决这个问题之前,还要判断 Redis 在运行过程中是否存在内存碎片。

3.如何判断是否有内存碎片?

为了能让用户监测到实时内存使用情况,Redis 自身提供了 INFO 命令,可以用来查询内存使用的详细信息,命令如下:

127.0.0.1:6379> INFO memory
# Memory
used_memory:1073741736
used_memory_human:1024.00M
used_memory_rss:1997159792
used_memory_rss_human:1.86G
...
mem_fragmentation_ratio:1.86

这里有这么一个参数 mem_fragmentation_ratio 的指标,它表示 Redis 当前的内存碎片率。那么,这个内存碎片率是怎么计算的?

mem_fragmentation_ratio = used_memory_rss / used_memory
  • used_memory_rss:操作系统实际分配给 Redis 的物理内存空间,里面就包含了内存碎片。
  • used_memory:是 Redis 为保持数据实际申请使用的空间地址。

例如,Redis 申请使用了 100 字节(used_memory),操作系统实际分配了 128 字节(used_memory_rss ),此时 mem_fragmentation_ratio 就是 1.28。

知道了这个指标,我们该如何使用?

  • mem_fragmentation_ratio 大于 1 但小于 1.5:这种情况是合理的。这是因为刚才介绍的因素是难以避免的。毕竟,内因的分配器是一定要使用的,分配策略是通用的,不会轻易修改;而外因由 Redis 负载决定,也无法限制。所以,存在内存碎片也是正常的。
  • mem_fragmentation_ratio 大于 1.5:这种表明内存碎片率已经超过了 50%。一般情况下,这个时候,我们就需要采取一些措施来降低内存碎片了。

4.如何清理内存碎片?

Redis 发送内存碎片后,一个“简单粗暴”的方法就是重启 Redis 实例。当然,这并不是一个“优雅”的方法,毕竟,重启 Redis 会带来两个后果:

  • 如果 Redis 中的数据没有持久化,那么数据就会丢失
  • 即使 Reids 持久化了,还需要通过 AOF 或 RDB 进行恢复,恢复时长取决于 AOF 或 RDB 的大小,如果只有一个 Redis 实例,恢复阶段无法提供服务。

幸运的是,从 Redis 4.0.3 版本以后,Redis 自身提供了一种内存碎片自动清理的方法,我们先来看下这个方法的基本原理。

操作系统:碎片清理的基本原理

内存碎片清理,简单来说,就是“搬家让位,合并空间”。比如说,刚刚的高铁车厢选座的例子,你和小家伙不想耽误时间,所以直接买了作为不在一起的三张票。但是,上车后,你和小伙伴通过和别人调换作为,又坐在一起了。

例如,在碎片清理前,这段 10 字节的空间中分别有 1 个 2 字节和 1 个 1 字节的空闲空间,只是这两个空间并不连续。操作系统在清理碎片时,会先把应用 D 的数据拷贝到 2 字节的空闲空间中,并释放 D 原来占用的空间。然后,再把 B 的数据拷贝到 D 原来的空间中。这样一来,这段 10 字节空间的最后三个字节就是一块连续的空间了。到这里,碎片清理结束。
在这里插入图片描述

不过,需要注意,碎片清理是有代价的,操作系统需要把多分数据拷贝到新位置,把原有空间释放出来,这会带来时间开销。因为 Redis 是单线程,在数据拷贝时,Redis 只能等着,这就导致 Redis 无法及时处理请求,性能就会降低。而且,有时候,数据拷贝还需要注意顺序,就像刚刚说的清理内存碎片的例子,操作系统需要先拷贝 D,并释放 D 的空间后,才能拷贝 B。这种对顺序性的要求,会进一步增加 Redis 的等待时间,导致性能下降。

有什么办法可以尽量缓解这个问题吗? 这就要提到,Redis 专门为自动内存碎片清理机制设置的参数了。我们可以通过设置参数,来控制内存碎片清理的开始和结束时机,以及占用的 CPU 比例,从而减少碎片清理对 Redis 本身请求处理的性能影响。

Redis:内存碎片清理

首先,Redis 需要启用自用内存碎片清理,可以把 activedefrag 配置项设置为 yes,命令如下:

127.0.0.1:6379> config set activedefrag yes
OK

这个命令只是启动了自动清理功能,但是具体什么时候清理,会受到下面这两个参数的控制。这两个参数分别设置了触发内存清理的条件,如果同时满足这两个条件,就开始清理。在清理过程中,只要有一个条件不满足了,就停止自动清理。

  • active-defrag-ignore-bytes 100mb:表示内存碎片的字节数达到 100 MB 时,开始清理;
  • active-defrag-threshold-lower 10:表示内存碎片空间占操作系统分配给 Redis 的总空间的比例达到 10% 时,开始清理。
127.0.0.1:6379> config set active-defrag-ignore-bytes 100mb
OK
127.0.0.1:6379> config set active-defrag-threshold-lower 10
OK

为了尽可能减少碎片清理对 Redis 正常请求处理的影响,自动内存碎片清理功能在执行时,还会监控清理操作占用的 CPU 时间,而且还设置了两个参数,分别用于控制清理操作占用的 CPU 时间比例的上、下限,既保证清理工作能正常进行,又避免降低 Redis 性能。这两个参数具体如下:

  • active-defrag-cycle-min 25:表示自动清理过程所用 CPU 的时间比例不低于 25%,保证清理能正常清理。
  • active-defrag-cycle-max 75:表示自动清理过程所用 CPU 的时间比例不高于 75%,一旦超过,就停止清理,从而避免在清理时,大量的内存拷贝阻塞 Redis,导致响应延迟高。
127.0.0.1:6379> config set active-defrag-cycle-min 25
OK
127.0.0.1:6379> config set active-defrag-cycle-max 75
OK

自动内存碎片清理机制在控制碎片清理启停的时机上,既考虑了碎片的空间占比、对 Redis 内存使用效率的影响,还考虑了清理机制本身的 CPU 时间占比、对 Redis 性能的影响。而且,清理机制还提供了 4 个参数,让我们可以根据实际应用中的数据量需求和性能,灵活使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1428031.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vivado编译介绍

Vivado编译介绍 合成是将寄存器传输级别(RTL)指定的设计转换为门级表示。AMD Vivado™ 合成是定时驱动的,并针对内存进行优化使用和性能。Vivado合成支持以下的可合成子集: •SystemVerilog:IEEE标准SystemVerilog统…

UniMSE: Towards Unified Multimodal Sentiment Analysis and Emotion Recognition

文章目录 UniMSE:实现统一的多模态情感分析和情绪识别文章信息研究目的研究内容研究方法1.总体架构2.Task Formalization3.Pre-trained Modality Fusion (PMF)4.Inter-modality Contrastive Learning5.总体损失函数6.Decoding Algorithm 结果与讨论代码和数据集符号…

博客网站系统测试报告

一、项目背景 博客网站系统采用前后端分离的方法来实现,同时使用了数据库来存储相关的数据,同时将其部署到云服务器上。前端主要有个页面构成:注册页、登录页、个人博客列表页、博客详情页、编辑博客页、修改博客页以及博客系统主页&#xf…

【项目实践02】【优先级阻塞队列】

文章目录 一、前言二、项目背景三、实现方案四、思路延伸1. 优先级队列1.1 concurrent 包下的 PriorityBlockingQueue1.2 Redisson 的优先级阻塞队列 2. jvisualvm 远程连接3. Jstack 高 CPU 排查 五、参考内容 一、前言 本系列用来记录一些在实际项目中的小东西,并…

【算法分析与设计】交换两个节点

📝个人主页:五敷有你 🔥系列专栏:算法分析与设计 ⛺️稳中求进,晒太阳 题目 给你一个链表,两两交换其中相邻的节点,并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本…

实习日志11

1.文件上传报错 1.1.报错信息Invalid typed array length: -2 1.2.查看源码找出错误 定位到检查代码上传是否成功的代码出错,rDataArr[3] 0x03 var pData new Uint8Array(pDataLen);的pDataLen4 说明rDataArr只有0-3,其他数据都没有上传上来 说明…

DoubleEnsemble:基于样本重加权和特征选择的金融数据分析方法

现代机器学习模型(如深度神经网络和梯度提升决策树)由于其提取复杂非线性模式的优越能力,在金融市场预测中越来越受欢迎。然而,由于金融数据集的信噪比非常低,并且是非平稳的,复杂的模型往往很容易过拟合。…

leetcode189.轮转数组|超简单易于理解方法

题目 https://leetcode.cn/problems/rotate-array/description/https://leetcode.cn/problems/rotate-array/description/ 给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。 示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输…

基于uniapp+vue酒店宾馆客房民宿管理系统设计 微信小程序_54ybz

APP性能需求 (1)顾客在安卓APP页面各种操作可及时得到反馈。 (2)该平台是提供给多个用户使用的平台,用户使用之前需要注册登录。登录验证后,用户才可进行各种操作[10]。 (3)管理员、…

Java 集合 04 综合练习-查找用户是否存在

练习、 代码: public class User{private String id;private String username;private int password;public User() {}public User(String id, String username, int password) {this.id id;this.username username;this.password password;}public String getI…

舟山长寿医学中心:引领生命科技前沿

在浩瀚的东海之滨,舟山群岛如一颗璀璨的明珠,镶嵌在碧波荡漾的大海之中。这里不仅拥有得天独厚的自然美景,更是一块充满生机与活力的健康宝地。舟山长寿医学中心,正是这片神奇的土地上的一颗璀璨明珠,致力于为全球人士…

Linux权限【上篇】

📙 作者简介 :RO-BERRY 📗 学习方向:致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 📒 日后方向 : 偏向于CPP开发以及大数据方向,欢迎各位关注,谢谢各位的支持 目录 扩展知识&#xff1a…

react 之 UseReducer

UseReducer作用: 让 React 管理多个相对关联的状态数据 import { useReducer } from react// 1. 定义reducer函数,根据不同的action返回不同的新状态 function reducer(state, action) {switch (action.type) {case INC:return state 1case DEC:return state - 1de…

系统移植--无法启动Linux内核--报错VFS--挂载nfs失败

问题 找信息:VFS 可能的原因 1、开发板上内核启动参数中的虚拟机ubuntu IP和真实的 虚拟机的IP不一致 2、开发板上内核启动参数中虚拟机的共享目录和虚拟机 ubuntu上配置的nfs服务器上的共享目录不一致 3、nfs配置文件(/etc/exports)路径错误 与自己的共享文件…

Galah:一款功能强大的LLM驱动型OpenAI Web蜜罐系统

关于Galah Galah是一款功能强大的Web蜜罐,该工具由LLM大语言模型驱动,基于OpenAI API实现其功能。 很多传统的蜜罐系统会模拟一种包含了大量网络应用程序的网络系统,但这种方法非常繁琐,而且有其固有的局限性。Galah则不同&…

Transformer 自然语言处理(四)

原文:Natural Language Processing with Transformers 译者:飞龙 协议:CC BY-NC-SA 4.0 第十章:从头开始训练变换器 在本书的开头段落中,我们提到了一个名为 GitHub Copilot 的复杂应用,它使用类似 GPT 的…

C语言:详解操作符(上)

摘要: 本篇,我们将学习C语言中操作符的相关内容,操作符是C语言中重要的元素之一,在我们的代码中处处都有,下面我们将详细介绍操作符的相关内容,并结合一些代码例题加深印象。 目录 一、操作符的分类及介绍 …

当无法在Windows 10上更改分辨率时怎么办?这里提供几个方法

一般来说,如果你愿意,你可以很容易地更改Windows 10计算机的屏幕分辨率。如果你发现无法在Windows 10中更改分辨率,可以查看下面的解决方案来解决此问题。 无法在Windows 10上更改分辨率? 要在Windows 10上检查和更改屏幕分辨率,通常有两种简单的方法。 方法一:你可以…

Vue3+vite搭建基础架构(5)--- 使用vue-i18n

Vue3vite搭建基础架构(5)--- 使用vue-i18n 说明官方文档安装vue-i18n使用vue-i18n测试vue-i18n的国际化配置 说明 这里记录下自己在Vue3vite的项目使用vue-i18n做国际化语言的过程,不使用ts语法,方便以后直接使用。这里承接自己的…

工作七年,对消息推送使用的一些经验和总结

前言:不管是APP还是WEB端都离不开消息推送,尤其是APP端,push消息,小信箱消息;WEB端的代办消息等。因在项目中多次使用消息推送且也是很多项目必不可少的组成部分,故此总结下供自己参考。 一、什么是消息推…