redis源码分析之底层数据结构(一)-动态字符串sds

news2024/9/21 4:40:30

1.绪论

我们知道redis是由c语言实现的,c语言中是自带字符串的,但是为什么redis还要再实现自己的动态字符串呢,这种动态字符串的底层数据结构是怎样的呢?接下来我们带着这些问题来看一看redis中的动态字符串sds。

2.sds的组成

struct __attribute__ ((__packed__)) sdshdr5 {
    unsigned char flags; /* 3 lsb of type, and 5 msb of string length */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr8 {
    uint8_t len; /* used */
    uint8_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr16 {
    //字符数组的长度
    uint16_t len; /* used */
    //整个sds字符串的大小
    uint16_t alloc; /* excluding the header and null terminator */
    //表示是5种sds字符串中的哪一种
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    //真正存储数据的地方
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {
    uint32_t len; /* used */
    uint32_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {
    uint64_t len; /* used */
    uint64_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};

可以看出redis中sds是一个动态数组,它由长度+sds占据内存大小+sds的类型+加一个数组组成。如果用图表示如下:

可以看出redis的sds和java中的ArrayList是类似的。

3.sds的优点

为什么redis需要重新实现一个字符串呢?主要有如下的几点考虑:

3.1.常数时间复杂度获取字符串长度

普通字符串以'\0'结尾,而sds存取了整个字符串占据多少个字符。所以普通字符串需要用o(n)的复杂度获取到字符串长度,而sds以o(1)的复杂度获取到字符串长度;

3.2.存储特殊符号\0

sds能够存储特殊符号\0',当时c语言原生的字符串以'\0'结尾,不能存储\0,保证二进制安全;

3.3.内存动态分配,防止杜绝缓冲区溢出

c语言原生字符串,内存一但分配,大小便固定,比如在调用'append key'命令的时候,会实现字符串拼接的功能,如果超出缓冲器大小,会超出分配内存大小而报错;
但是sds实现了动态扩展的功能,在拼接前,会检查内存是否够用,如果不够用,便会进行动态扩容,而如果数组的剩余空间过多,便会进行缩容。

3.3.1 动态扩容

当新的字符串占用空间超出分配内存空间时,会进行动态分配,并且会提前考虑预分配一部分空间,防止内存的频繁分配问题。

3.3.2 动态缩容 

当已使用内存小于分配内存的部分比例时,会进行动态缩容,并且采用惰性释放的策略,不使用的数据并不会立即清除,而是等待有新的字符串写入的时候进行覆盖。

3.4.节约内存

在高版本的redis中,将存储字符数值分成了5类,分别是sdshdr5 、sdshdr8 、sdshdr16 、sdshdr32 、sdshdr64 ,redis会根据存储的字符内容来判断采用哪个中字符串尽显存储数据。比如如果用户写入的字符串只包含abcd这种英文字母,每个字符串用一个字节便能存储。sds便会考虑采用sdshdr8来进行存储.

4.总结

可以看出redis的sds其实就相当于java中的ArrayList,都具有动态扩容,缩容等功能。

5.参考

[1] 黄建宏 redis设计与实现

[2] https://juejin.cn/book/7144917657089736743/section/7144917738698326019

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1919136.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python模块ConfigParser读取应用程序的配置文件简单示例

一、模块说明: 系统管理员通常通过文本编辑器编辑这些配置文件,以设置应用程序的默认值,然后应用程序将读取并解析这些配置文件,并根据其中的内容执行对应操作。ConfigParser模块具有read()方法,用于读取配置文件。 …

socket编程(2) -- TCP通信

TCP通信 2. 使用 Socket 进行TCP通信2.1 socket相关函数介绍socket()bind()listen()accept()connect()2.2 TCP协议 C/S 模型基础通信代码 最后 2. 使用 Socket 进行TCP通信 Socket通信流程图如下: 这里服务器段listen是监听socket套接字的监听文件描述符。如果客户…

稳!连续五年蝉联第一,华为UPS何以领跑市场?

数字经济的蓬勃发展、人工智能浪潮的兴起,使得数据中心产业正经历一场影响深远的变革。 这其中,作为数据中心电能质量治理和不间断供电的核心组件,UPS(不间断电源,Uninterruptible Power Supply)堪称数据中…

python数据可视化(1)——绘制柱状图

课程学习来源:b站up:【蚂蚁学python】 【课程链接:【【数据可视化】Python数据图表可视化入门到实战】】 【课程资料链接:【链接】】 #导入数据 import pandas as pd df pd.read_excel("../DATA_POOL/PY_DATA/ant-learn-vi…

楼宇智慧公厕如何做到厕位状态、环境数据实时监控

在现代化的楼宇中,智慧公厕的出现为人们提供了更加便捷、舒适和卫生的如厕环境。其中,厕位状态和环境数据的实时监控是其关键特性之一。 一、楼宇智慧公厕简介 楼宇智慧公厕是一种融合了先进技术的现代化公厕设施,旨在提升用户体验、提高管理…

STL(一)

书写形式:string (const string& str, size_t pos, size_t len npos); 举例: int main(){ string url("https://mp.csdn.net/mp_blog/creation/editor?spm1000.2115.3001.4503") string sub1(url,0,5);//从下标为0开始向后5个字符&…

树莓派pico入坑笔记,dht11使用及温湿度表制作

目录 关于树莓派pico和circuitpython的更多玩法,请看树莓派pico专栏 用到的库adafruit_dht,需要导入pico才能使用,在这里下载 样例程序 进阶玩法,显示信息的温湿度计 屏幕使用见树莓派pico专栏的ssd1306oled屏幕使用 代码 效…

Excel的Index+MATCH组合使用方法

INDEX函数 INDEX函数作用:用于从指定的单元格区域中返回特定行和列的值。 参数形式为:INDEX(array, row_num, [column_num]) array:必需。单元格区域或数组常量。 row_num:必需。要返回的值所在的行号。 [column_num]&#x…

开发者必读:获取电商API的多种渠道

开发电商软件往往需要对接电商API,电商API可以从哪些渠道获取?下面给大家介绍两种获取渠道。 一、从电商平台开放平台获取电商API 电商平台的开放平台是获取电商API最直接的渠道,但是电商平台较多,每一个电商平台都需要单…

【理解串】

目录 一、串的基本概念二、串的基本操作及实现三、串的存储实现3.1、静态数组实现3.2、动态数组实现 四、串的朴素模式匹配4.1、算法思想4.2、代码实现 五、KMP算法5.1、算法思想5.2、求模式串的next数组5.2、代码实现 一、串的基本概念 串:即字符串(st…

常见的点云数据的获取方式

1. 激光雷达(LiDAR) 获取方式:激光脉冲测距原理:激光雷达通过发射激光脉冲并接收反射信号来测量物体与传感器之间的距离。计算激光脉冲从发射到返回所需的时间,并将其转换为距离,从而生成三维点云数据。常…

上班摸鱼吗?一文详解代码生成神器-Velocity

引言 “我不是在教你学坏,而是教你如何提高生产效率。” ----------- 牛顿 人类社会能够一直进步发展出现在的文明世界,最大的一个原因就是这个世界上懒人居多,懒人为了偷懒就需要提高生产效率,效率提高节省下来的时间才能创造出艺术、娱乐以及更高效率的科学技术。程序员…

丑数问题,力扣264,坑点

丑数问题,力扣264,坑点 力扣链接 给你一个整数 n ,请你找出并返回第 n 个 丑数 。 丑数 就是质因子只包含 2、3 和 5 的正整数。 示例 1: 输入:n 10 输出:12 解释:[1, 2, 3, 4, 5, 6, 8, 9, …

33 IRF配置思路

IRF配置思路网络括谱图 主 Ten-GigabitEthernet 1/0/49 Ten-GigabitEthernet 1/0/50 Ten-GigabitEthernet 1/0/51 备 Ten-GigabitEthernet 2/0/49 Ten-GigabitEthernet 2/0/50 Ten-GigabitEthernet 2/0/51 思路 主 1 利用console线进入设备的命令行页面去更改…

Spark源码详解

https://www.cnblogs.com/huanghanyu/p/12989067.html#_label3_3

服了,jenkins找不到advanced

新手下载的最新版本,过新手入门的时候一直过不去,就跳过了。 想下载一个汉化,还下载不了。根据提示搜索,结果大家让去advanced找url,也找不到。

[C++] 模拟实现list(二)

标题:[C] 模拟实现list(二) 水墨不写bug 目录 (一)回顾 (二)迭代器类的封装设计 (1)成员函数简要分析 (2)const迭代器类的设计 (…

国漫推荐08

仙侠、武侠、恋爱、战斗、现代、古风 1.《仙王的日常生活》仙侠、日常、搞笑 《仙王的日常生活》第一季 《仙王的日常生活 第二季》 《仙王的日常生活 第三季》 《仙王的日常生活 第四季》 2.《风灵玉秀》武侠、少女 3.刺客伍六七 番名季度上映时间《伍六七》第一季2018-04-…

ppt如何翻译最高效?盘点5个便捷易用的ppt翻译器

正值夏日炎炎,7.15初伏即将到来,天气更是开始热到让人无法专心工作~面对电脑上一堆非母语的PPT文件,看得人愈发烦躁。 幸运的是,我手里头常常备着几款ppt翻译工具,这才让办公显得没那么枯燥和烦闷~倘若你也遇上同样的…

技术速递|宣布为 .NET 升级助手提供第三方 API 和包映射支持

作者:Marco Goertz 排版:Alan Wang .NET 升级助手是一个 Visual Studio 扩展和命令行工具,可帮助您将应用从之前的 .NET 和 .NET Framework 升级到最新版本的 .NET。正如我们在之前的文章中所描述的那样,它为升级 Microsoft 库和框…