无论是 Redis 的 Key 还是 Value,其基础数据类型都是字符串。例如,Hash 型 Value 的field 与 value 的类型、List 型、Set 型、ZSet 型 Value 的元素的类型等都是字符串。虽然 Redis是使用标准 C 语言开发的,但并没有直接使用 C 语言中传统的字符串表示,而是**自定义了一种字符串。**这种字符串本身的结构比较简单,但功能却非常强大,称为简单动态字符串,
S
i
m
p
l
e
D
y
n
a
m
i
c
S
t
r
i
n
g
Simple Dynamic String
SimpleDynamicString,简称
S
D
S
SDS
SDS。
注意,Redis 中的所有字符串并不都是 SDS,也会出现 C 字符串。C 字符串只会出现在字符串“字面常量”中,并且该字符串不可能发生变更。
如:执行 SET country “China”命令时,键 country 与值”China”都是 SDS 类型的,只不过一个是 SDS 的变量,一个是 SDS 的字面常量。
“China”在内存中的结构如下:
结论:SDS 的 buf 值实际是一个 C 字符串,包含空字符’\0’共占 6 个字节。但 SDS 的 len 不包含空字符’\0’,还有有 3 字节未使用空间
1.3 SDS优势
1.3.1 防止”字符串长度获取”性能瓶颈
对于 C 字符串,若要获取其长度,则必须要通过遍历整个字符串才可获取。对于超长字符串的遍历,会成为系统的性能瓶颈。SDS 结构体中直接就存放着字符串的长度数据,所以获取字符串长度不需要消耗的系统性能,不会成为 Redis 的性能瓶颈。
1.3.2 保障二进制安全
C 字符串中只能包含符合某种编码格式的字符,例如 ASCII、UTF-8 等,并且除了字符串末尾外,其它位置是不能包含空字符’\0’的,否则该字符串就会被程序误解为提前结束。而在图片、音频、视频、压缩文件、office 文件等二进制数据中常常以空字符’\0’作为分隔符。故而在 C 字符串中是不能保存像图片、音频、视频、压缩文件、office 文件等二进制数据的。
**SDS 不是以空字符’\0’作为字符串结束标志的,其是通过 len 属性来判断字符串是否结束的。**所以,对于程序处理 SDS 中的字符串数据,无需对数据做任何限制、过滤、假设,只需读取即可。
1.3.3 减少内存再分配次数
SDS 采用了空间预分配策略与惰性空间释放策略来避免内存再分配问题。
空间预分配策略是指,每次 SDS 进行空间扩展时,程序不但为其分配所需的空间,还会为其分配额外的未使用空间,以减少内存再分配次数。而额外分配的未使用空间大小取决于空间扩展后 SDS 的 len 属性值。