回顾Redis之对象与数据结构

引言

Redis是一款基于键值对的数据结构存储系统，它的特点是基于内存操作、单线程处理命令、IO多路复用模型处理网络请求、键值对存储与简单丰富的数据结构等等

这篇文章主要围绕Redis中的对象与数据结构来详细说明键值对存储与简单丰富的数据结构这两大特点

Redis中的数据以Key,Value键值对的形式存储在字典中，字典的实现是哈希表

键Key只能使用字符串对象来表示，值Value能够使用其他所有对象

对象与数据结构

Redis中存在丰富的对象，常用的对象（数据类型）有字符串对象string、列表对象list、散列对象hash、集合对象set、有序集合对象zset等

还有其他的数据类型如Bitmap、Hyperloglog、Geospatial、布隆过滤器等，但这篇文章只涉及常用的对象，其他数据类型再以后的文章中再展开说明

redis中的对象RedisObject由类型、编码、引用次数、lru、指向编码使用的数据结构对象构成
类型标识这个对象是什么类型对象
比如字符串、列表、哈希、集合、有序集合等
编码表示构成对应类型对象时使用哪种数据结构
引用次数表示这个对象被引用了多少次
redis内存回收使用引用计数法，回收引用次数为0的对象 redis只依赖字符串对象，而不存在循环依赖所以不存在循环引用，因此可以使用引用计数法
lru记录这个对象最近被调用的时间，当空间回收算法使用lru时会优先回收很久未用的对象（后续删除回收的文章会介绍）

数据结构

sds简单动态字符串

sds使用字节数组维护，len记录字符串长度（表示结尾的'\0'不算），free表示字节数组中空闲的长度

在添加元素前会判断数组长度是否足够，不够则会进行扩容；扩容有空间预分配策略，会留有一部分空闲空间

如果下次修改字符串未超出数组长度就能够直接修改，节省了扩容的开销

hashtable字典

字典使用哈希表实现，哈希表的原理本篇文章不会详细概述

哈希冲突使用链地址法解决，查找时先通过 hash%数组长度-1 来获取索引，得到索引后再遍历链表节点，如果是新增则直接使用头插法，插入链表头部

为了防止大字典扩容时发生阻塞，字典中哈希表的扩容是循序渐进的，在发生扩容时会有俩个哈希表

旧哈希表和新哈希表中都可能存储数据，再收到hget等请求时先在旧哈希表中查找，找到了就顺便把它迁移到新哈希表中；在旧哈希表中没找到就去新哈希表中找

在完成迁移时，新哈希表将旧哈希表替换

skiplist跳表

跳表维护多层级的有序链表，利用高层能够快速达到后续节点，实现简单，维护方便，增删改查时间复杂度平均log n

比如查找值为2.0的节点，查找顺序为图中虚线

先找到虚拟头节点，从当前维护的最高层（L5）开始寻找，往后找到o3对象值为3.0，说明已经找过头了，于是要去下一层进行寻找；来到L4先后遍历，o1对象值为1.0，比目标值2.0小，说明没有目标值在o1对象后面，于是来到o1对象L4层；继续在o1对象L4向后遍历，发现o3值为3.0大于目标值，于是降层来到o1对象L3层；L3层后面也是o3于是继续降层，来到L2层，L2层向后遍历为o2对象，值为2.0并比较o2对象相同说明找到了

从维护的最高层开始查询，查询为空或者查询值大于目标值则降层，当前在最后一层还需要降层说明找不到

当排序值相同时，按照对象大小排序，这里的对象都是字符串对象

增加节点时的层数是随机生成的，越高层几率越小；其他修改操作，也是通过查询再进行，同时还要维护一些如最高层级等其他属性