【Redis】List类型和底层原理

文章目录

- List类型
- - 1.List介绍
  - - 1.1常用命令
  - 2.List底层实现
  - 3.ziplist剖析
  - - 3.1ziplist结构
    - 3.2创建一个空的ziplist
    - 3.3ziplist的元素节点结构
    - 3.4ziplisqt的连锁更新
    - 3.5ziplist的缺陷
  - 4.quicklist剖析
  - - 4.1quicklist表头结构
  - 5.List的应用场景----消息队列
  - - 5.1保证消息保序
    - 5.2处理重复的消息
    - 5.3保证消息的可靠性
    - 5.List作为消息队列的缺陷

List类型

1.List介绍

单键多值

Redis 列表是简单的字符串列表，按照插入顺序排序。你可以添加一个元素到列表的头部（左边）或者尾部（右边）。

列表的最大长度为 2^32 - 1，也即每个列表支持超过 40 亿个元素。

它的底层实际是个双向链表，对两端的操作性能很高，通过索引下标的操作中间的节点性能会较差。

1.1常用命令

**插入：**lpush/rpush … 从左边/右边插入一个或多个值。

**取数据：**lpop/rpop 从左边/右边吐出一个值。值在键在，值取完键销毁。

索引

lrange 按照索引下标获得元素(从左到右)

lrange mylist 0 -1 0左边第一个，-1右边第一个，（0 -1表示获取所有）
lindex 按照索引下标获得元素(从左到右)

**llen 获得列表长度 **

linsert <key>  before <value> <newvalue>在<value>的后面插入<newvalue>插入值
    
lrem <key><n><value>从左边删除n个value(从左到右)
    
lset<key> <index> <value>将列表key下标为index的值替换成value

2.List底层实现

list底层数据结构为ziplist和quicklist。

快速列表quicklistquicklist = 链表+ziplist

在列表元素较少的情况下，会使用一块连续的内存存储，**这个结构就是ziplist,**即压缩列表。它将所有的元素紧挨着一起存储，分配的是一块连续的内存
当数据量变多时，会改成quicklist

3.ziplist剖析

3.1ziplist结构

压缩列表(ziplist)是哈希键的底层实现之一。它是经过特殊编码的双向链表，和整数集合(intset)一样，是为了提高内存的存储效率而设计的。当保存的对象是小整数值，或者是长度较短的字符串，那么redis就会使用压缩列表来作为哈希键的实现。

ziplist的结构

struct ziplist<T> {
	int32 zlbytes; // 整个压缩列表占用字节数
    
	int32 zltail_offset; // 最后一个元素距离压缩列表起始位置的偏移量，用于快速定位到最后一个节点
    
	int16 zllength; // 元素个数
    
	T[] entries; // 元素内容列表，挨个挨个紧凑存储
    
	int8 zlend; // 标志压缩列表的结束，值恒为 0xFF
}

zlbytes：占4个字节，记录整个压缩列表占用的内存字节数。
zltail_offset：占4个字节，记录压缩列表尾节点entryN距离压缩列表的起始地址的字节数。
zllength：占2个字节，记录了压缩列表的节点数量。
entry[1-N]：长度不定，保存数据。
zlend：占1个字节，保存一个常数255(0xFF)，标记压缩列表的末端。

实际上redis并没有提供一个结构体来保存压缩列表的信息，而是用了一组宏对压缩列表进行管理

//  ziplist的成员宏定义
//  (*((uint32_t*)(zl))) 先对char *类型的zl进行强制类型转换成uint32_t *类型，

//  然后在用*运算符进行解引用取内容运算，此时zl能访问的内存大小为4个字节。

//zl的类型为char*类型

#define ZIPLIST_BYTES(zl)       (*((uint32_t*)(zl)))
//将zl定位到前4个字节的bytes成员，记录这整个压缩列表的内存字节数

#define ZIPLIST_TAIL_OFFSET(zl) (*((uint32_t*)((zl)+sizeof(uint32_t))))
//将zl定位到4字节到8字节的tail_offset成员，记录着压缩列表尾节点距离列表的起始地址的偏移字节量

#define ZIPLIST_LENGTH(zl)      (*((uint16_t*)((zl)+sizeof(uint32_t)*2)))
//将zl定位到8字节到10字节的length成员，记录着压缩列表的节点数量

#define ZIPLIST_HEADER_SIZE     (sizeof(uint32_t)*2+sizeof(uint16_t))
//压缩列表表头（以上三个属性）的大小10个字节

#define ZIPLIST_ENTRY_HEAD(zl)  ((zl)+ZIPLIST_HEADER_SIZE)
//返回压缩列表首节点的地址

#define ZIPLIST_ENTRY_TAIL(zl)  ((zl)+intrev32ifbe(ZIPLIST_TAIL_OFFSET(zl)))
//返回压缩列表尾节点的地址

#define ZIPLIST_ENTRY_END(zl)   ((zl)+intrev32ifbe(ZIPLIST_BYTES(zl))-1)
//返回end成员的地址，一个字节。

3.2创建一个空的ziplist

unsigned char *ziplistNew(void) {   //创建并返回一个新的压缩列表
    //ZIPLIST_HEADER_SIZE是压缩列表的表头大小，1字节是末端的end大小
    unsigned int bytes = ZIPLIST_HEADER_SIZE+1;

    unsigned char *zl = zmalloc(bytes); //为表头和表尾end成员分配空间
    
    ZIPLIST_BYTES(zl) = intrev32ifbe(bytes);    //将bytes成员初始化为bytes=11
    ZIPLIST_TAIL_OFFSET(zl) = intrev32ifbe(ZIPLIST_HEADER_SIZE);    //空列表的tail_offset成员为表头大小为10
    ZIPLIST_LENGTH(zl) = 0;     //节点数量为0
    
    zl[bytes-1] = ZIP_END;      //将表尾end成员设置成默认的255
    return zl;
}

intrev32ifbe()是封装的宏，用来根据主机的字节序按需要进行字节大小端的转换。

3.3ziplist的元素节点结构

redis对于压缩列表节点定义了一个zlentry的结构，用来管理节点的所有信息。

typedef struct zlentry {
    /*
    */
} zlentry;

虽然定义了这个结构体，但是Redis并没有使用zlentry对元素列表进行管理。因为该结构体存储短字符串和小整数太浪费空间。【一个结构体在32位机下的大小是28字节，意味着管理一个元素要多付出28字节内存】

因此，在redis中，并没有定义结构体来进行操作，也是定义了一些宏，压缩列表的节点真正的结构如下图所示：

prevlen：记录前驱节点的长度（保证了从后往前遍历）

prevlen属性的大小与前驱节点大小有关：

如果前一个节点的长度小于 254 字节，那么 prevlen 属性需要用 1 字节的空间来保存这个长度值；
如果前一个节点的长度大于等于 254 字节，那么 prevlen 属性需要用 5 字节的空间来保存这个长度值；

encoding：记录当前节点的value成员的数据类型以及长度。
entry_data：保存字节数组或整数数据。

struct entry {
	int<var> prevlen; // 前一个 entry 的字节长度
    
	int<var> encoding; // 元素类型编码
    
	var entry_data; // 元素内容
}

3.4ziplisqt的连锁更新

ziplist的底层结构图

压缩列表除了查找复杂度高的问题，还存在一个问题，连锁更新问题：

压缩列表新增某个元素或修改某个元素时，如果空间不不够，压缩列表占用的内存空间就需要重新分配。而当新插入的元素较大时，可能会导致后续元素的 prevlen 占用空间都发生变化，从而引起「连锁更新」问题，导致每个元素的空间都要重新分配，造成访问压缩列表性能的下降。

前面提到，prevlen属性的大小与前驱节点大小有关：

如果前一个节点的长度小于 254 字节，那么 prevlen 属性需要用 1 字节的空间来保存这个长度值；
如果前一个节点的长度大于等于 254 字节，那么 prevlen 属性需要用 5 字节的空间来保存这个长度值；

假设当前ziplist有多个大小在250~253字节中间的元素，元素的prevlen属性大小为1字节

这时，如果将一个长度大于等于 254 字节的新节点加入到压缩列表的表头节点，即新节点将成为 e1 的前置节点，因为ziplist是一段连续的内存空间，所以后续的元素都需要更新：

因为 e1 节点的 prevlen 属性只有 1 个字节大小，无法保存新节点的长度，此时就需要对压缩列表的空间重分配操作，并将 e1 节点的 prevlen 属性从原来的 1 字节大小扩展为 5 字节大小，修改后e1的大小也大于了253字节，所以e2的prevlen大小也会被修改为5字节…

这种在特殊情况下产生的连续多次空间扩展操作就叫做「连锁更新」

3.5ziplist的缺陷

ziplist是一段连续的内存空间，所以对ziplist空间扩展会导致空间的重新分配和拷贝。

**如果发生了连锁更新，**可能会导致多次空间扩展和拷贝，这就会直接影响到压缩列表的访问性能。

4.quicklist剖析

quickList就是一个标准的双向链表的配置，有head 有tail；每一个节点是一个quicklistNode，包含prev和next指针。而每一个quicklistNode 包含一个ziplist，*zp 压缩链表里存储键值。所以quicklist是对ziplist进行一次封装，使用小块的ziplist来既保证了少使用内存，也保证了性能。

4.1quicklist表头结构

typedef struct quicklist {
    //指向头部(最左边)quicklist节点的指针
    quicklistNode *head;
 
    //指向尾部(最右边)quicklist节点的指针
    quicklistNode *tail;
 
    //ziplist中的entry节点计数器
    unsigned long count;        /* total count of all entries in all ziplists */
 
    //quicklist的quicklistNode节点计数器
    unsigned int len;           /* number of quicklistNodes */
 
    //保存ziplist的大小，配置文件设定，占16bits
    int fill : 16;              /* fill factor for individual nodes */
 
    //保存压缩程度值，配置文件设定，占16bits，0表示不压缩
    unsigned int compress : 16; /* depth of end nodes not to compress;0=off */
} quicklist;

quicklist节点结构

typedef struct quicklistNode {
    struct quicklistNode *prev;     //前驱节点指针
    struct quicklistNode *next;     //后继节点指针
 
    //不设置压缩数据参数recompress时指向一个ziplist结构
    //设置压缩数据参数recompress指向quicklistLZF结构
    unsigned char *zl;
 
    //压缩列表ziplist的总长度
    unsigned int sz;                  /* ziplist size in bytes */
 
    //ziplist中包的节点数，占16 bits长度
    unsigned int count : 16;          /* count of items in ziplist */
 
    //表示是否采用了LZF压缩算法压缩quicklist节点，1表示压缩过，2表示没压缩，占2 bits长度
    unsigned int encoding : 2;        /* RAW==1 or LZF==2 */
 
    //表示一个quicklistNode节点是否采用ziplist结构保存数据，2表示压缩了，1表示没压缩，默认是2，占2bits长度
    unsigned int container : 2;       /* NONE==1 or ZIPLIST==2 */
 
    //标记quicklist节点的ziplist之前是否被解压缩过，占1bit长度
    //如果recompress为1，则等待被再次压缩
    unsigned int recompress : 1; /* was this node previous compressed? */
 
    //测试时使用
    unsigned int attempted_compress : 1; /* node can't compress; too small */
 
    //额外扩展位，占10bits长度
    unsigned int extra : 10; /* more bits to steal for future usage */
} quicklistNode;