Java面试八股之Redis有哪些数据类型？底层实现分别是什么

news2026/2/15 5:54:05

Redis有哪些数据类型？底层实现分别是什么

Redis数据类型概述

Redis作为一款键值存储系统，提供了丰富多样的数据类型以满足不同场景的需求。以下是Redis支持的主要数据类型及其基本用途：

String（字符串）

存储单个键值对，支持增删改查、自增、截取等操作。

应用场景：计数器、缓存、分布式锁等。

底层实现：Redis字符串是动态字符串（SDS），其内部结构包含长度、已用长度和字节数组。

编码方式：Redis对字符串值的存储采用多种编码，如：

REDIS_ENCODING_INT：当值为整数且在一定范围内时，直接存储整数值，节省空间。

REDIS_ENCODING_EMBSTR：对于短字符串，使用embstr编码，将字符串与结构体紧凑存储在同一块连续内存中，减少内存分配次数。

REDIS_ENCODING_RAW：长字符串或非整数值使用raw编码，即传统的简单动态字符串。

List（列表）

有序的字符串列表，支持两端插入、弹出、范围查询等操作。

应用场景：消息队列、最新N个元素列表等。

底层实现：列表有两种编码方式，分别是：

ziplist（压缩列表）：对于元素数量少且元素长度较短的列表，使用连续内存存储，节省空间。

linkedlist（双端链表）：当列表元素数量或长度超过一定阈值时，转为双端链表实现，保证操作的高效性。

Set（集合）

无序的字符串集合，不允许重复成员，支持添加、删除、成员关系判断等操作。

应用场景：标签系统、唯一性检查、交并差集运算等。

底层实现：集合也有两种编码：

intset（整数集合）：当集合中所有元素都是整数且范围适当时，使用整数集合存储，空间效率高。

hashtable（哈希表）：当集合包含非整数元素或元素数量超过一定阈值时，转化为哈希表实现，提供快速的增删查操作。

Sorted Set（有序集合）

类似集合，但每个成员附带一个分数，依据分数进行排序。

支持添加、删除、按分数范围查询、排名、聚合操作等。

应用场景：排行榜、带权重的标签系统、Top N查询等。

底层实现：有序集合基于ziplist或skiplist（跳跃表）编码：

ziplist：小型有序集合，使用压缩列表存储，元素按分数排序。

skiplist：大型有序集合，使用跳跃表实现，提供O(log N)的插入、删除、查找等操作，同时保留了集合成员的顺序。

Hash（哈希）

键值对的集合，每个键值对由field-value组成。

支持增删改查单个field，批量操作整个哈希。

应用场景：对象属性存储、购物车等。

底层实现：哈希同样存在两种编码：

ziplist：对于小规模哈希（字段数量和值长度较小），使用压缩列表存储，紧凑且高效。

hashtable：当哈希的字段数量或值长度超过阈值时，转化为哈希表实现，提供快速的字段查找和更新。

Bitmaps（位图）

功能：Bitmaps允许以位（bit）为单位存储数据，非常适合用来表示稀疏的二进制状态，如用户签到、统计用户行为等。

应用案例：用户签到系统

假设有一个网站需要记录用户每天的签到情况。对于每个用户，我们可以使用一个唯一的用户ID作为键名，用Bitmaps来表示其连续365天的签到状态。每天签到时，使用SETBIT命令将对应日期的位设置为1。查询用户在过去一周是否有连续签到，则可通过BITCOUNT命令计算过去7天的位图中值为1的位数。

底层实现：在Redis中，位图实际上是基于字符串（String）类型实现的，每个字节（8位）对应字符串中的一个字符。通过对字符串执行位操作命令（如SETBIT, GETBIT, BITCOUNT, BITOP等），可以高效地进行位的增删查改。

HyperLogLog

功能：HyperLogLog是一种概率数据结构，用于估算集合中不重复元素（基数）的大致数量，而不需要存储所有元素。它以极小的空间开销（通常几百字节）提供接近精确的计数，适用于大规模唯一计数场景，如网站独立访客统计、唯一事件计数等。

应用案例：网站独立访客统计

在一个网站中，需要统计每天访问的独立访客数，但不想为每个访客保存完整的访问记录。可以为每天创建一个HyperLogLog键，每当有新的访客访问时，将其唯一标识符（如IP地址或用户代理字符串的哈希值）添加到当天的HyperLogLog中。使用PFADD命令添加元素，PFCOUNT命令获取估计的独立访客数。