Redis Hash数据类型
几乎所有的主流编程语言都提供了哈希(hash)类型,它们的叫法可能是哈希、字典、关联数组、映射。在 Redis 中,哈希类型是指值本身又是一个键值对结构,形如key = “key”,value = {ffield1, value1 }, … {fieldN, valueN } },Redis 键值对和哈希类型二者的关系可以用下图来表示。
字符串和哈希类型对比:
哈希类型中的映射关系通常称为 field-value,用于区分 Redis 整体的键值对(key-value) ,注意这里的 value 是指 field 对应的值,不是键 (key) 对应的值,请注意 value 在不同上下文的作用。
命令
hset和hget
hset:设置hash中指定的字段(field)的值(value)。
语法:
HSET key field value [field value ...]
时间复杂度:插入一组 field 为 O(1),插入 N 组 field 为 O(N)
返回值:添加的字段的个数。 如果当前字段已经存在,此时hset相当于更新,则返回0
示例:
redis> hset myhash field1 "Hello"
(integer) 1
redis> hget myhash field1
"Hello"
redis> hset myhash field1 hello field2 world
(integer) 2
hget:获取 hash 中指定字段的值。
语法:
HGET key field
时间复杂度:O(1)
返回值:字段对应的值或者nilo
示例:
redis> hset myhash field1 "foo"
(integer) 1
redis> hget myhash field1
"foo"
redis> hget myhash field2
(nil)
hexists
判断hash中是否有指定的字段。
语法:
HEXISTS key field
时间复杂度:O(1)
返回值:1 表示存在,0 表示不存在。
示例:
redis> hset myhash field1 "foo"
(integer) 1
redis> hexists myhash field1
(integer) 1
redis> hexists myhash field2
(integer) 0
hdel
删除hash中指定的字段。
语法:
HDEL key field [field ...]
时间复杂度:删除⼀个元素为 O(1) 删除 N 个元素为 O(N).
返回值:本次操作删除的字段个数。
示例:
redis> hset myhash field1 "foo"
(integer) 1
redis> hdel myhash field1
(integer) 1
redis> hexists myhash filed
(integer) 0
redis> hdel myhash field2
(integer) 0
hkeys
获取hash中的所有字段。
语法:
HKEYS key
时间复杂度:O(N), N 为 field 的个数.。
返回值:字段列表。
示例:
redis> hset myhash field1 "Hello"
(integer) 1
redis> hset myhash field2 "World"
(integer) 1
redis> hkeys myhash
1) "field1"
2) "field2"
hvals
获取hash中的所有的值。
语法:
HVALS key
时间复杂度:O(N), N 为 field 的个数。
返回值:所有的值。
示例:
redis> hset myhash field1 "Hello"
(integer) 1
redis> hset myhash field2 "World"
(integer) 1
redis> hvals myhash
1) "Hello"
2) "World"
hgetall
获取 hash 中的所有字段以及对应的值。
语法:
HGETALL key
时间复杂度:O(N), N 为 field 的个数
返回值:字段和对应的值。
示例:
redis> hset myhash field1 "Hello"
(integer) 1
redis> hset myhash field2 "World"
(integer) 1
redis> hgetall myhash
1) "field1"
2) "Hello"
3) "field2"
4) "World"
hmget
⼀次获取hash中多个字段的值。
语法:
HMGET key field [field ...]
时间复杂度:只查询⼀个元素为 O(1), 查询多个元素为 O(N), N 为查询元素个数。
返回值:字段对应的值或者 nil。
示例:
redis> hset myhash field1 "Hello"
(integer) 1
redis> hset myhash field2 "World"
(integer) 1
redis> hmget myhash field1 field2 nofield
1) "Hello"
2) "World"
3) (nil)
在使用 HGETALL 时,如果哈希元素个数比较多,会存在阻塞 Redis 的可能。如果开友人员只需要获取部分 field,可以使用 HMGET,如果一定要获取全部field,可以尝试使用 HSCAN 命令,该命令采用渐进式遍历哈希类型。
hlen
获取 hash 中的所有字段(key)的个数。
语法:
HLEN key
时间复杂度:O(1)
返回值:字段个数。
示例:
redis> hset myhash field1 "Hello"
(integer) 1
redis> hset myhash field2 "World"
(integer) 1
redis> hlen myhash
(integer) 2
hsetnx
在字段不存在的情况下,设置 hash 中的字段和值。
语法:
HSETNX key field value
时间复杂度:O(1)
返回值:1 表示设置成功,0 表示失败。
示例:
redis> hsetnx myhash field "Hello"
(integer) 1
redis> hsetnx myhash field "World"
(integer) 0
redis> hget myhash field
"Hello"
hincrby
将hash中字段对应的数值添加指定的值。
语法:
HINCRBY key field increment
时间复杂度:O(1)
返回值:该字段变化之后的值。
示例:
redis> hset myhash field 5
(integer) 1
redis> hincrby myhash field 1
(integer) 6
redis> hincrby myhash field -1
(integer) 5
redis> hincrby myhash field -10
(integer) -5
hincrbyfloat
hincrby的浮点数版本。
语法:
HINCRBYFLOAT key field increment
时间复杂度:O(1)
返回值:该字段变化之后的值。
示例:
redis> hset mykey field 10.50
(integer) 1
redis> hincrbyfloat mykey field 0.1
"10.6"
redis> hincrbyfloat mykey field -5
"5.6"
redis> hset mykey field 5.0e3 #5000
(integer) 0
redis> HINCRBYFLOAT mykey field 2.0e2 #200
"5200"
内部编码
哈希的内部编码有两种:
- ziplist(压缩列表):当哈希类型元素个数小于 hash-max-ziplist-entries 配置(默认512个)、同时所有值都小于 hash-max-ziplist-value 配置默认64字节)时,Redis 会使用 ziplist 作为哈希的内部实现,ziplist 使用更加紧凑的结构实现多个元素的连续存储,所以在节省内存方面比 hashtable 更加优秀。
- hashtable (哈希表)︰当哈希类型无法满足 ziplist 的条件时,Redis 会使用 hashtable 作为哈希的内部实现,因为此时 ziplist 的读写效率会下降,而 hashtable 的读写时间复杂度为O(1)。
下面的示例演示了哈希类型的内部编码,以及响应的变化。
1)当 field 个数比较少且没有大的 value 时,内部编码为 ziplist:
127.0.0.1:6379> hmset hashkey f1 v1 f2 v2
OK
127.0.0.1:6379> object encoding hashkey
"ziplist"
2)当有 value 大于 64 字节时,内部编码会转换为 hashtable:
127.0.0.1:6379> hset hashkey f3 6666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666
(integer) 1
127.0.0.1:6379> object encoding hashkey
"hashtable"
3)当 field 个数超过 512 时,内部编码也会转换为 hashtable
127.0.0.1:6379> hmset hashkey f1 v1 f2 v2 f3 v3 ... 省略 ... f513 v513
OK
127.0.0.1:6379> object encoding hashkey
"hashtable"
使用场景
图"关系型数据表保存用户信息"为关系型数据表记录的两条用户信息,用户的属性表现为表的列,每条用户信息表现为行。如果映射关系表示这两个用户信息,则如图"映射关系表示用户信息"所示。
关系型数据表保存用户信息:
映射关系表示用户信息:
相比于使用Json格式的字符串缓存用户信息,哈希类型变得更加直观,并且在更新操作上变得更灵活。可以将每个用户的id定义为键后缀,多对field-value对应用户的各个属性,类似如下伪代码:
UserInfo getUserInfo(long uid) {
// 根据 uid 得到 Redis 的键
String key = "user:" + uid;
// 尝试从 Redis 中获取对应的值
userInfoMap = Redis 执⾏命令:hgetall key;
// 如果缓存命中(hit)
if (value != null) {
// 将映射关系还原为对象形式
UserInfo userInfo = 利⽤映射关系构建对象(userInfoMap);
return userInfo;
}
// 如果缓存未命中(miss)
// 从数据库中,根据 uid 获取⽤⼾信息
UserInfo userInfo = MySQL 执⾏ SQL:select *from user_info where uid = <uid>
// 如果表中没有 uid 对应的⽤⼾信息
if (userInfo == null) {
响应 404
return null;
}
// 将缓存以哈希类型保存
Redis 执⾏命令:hmset key name userInfo.name age userInfo.age city userInfo.c
// 写⼊缓存,为了防⽌数据腐烂(rot),设置过期时间为 1 ⼩时(3600 秒)
Redis 执⾏命令:expire key 3600
// 返回⽤⼾信息
return userInfo;
}
但是需要注意的是哈希类型和关系型数据库有两点不同之处:
- 哈希类型是稀疏的,而关系型数据库是完全结构化的,例如哈希类型每个键可以有不同的 field,而关系型数据库一旦添加新的列,所有行都要为其设置值,即使为null
- 关系数据库可以做复杂的关系查询,而 Redis去模拟关系型复杂查询例如联表查询、聚合查询等基本不可能,维护成本高。
缓存方式对比
- 原生字符串类型⸺使用字符串类型,每个属性⼀个键。
set user:1:name James
set user:1:age 23
set user:1:city Beijing
- 优点:实现简单,针对个别属性变更也很灵活。
- 缺点∶占用过多的键,内存占用量较大,同时用户信息在Redis中比较分散,缺少内聚性,所以这种方案基本没有实用性。
- 序列化字符串类型,例如 JSON 格式
set user:1 经过序列化后的⽤⼾对象字符串
- 优点∶针对总是以整体作为操作的信息比较合适,编程也简单。同时,如果序列化方案选择合适,内存的使用效率很高。
- 缺点:本身序列化和反序列需要一定开销,同时如果总是操作个别属性则非常不灵活。
- 哈希类型
hmset user:1 name James age 23 city Beijing
- 优点:简单、直观、灵活。尤其是针对信息的局部变更或者获取操作。
。
set user:1:name James
set user:1:age 23
set user:1:city Beijing
- 优点:实现简单,针对个别属性变更也很灵活。
- 缺点∶占用过多的键,内存占用量较大,同时用户信息在Redis中比较分散,缺少内聚性,所以这种方案基本没有实用性。
- 序列化字符串类型,例如 JSON 格式
set user:1 经过序列化后的⽤⼾对象字符串
- 优点∶针对总是以整体作为操作的信息比较合适,编程也简单。同时,如果序列化方案选择合适,内存的使用效率很高。
- 缺点:本身序列化和反序列需要一定开销,同时如果总是操作个别属性则非常不灵活。
- 哈希类型
hmset user:1 name James age 23 city Beijing
- 优点:简单、直观、灵活。尤其是针对信息的局部变更或者获取操作。
- 缺点:需要控制哈希在ziplist和 hashtable两种内部编码的转换,可能会造成内存的较大消耗。