1. 为什么需要客户端缓存
antirez 写了一篇有关客户端缓存设计的想法:《Client side caching in Redis 6》。antirez 认为,Redis 接下来的一个重点是配合客户端,因为客户端缓存显而易见的可以减轻 Redis 的压力,速度也快很多。实际上,几乎每个大公司都有实现这种应用端缓存的机制,antirez 想通过 server 端的一些设计来减少客户端缓存实现的复杂度和成本,甚至不惜在 Redis 协议上做修改。
1.1 低延迟和大规模提供数据服务
如果我们需要快速存储和快速缓存
,那么我们需要在客户端内部存储一部分信息
。它是以低延迟
和大规模提供数据服务
理念的自然延伸。几乎每个非常大的公司已经这样做了,现在来看,这是最终能承受负载的唯一途径。
一起来看个例子:为了能够提高数据访问性能,进一步应对热点数据,很多公司会在 Redis 的 client 端缓存一部分热点数据,来应对大众所热衷的「吃⽠事件」。比如:「时间管理大师」、「我从来没觉得我这么欠打过」…
1.2 其他 cache 层
除了使⽤ Redis 缓存避免直接访问数据库以外,还会加更多的 cache
层,⽐如采⽤ Memcachced
作为热点数据的本地缓存:
- 先去 Memcachced 中查询数据,命中直接返回;
- Memcachced 未命中,则再从 Redis 查询,命中则返回数据,并在 Memcachced 保存这个数据;
- Redis 未命中,则去 MySQL 中查询,并依次设置到 Redis 和 Memcachced 中。
2. Redis 中的客户端缓存
在 Redis 官方文档是这么定义客户端缓存的:Server-assisted, client-side caching in Redis(Redis 服务端协助的客户端缓存)。
客户端缓存是一种用于创建高性能服务的技术。它利用应用程序服务器上可用的内存(与数据库节点相比,这些服务器通常是不同的计算机),直接在应用程序端存储数据库信息的一些子集。
需要获取某些数据时,应用程序向 Redis 数据库访问这些数据:
当使用客户端缓存时,应用程序会将获取的数据存储在应用程序内存中,无需再次网络访问 Redis:
虽然应用程序内存被当做本地缓存使用的可能性不大,但与通过网络直接访问数据库相比,访问本地计算机缓存所需要的时间要少几个数量级。
2.1 什么样的数据集应该被客户端缓存
-
我们不应该缓存不断变化的键;
-
我们不该缓存很少请求的键;
-
我们希望缓存经常请求并以合理速率更改的键。对于没有稳定变化速度的例⼦,⽐如不断被 INCR 修改的全局计数器,就不应该缓存。
2.2 客户端缓存的两个主要优点
-
低延迟提供数据访问
-
更少的请求到数据库系统,允许它以更少的节点数提供相同的数据集。
3. 缓存的数据一致性问题
上面已经介绍了客户端缓存的大体流程,但这种模式存在 “数据一致性问题” 。例如,在上面的应用程序在本地缓存了 user:1234 的信息后,“没对象的指针” 可能会将她的用户名在 Redis 服务端更新为 “Flora”。然而,该应用程序可能会继续为用户提供旧用户名:没对象的指针。
网上有很多数据一致性的解决方案,这里就不再赘述了。下面一起来看一下 Redis 是怎么处理客户端缓存数据的吧。
4. Redis 客户端缓存的实现原理
Redis 实现的是一个服务端协助客户端缓存(Server-assisted, client-side caching),叫做:Tracking
。有两种模式:
-
在
普通(默认)模式
下,Redis 会记住每个客户端请求的 key,当 key 值发生变化时会发送失效信息(invalidation messages)给客户端。 -
在
广播模式
下,Redis 不会记录客户端请求的 key,因此这种模式在服务器端不消耗任何内存。相反,客户机订阅 key 的前缀,如 object: 或 user: ,并且在每次接触与该前缀匹配的 key 时收到一条通知消息。
4.1 普通模式
4.1.1 实现思路
-
客户端可以根据需要启用 tracking ;
-
启用 tracking 后,服务端会记住每个客户端在连接生命周期内请求的 key(通过发送有关此类 key 的读命令);
-
当 key 发生变化时(客户端修改、key 过期失效、最大内存策略被逐出等),所有启动了 tracking 且可能缓存了该 key 的客户端都会收到一条失效消息通知;
-
当客户端售后无效消息时,需要删除响应的 key,以免提供过时的数据。
4.1.2 一起看一个该模式下的实例:
Client 1 -> Server: CLIENT TRACKING ON
Client 1 -> Server: GET foo
(The server remembers that Client 1 may have the key "foo" cached)
(Client 1 may remember the value of "foo" inside its local memory)
Client 2 -> Server: SET foo SomeOtherValue
Server -> Client 1: INVALIDATE "foo"
4.1.3 Redis 是如何实现
这从表面上看起来很不错,但如果有一个 10K 连接的客户端需要长时间请求数百万个 key,那么服务器最终会存储很多信息。为此,Redis 使用如下思想来限制服务端使用的内存和处理实现该功能的数据结构的CPU成本:
-
Server 端将 Client 端访问的
key
以及该 key 对应的客户端ID
的列表信息储存在全局唯一的表 -TrackingTable(Invalidation Table - 失效表)
。当表中插入了新的 key,且超过设置的最大记录数 -tracking-table-max-keys
,则会(随机)删除旧 tracking 的 key(即使这个 key 未被修改),并向客户端发送 invalidation message(失效消息)。 -
每个 Redis 客户端都有一个唯一的ID,TrackingTable 会存储每个
Client ID
。如果客户端断开连接
,缓存失效,则会清除
该ID对应的记录。 -
有一个
键命名空间
,不按数据库编号划分
。因此,如果客户端正在缓存 foo 数据库 2 中的 key,而其他一些客户端更改了 foo 数据库 3 中 key 的值,则仍会发送无效消息。这样我们就可以忽略数据库编号,从而减少内存使用和实现复杂性。
可以通过 redis.config 文件的 tracking-table-max-keys
属性设置记录 key 的最大值:
# 在广播模式下使用 key tracking 时,服务器端未使用任何内存,此设置无用。
tracking-table-max-keys 1000000
4.2 广播模式(BCAST)
当⼴播模式 (broadcasting) 开启时,服务端不会记录给定客户端访问了哪些键,不消耗服务端的任何内存。
在广播模式下,服务端会给客户端广播所有 key 的失效
情况,不过,这样做了之后,如果 key 被频繁修改
,服务端会发送大量
的失效广播消息,这就会消耗大量的网络带宽资源
。
所以,在实际应用时,我们会让客户端注册希望跟踪的 key 的前缀
,当带有注册前缀的 key 被修改时,服务端会把失效消息广播给所有注册的客户端。
和普通模式不同,在广播模式下,即使客户端还没有读取过 key,但只要它注册了要跟踪的 key,服务端都会把 key 失效消息通知给这个客户端。我们在实际应用时,会给同一业务下的 key 设置相同的业务名前缀,所以,我们就可以非常方便地使用广播模式。
4.2.1 广播模式的主要行为
-
客户端使用该选项启用客户端缓存BCAST,使用该选项指定一个或多个前缀
PREFIX
。例如:CLIENT TRACKING on REDIRECT 10 BCAST PREFIX object: PREFIX user:。如果没有指定前缀,则前缀默认为空字符串,因此客户端将收到每个被修改的 key 的失效消息。相反,如果使用一个或多个前缀,则只有与指定前缀之一匹配的 key 才会在失效消息中发送。 -
服务器不在 invalidation table 中存储任何内容。相反,它使用不同的
Prefixes Table
,其中每个前缀都与一个客户端列表相关联。 -
没有两个前缀可以跟踪键空间的重叠部分。例如,不允许使用前缀 “foo” 和 “foob”,因为它们都会触发为 “foobar” 的 key 使之无效。仅使用前缀 “foo” 就足够了。
-
每次修改与任何前缀匹配的 key 时,订阅该前缀的所有客户端都将收到无效消息。
-
服务端消耗的 CPU 与注册前缀的数量成正比。如果你只有几个,很难看出有什么区别。使用大量前缀,CPU 成本会变得相当大。
-
在这种模式下,服务端可以执行优化,为订阅给定前缀的所有客户端创建单个回复,并向所有客户端发送相同的回复。这有助于降低 CPU 使用率。
4.3 重定向模式
普通模式和广播模式,需要客户端使用 RESP 3 协议,它是 Redis 6.0 新启⽤的协议。
对于使用 RESP 2 协议的客户端来说,就需要使用另一种模式,也就是重定向模式(redirect)。
在重定向模式下,想要获得失效消息通知的客户端,就需要执行订阅命令 SUBSCRIBE(subscribe 订阅),专门订阅用于发送失效 key 消息的频道 redis:invalidate。同时,再使用另外一个客户端,执行 CLIENT TRACKING(client tracking 客户跟踪)命令,设置服务端将失效消息转发给使用 RESP 2 协议的客户端。