1.为什么缓存和MySQL数据没有保持一致性?
数据一致性是什么意思,“一致性”包含如下情况:
- 若缓存中有数据,则缓存的数据值需要和DB值相同
- 若缓存无数据,则DB值必须是最新值
不符合这两种情况的,都属于缓存和DB数据不一致。
不过,当缓存的读写模式不同时,缓存数据不一致的发生情况不一样,应对方法也有所不同。
先按照缓存读写模式,来分别了解下不同模式下的缓存不一致情况。根据是否接收写请求,可以把缓存分成读写缓存和只读缓存。
对于读写缓存,若要对数据进行增删改,就需要在缓存中进行,同时还要根据采取的写回策略,决定是否同步写回DB。
同步直写策略:写缓存时,也同步写数据库,缓存和数据库中的数据一致;
异步写回策略:写缓存时不同步写数据库,等到数据从缓存中淘汰时,再写回数据库。使用这种策略时,如果数据还没有写回数据库,缓存就发生了故障,那么,此时,数据库就没有最新的数据了。
所以,对于读写缓存来说,要想保证缓存和数据库中的数据一致,就要采用同步直写策略。不过,需要注意的是,如果采用这种策略,就需要同时更新缓存和数据库。所以,我们要在业务应用中使用事务机制,来保证缓存和数据库的更新具有原子性,也就是说,两者要不一起更新,要不都不更新,返回错误信息,进行重试。否则,我们就无法实现同步直写。
当然如果对数据的一致性要求没有那么高,可以使用异步写回策略。
对于只读缓存来说,如果有数据新增,会直接写入数据库;而有数据删改时,就需要把只读缓存中的数据标记为无效。这样一来,应用后续再访问这些增删改的数据时,因为缓存中没有相应的数据,就会发生缓存缺失。此时,应用再从数据库中把数据读入缓存,这样后续再访问数据时,就能够直接从缓存中读取了。
1.新增数据
如果是新增数据,数据会直接写到数据库中,不用对缓存做任何操作,此时,缓存中本身就没有新增数据,而数据库中是最新值,这种情况符合我们刚刚所说的一致性的第2种情况,所以,此时,缓存和数据库的数据是一致的。
2.删改数据
如果发生删改操作,应用既要更新数据库,也要在缓存中删除数据。这两个操作如果无法保证原子性,也就是说,要不都完成,要不都没完成,此时,就会出现数据不一致问题了。
假设应用先删除缓存,再更新数据库,如果缓存删除成功,但是数据库更新失败,那么,应用再访问数据时,缓存中没有数据,就会发生缓存缺失。然后,应用再访问数据库,但是数据库中的值为旧值,应用就访问到旧值了。
2.为什么删除缓存而不是更新?
如果是更新,存在分布式事务问题,可能出现修改了缓存,数据库修改失败的情况。只是删除缓存的话,就算数据库修改失败,下次查询会直接取数据库的数据,也不会出现脏数据。
3.延时双删是什么?
就是在增删改某实体类的时候,要对该实体类的缓存进行清空,清空的位置在数据库操作方法的前后。
4.为什么不能采用先删或者后删策略?
先删流程:
后删流程:
先删和后删都不能保证数据的一致性,所以采用延时双删的策略。
4.为什么是延时?
双删依然存在旧缓存的情况,延时是确保 修改数据库->清空缓存前,其他事务的更改缓存操作已经执行完。
5.为什么要延迟双删,来保证缓存一致性
-
在修改数据库数据前,需要先删除一次redis:此时是为了保证在数据库数据修改和redis数据被删除的间隔时间内,如有命中,保证此数据也不存在redis中。如果没有这一次删除,当数据库数据已经被修改了,但是还是可以从redis中读出旧数据,导致数据不一致。
-
第二次删除则是在修改数据库数据后,此时需要再次删除redis中对应数据一次,这一次是为了删除 第一次redis删除和数据库数据修改之间,如果有请求,那么旧数据又会重新缓存到redis中,然而数据在数据库中在接下来就会被修改,如果没有这一次删除,redis中则会存在数据库中旧的数据。
-
那么第二次为什么需要在数据库修改后延迟一定时间再删除redis呢?
-
为了等待之前的一次读取数据库,并等待其数据写入到缓存,最后删除这次脏数据,所以是一次数据从数据库中发到服务器+缓存写入的时间
但是延迟双删,所延迟的时间非常的难以确定,所以并不推荐延迟双删
根据综合考虑,即使先修改数据库,在删除缓存,有一定的时间会导致读取到旧数据,这通常是可以被忍受的。
只要及时将缓存删除,其他线程就可以读取到最新的值。
同时为了保证缓存一定会被删除,可以采用mq,来保证缓存会被删除
如果在mq中消息没有被重复消费,还会交由给其他消费者消费(将缓存删除)
6.解决方案
- 更新数据库数据
- 数据库会将操作信息写入binlog日志当中
- 订阅程序提取出所需要的数据以及key
- 另起一段非业务代码,获得该信息
- 尝试删除缓存操作,发现删除失败
- 将这些信息发送至消息队列
- 重新从消息队列中获得该数据,重试操作。