优质博文:IT-BLOG-CN
一级缓存原理
默认关闭,一般不建议使用。为什么不建议使用我们要清楚。
先给不建议使用的原因: MyBatis
的二级缓存是和命名空间绑定的,所以通常情况下每一个Mapper
映射文件都拥有自己的二级缓存,不同Mapper
的二级缓存互不影响。在常见的数据库操作中,多表联合查询非常常见,由于关系型数据库的设计, 使得很多时候需要关联多个表才能获得想要的数据。在关联多表查询时肯定会将该查询放到某个命名空间下的映射文件中,这样一个多表的查询就会缓存在该命名空间的二级缓存中。涉及这些表的增、删、改操作通常不在一个映射文件中,它们 的命名空间不同, 因此当有数据变化时,多表查询的缓存未必会被清空,这种情况下就会产生脏数据。
一、二级缓存配置
1、配置mybatis
核心配置文件
<settings>
<!--因为cacheEnabled的取值默认就为true,所以这一步可以省略不配置。
为true代表开启二级缓存;为false代表不开启二级缓存。-->
<setting name="cacheEnabled" value="true"/>
</settings>
2、XML
开发方式: 在xxxMapper.xml
映射中配置cache
或者cache-ref
。
<mapper namespace="com.lagou.dao.UserMapper">
<!--当前映射文件开启二级缓存-->
<cache></cache>
<!--
<select>标签中设置useCache=”true”代表当前这个statement要使用二级缓存。如果不使用二级缓存可以设置为false
注意:
如果每次查询都需要最新的数据sql,要设置成useCache="false",禁用二级缓存。
-->
<select id="findById" parameterType="int" resultType="user" useCache="true"
>
SELECT * FROM `user` where id = #{id}
</select>
</mapper>
type:cache使用的类型,默认是PerpetualCache,这在一级缓存中提到过。
eviction: 定义回收的策略,常见的有FIFO,LRU。
flushInterval: 配置一定时间自动刷新缓存,单位是毫秒。
size: 最多缓存对象的个数。
readOnly: 是否只读,若配置可读写,则需要对应的实体类能够序列化。
blocking: 若缓存中找不到对应的key,是否会一直blocking,直到有对应的数据进入缓存。
cache-ref
代表引用别的命名空间的Cache
配置,两个命名空间的操作使用的是同一个Cache
。(为了解决下述问题)
先看下二级缓存存在的问题:多表联合查询产生脏数据
@Test
public void testCacheWithDiffererntNamespace() throws Exception {
SqlSession sqlSession1 = factory.openSession(true);
SqlSession sqlSession2 = factory.openSession(true);
SqlSession sqlSession3 = factory.openSession(true);
StudentMapper studentMapper = sqlSession1.getMapper(StudentMapper.class);
StudentMapper studentMapper2 = sqlSession2.getMapper(StudentMapper.class);
ClassMapper classMapper = sqlSession3.getMapper(ClassMapper.class);
System.out.println(studentMapper.getStudentByIdWithClassInfo(1));
sqlSession1.close();
System.out.println(studentMapper2.getStudentByIdWithClassInfo(1));
classMapper.updateClassName("重点一班",1);
sqlSession3.commit();
System.out.println(studentMapper2.getStudentByIdWithClassInfo(1));
}
执行结果:在这个实验中,我们引入了两张新的表,一张class
,一张classroom
。class
中保存了班级的id
和班级名,classroom
中保存了班级id
和学生id
。我们在StudentMapper
中增加了一个查询方法getStudentByIdWithClassInfo
,用于查询学生所在的班级,涉及到多表查询。在ClassMapper
中添加了updateClassName
,根据班级id
更新班级名的操作。
DEBUG [main] - Cache Hit Ratio [mapper.StudentMapper]: 0.0
DEBUG [main] - ==> Preparing: SELECT s.id,s.name,s.age,c.className as className FROM classrome cr JOIN student s ON cr.student_id == s.id JOIN class c ON cl.class_id == c.id WHERE s.id = ?
DEBUG [main] - ==> Parameters: 1(Integer)
TRACE [main] - <== Columns: id, name, age, className
TRACE [main] - <== Row: 1, 小明, 13, 一班
DEBUG [main] - <== Total: 1
StudentEntity{id=1, name='小明', age=13, className='一班'}
DEBUG [main] - Cache Hit Ratio [mapper.StudentMapper]: 0.5
StudentEntity{id=1, name='小明', age=13, className='一班'}
DEBUG [main] - ==> Preparing: UPDATE class SET name = ? WHERE id = ?
DEBUG [main] - ==> Parameters: 重点一班(String) 1(Integer)
DEBUG [main] - <== Updates: 1
DEBUG [main] - Cache Hit Ratio [mapper.StudentMapper]: 0.66666666666666666
StudentEntity{id=1, name='小明', age=13, className='一班'}
当sqlsession1
的studentmapper
查询数据后,二级缓存生效。保存在StudentMapper
的namespace
下的cache
中。当sqlSession3
的classMapper
的updateClassName
方法对class
表进行更新时,updateClassName
不属于StudentMapper
的namespace
,所以StudentMapper
下的cache
没有感应到变化,没有刷新缓存。当StudentMapper
中同样的查询再次发起时,从缓存中读取了脏数据。
为了解决上述的问题,可以使用Cache ref
,让ClassMapper
引用StudenMapper
命名空间,这样两个映射文件对应的SQL
操作都使用的是同一块缓存了。
<cache-ref namespace="mapper.StudentMapper"/>
执行结果:不过这样做的后果是,缓存的粒度变粗了,多个Mapper namespace
下的所有操作都会对缓存使用造成影响。
DEBUG [main] - Cache Hit Ratio [mapper.StudentMapper]: 0.0
DEBUG [main] - ==> Preparing: SELECT s.id,s.name,s.age,c.className as className FROM classrome cr JOIN student s ON cr.student_id == s.id JOIN class c ON cl.class_id == c.id WHERE s.id = ?
DEBUG [main] - ==> Parameters: 1(Integer)
TRACE [main] - <== Columns: id, name, age, className
TRACE [main] - <== Row: 1, 小明, 13, 一班
DEBUG [main] - <== Total: 1
StudentEntity{id=1, name='小明', age=13, className='一班'}
DEBUG [main] - Cache Hit Ratio [mapper.StudentMapper]: 0.5
StudentEntity{id=1, name='小明', age=13, className='一班'}
DEBUG [main] - ==> Preparing: UPDATE class SET name = ? WHERE id = ?
DEBUG [main] - ==> Parameters: 重点一班(String) 1(Integer)
DEBUG [main] - <== Updates: 1
DEBUG [main] - Cache Hit Ratio [mapper.StudentMapper]: 0.3333333333333
DEBUG [main] - ==> Preparing: SELECT s.id,s.name,s.age,c.className as className FROM classrome cr JOIN student s ON cr.student_id == s.id JOIN class c ON cl.class_id == c.id WHERE s.id = ?
DEBUG [main] - ==> Parameters: 1(Integer)
TRACE [main] - <== Columns: id, name, age, className
TRACE [main] - <== Row: 1, 小明, 13, 重点一班
DEBUG [main] - <== Total: 1
StudentEntity{id=1, name='小明', age=13, className='重点一班'}
注解开发方式: 或者配置Mapper
接口,添加注解
@CacheNamespace
public interface UserMapper {...}
二级缓存的开启需要进行配置,实现二级缓存的时候,
MyBatis
要求返回的POJO
必须是可序列化的,也就是要求实现Serializable
接口。
二、二级缓存清除方式
映射文件XML
中添加flushCache=“true”
<select flushCache="true"></select>
三、原理分析
在一级缓存中,其最大的共享范围就是一个SqlSession
内部,如果多个SqlSession
之间需要共享缓存,则需要使用到二级缓存。开启二级缓存后,会使用CachingExecutor
装饰Executor
,进入一级缓存的查询流程前,先在CachingExecutor
进行二级缓存的查询,具体的工作流程如下所示。
二级缓存开启后,同一个namespace
下的所有操作语句,都影响着同一个Cache
,即二级缓存被多个SqlSession
共享,是一个全局的变量。
当开启缓存后,数据的查询执行的流程就是 二级缓存 -> 一级缓存 -> 数据库。
CachingExecutor
是Executor
的装饰者,以增强Executor
的功能,使其具有缓存查询的功能,这里用到了设计模式中的装饰者模式。
CachingExecutor
的query
方法,首先会从MappedStatement
中获得在配置初始化时赋予的Cache
。
Cache cache = ms.getCache();
以下是具体这些Cache
实现类的介绍,他们的组合为Cache
赋予了不同的能力。
SynchronizedCache:同步Cache,实现比较简单,直接使用synchronized修饰方法。
LoggingCache:日志功能,装饰类,用于记录缓存的命中率,如果开启了DEBUG模式,则会输出命中率日志。
SerializedCache:序列化功能,将值序列化后存到缓存中。该功能用于缓存返回一份实例的Copy,用于保存线程安全。
LruCache:采用了Lru算法的Cache实现,移除最近最少使用的Key/Value。
PerpetualCache: 作为为最基础的缓存类,底层实现比较简单,直接使用了HashMap。
是否需要刷新缓存,代码如下所示:
flushCacheIfRequired(ms);
在默认的设置中SELECT
语句不会刷新缓存,insert/update/delte
会刷新缓存。进入该方法。代码如下所示:
private void flushCacheIfRequired(MappedStatement ms) {
Cache cache = ms.getCache();
if (cache != null && ms.isFlushCacheRequired()) {
tcm.clear(cache);
}
}
MyBatis
的CachingExecutor
持有了TransactionalCacheManager
,即上述代码中的tcm
。TransactionalCacheManager
中持有一个Map
,代码如下所示:
private Map<Cache, TransactionalCache> transactionalCaches = new HashMap<Cache, TransactionalCache>();
这个Map
保存了Cache
和用TransactionalCache
包装后的Cache
的映射关系。
TransactionalCache
实现了Cache
接口,CachingExecutor
会默认使用他包装初始生成的Cache
,作用是如果事务提交,对缓存的操作才会生效,如果事务回滚或者不提交事务,则不对缓存产生影响。
在TransactionalCache
的clear
,有以下两句。清空了需要在提交时加入缓存的列表,同时设定提交时清空缓存,代码如下所示:
@Override
public void clear() {
clearOnCommit = true;
entriesToAddOnCommit.clear();
}
CachingExecutor
继续往下走,ensureNoOutParams
主要是用来处理存储过程的,暂时不用考虑。
if (ms.isUseCache() && resultHandler == null) {
ensureNoOutParams(ms, parameterObject, boundSql);
之后会尝试从tcm
中获取缓存的列表。
List<E> list = (List<E>) tcm.getObject(cache, key);
在getObject
方法中,会把获取值的职责一路传递,最终到PerpetualCache
。如果没有查到,会把key
加入Miss
集合,这个主要是为了统计命中率。
Object object = delegate.getObject(key);
if (object == null) {
entriesMissedInCache.add(key);
}
CachingExecutor
继续往下走,如果查询到数据,则调用tcm.putObject
方法,往缓存中放入值。
if (list == null) {
list = delegate.<E> query(ms, parameterObject, rowBounds, resultHandler, key, boundSql);
tcm.putObject(cache, key, list); // issue #578 and #116
}
tcm
的put
方法也不是直接操作缓存,只是在把这次的数据和key
放入待提交的Map
中。
@Override
public void putObject(Object key, Object object) {
entriesToAddOnCommit.put(key, object);
}
从以上的代码分析中,我们可以明白,如果不调用commit
方法的话,由于TranscationalCache
的作用,并不会对二级缓存造成直接的影响。因此我们看看Sqlsession
的commit
方法中做了什么。代码如下所示:
@Override
public void commit(boolean force) {
try {
executor.commit(isCommitOrRollbackRequired(force));
因为我们使用了CachingExecutor
,首先会进入CachingExecutor
实现的commit
方法。
@Override
public void commit(boolean required) throws SQLException {
delegate.commit(required);
tcm.commit();
}
会把具体commit
的职责委托给包装的Executor
。主要是看下tcm.commit()
,tcm
最终又会调用到TrancationalCache
。
public void commit() {
if (clearOnCommit) {
delegate.clear();
}
flushPendingEntries();
reset();
}
看到这里的clearOnCommit
就想起刚才TrancationalCache
的clear
方法设置的标志位,真正的清理Cache
是放到这里来进行的。具体清理的职责委托给了包装的Cache
类。之后进入flushPendingEntries
方法。代码如下所示:
private void flushPendingEntries() {
for (Map.Entry<Object, Object> entry : entriesToAddOnCommit.entrySet()) {
delegate.putObject(entry.getKey(), entry.getValue());
}
................
}
在flushPendingEntries
中,将待提交的Map
进行循环处理,委托给包装的Cache
类,进行putObject
的操作。
后续的查询操作会重复执行这套流程。如果是insert|update|delete
的话,会统一进入CachingExecutor
的update
方法,其中调用了这个函数,代码如下所示:
private void flushCacheIfRequired(MappedStatement ms)
在二级缓存执行流程后就会进入一级缓存的执行流程,因此不再赘述。
MyBatis
的二级缓存相对于一级缓存来说,实现了SqlSession
之间缓存数据的共享,同时粒度更加的细,能够到namespace
级别,通过Cache
接口实现类不同的组合,对Cache
的可控性也更强。
MyBatis
在多表查询时,极大可能会出现脏数据,有设计上的缺陷,安全使用二级缓存的条件比较苛刻。
在分布式环境下,由于默认的MyBatis Cache
实现都是基于本地的,分布式环境下必然会出现读取到脏数据,需要使用集中式缓存将MyBatis
的Cache
接口实现,有一定的开发成本,直接使用Redis
、Memcached
等分布式缓存可能成本更低,安全性也更高。