Redis简单
1、Redis
Redis是一个基于内存的key-value结构数据库。Redis 是互联网技术领域使用最为广泛的存储中间件。
**官网:**https://redis.io
**中文网:**https://www.redis.net.cn/
**key-value结构存储:**
**主要特点:**
- 基于内存存储,读写性能高
- 适合存储**热点数据**(热点商品、资讯、新闻)
- 企业应用广泛
Redis是用C语言开发的一个开源的高性能键值对(key-value)数据库,官方提供的数据是可以达到100000+的
QPS(每秒内查询10W次)。它存储的value类型比较丰富,也被称为结构化的NoSql数据库。
NoSql(Not Only SQL),不仅仅是SQL,泛指**非关系型数据库**。NoSql数据库并不是要取代关系型数据
库,而是关系型数据库的补充。
**关系型数据库(RDBMS):**
- Mysql
- Oracle
- DB2
- SQLServer
**非关系型数据库(NoSql):**
- Redis
- Mongo db
- MemCached
Redis安装包分为windows版和Linux版:
- Windows版下载地址:https://github.com/microsoftarchive/redis/releases
- Linux版下载地址: https://download.redis.io/releases/
Redis的安装
1)在Windows中安装Redis(项目中使用)
Redis的Windows版属于**绿色软件**,直接解压即可使用。
redis-cli.exe: Redis客户端redis-client
2)在Linux中安装Redis(简单了解)
> - 后续学完Linux课程再操作
> - mac系统安装和Linux一样
> - mac不想自己编译安装,参考:https://blog.csdn.net/realize_dream/article/details/106227622
在Linux系统安装Redis步骤:
1. 将Redis安装包上传到Linux
2. 解压安装包,命令:tar -zxvf redis-4.0.0.tar.gz -C /usr/local
3. 安装Redis的依赖环境gcc,命令:yum install gcc-c++
4. 进入/usr/local/redis-4.0.0,进行编译,命令:make
5. 进入redis的src目录进行安装,命令:make install
安装后重点文件说明:
- /usr/local/redis-4.0.0/src/redis-server:Redis服务启动脚本
- /usr/local/redis-4.0.0/src/redis-cli:Redis客户端脚本
- /usr/local/redis-4.0.0/redis.conf:Redis配置文件
2、Redis服务启动与停止
服务启动命令
#手动指定配置文件
redis-server.exe redis.windows.conf
Redis服务默认端口号为 **6379** ,通过快捷键**Ctrl + C** 即可停止Redis服务
当Redis服务启动成功后,可通过客户端进行连接。
客户端连接命令 : redis-cli.exe
通过redis-cli.exe命令默认连接的是本地的redis服务,并且使用默认6379端口。也可以通过指定如下参数
连接:redis-cli.exe -h 127.0.0.1 -p 6379 -a 123456
- -h ip地址
- -p 端口号
- -a 密码(如果需要)
设置Redis服务密码,修改redis.windows.conf
#requirepass password
requirepass 123456
**注意:**
- **修改密码后需要重启Redis服务才能生效**
- Redis配置文件中 # 表示注释
重启Redis后,再次连接Redis时,需加上密码,否则**能连接成功但无法执行指令**
redis-cli.exe -h localhost -p 6379 -a 123456
#a: auth校验
此时,-h 和 -p 参数可省略不写。
3、Redis客户端图形化工具及数据类型
默认提供的客户端连接工具界面不太友好,同时操作也较为麻烦,接下来,引入一个Redis客户端图形工具。
安装完毕后,直接双击启动
> mac或者linux下载地址:https://goanother.com/cn/#download
Redis存储的是key-value结构的数据,其中**key一般使用字符串**,value有**5种常用**的数据类型:
- 字符串 string
- 哈希 hash
- 列表 list
- 集合 set
- 有序集合 sorted set / zset
- bitmap 位图类型
- geo 地理位置类型
- HyperLogLog 基数统计类型
- 字符串(string):普通字符串,Redis中最简单的数据类型
- 哈希(hash):也叫散列,类似于Java中的HashMap结构
- 列表(list):按照插入顺序排序,可以有重复元素,类似于Java中的LinkedList
- 集合(set):无序集合,没有重复元素,类似于Java中的HashSet
- 有序集合(sorted set/zset):集合中每个元素关联一个分数(score),根据分数升序排序,没有重复元素
new HashMap<String, 常用的5种类型>();
1、new HashMap<String, String>();
2、new HashMap<String, new HashMap<>>();
3、new HashMap<String, new ArrayList<>>();
4、new HashMap<String, new HashSet<>>();
5、new HashMap<String, new 有序set<>>();
4、Redis常用命令
Redis 中字符串类型常用命令:
- SET key value 设置指定key的值
- GET key 获取指定key的值
- SETE key seconds value 设置指定key的值,并将 key 的过期时间设为 seconds 秒
set ex(expire:过期)
- SETNX key value 只有在 key不存在时设置 key 的值
set nx(not exist:不存在)
更多命令可以参考Redis中文网:https://www.redis.net.cn
哈希操作:
Redis hash 是一个string类型的 field 和 value 的映射表,hash特别适合用于存储对象,常用命令:
- HSET key field value 将哈希表 key 中的字段 field 的值设为 value
hset: hash set
- HGET key field 获取存储在哈希表中指定字段的值
hget: hast get
- HDEL key field 删除存储在哈希表中的指定字段
- HKEYS key 获取哈希表中所有字段
- HVALS key 获取哈希表中所有值
hvals: hash values
- HGETALL key 获取在哈希表中指定 key 的所有字段和值
hgetall: hast get all
企业开发中常用格式:
hset students 101 "{name:zhangsan, age:20}"
hset students 102 "{name:lisi, age:25}"
列表list操作
Redis 列表是简单的字符串列表,按照插入顺序排序,常用命令:
LPUSH key value1 [value2] 将一个或多个值插入到列表头部
lpush mylist d c b a
#list push中可以保存相同的元素
#lpush mylist a b
#right push: rpush
LRANGE key start stop 获取列表指定范围内的元素
lrange mylist 0 -1
#-1代表list中最后一个元素的位置
- RPOP key 移除并获取列表最后一个元素
- LLEN key 获取列表长度
- BRPOP key1 [key2 ] timeout 移出并获取列表的最后一个元素, 如果列表没有元素会阻塞直到等待超时
或发现可弹出元素为止
brpop: block right pop
集合set操作
Redis set 是string类型的无序集合。集合成员是唯一的,这就意味着集合中不会出现重复的数据,常用命令:
- SADD key member1 [member2] 向集合添加一个或多个成员
sadd myset a b c d a b
- SMEMBERS key 返回集合中的所有成员
SMEMBERS myset
#返回结果:a b c d
#发现没有重复的元素
- SCARD key 获取集合的成员数
- SINTER key1 [key2] 返回给定所有集合的交集
sadd myset2 c d e f
#求myset和myset2的交集:两个集合中都有的元素
sinter myset myset2
#会输出c d
- SUNION key1 [key2] 返回所有给定集合的并集
sunion myset myset2
#会输出:a b c d e f
- SREM key member1 [member2] 移除集合中一个或多个成员
#srem: set remove
srem myset a b
有序集合zset操作
Redis有序集合是string类型元素的集合,且不允许有重复成员。每个元素都会关联一个double类型的分数(score)。
redis正是通过分数来为集合中的成员进行从小到大排序。有序集合的成员是唯一的,但分数却可以重复。
常用命令:
- ZADD key score1 member1 [score2 member2] 向有序集合添加一个或多个成员,或者更新已存在成员的分数
zadd myzset 80 wangwu
zadd myzset 100 zhangsan 60 lisi
- ZRANGE key start stop [WITHSCORES] 通过索引区间返回有序集合中指定区间内的成员
#默认是升序:从小到大(根据score)
zrange myzset 0 -1
#1) "lisi"
#2) "wangwu"
#3) "zhangsan"
#如果想倒序:zrevrange key start stop [WITHSCORES]
#revert:反转
zrevrange myzset 0 -1
#1) "zhangsan"
#2) "wangwu"
#3) "lisi"
- ZINCRBY key increment member 有序集合中对指定成员的分数加上增量 increment
#给wangwu增加30分
#increment:增长
zincrby myzset 30 wangwu
zrevrange myzset 0 -1
- ZREM key member [member ...] 移除有序集合中的一个或多个成员
通用命令
Redis的通用命令是不分数据类型的,都可以使用的命令:
- KEYS pattern 查找所有符合给定模式( pattern)的 key
- EXISTS key 检查给定 key 是否存在
- TYPE key 返回 key 所储存的值的类型
- DEL key 该命令用于在 key 存在是删除 key
- TTL key 返回给定 key 的剩余生存时间(TTL, time to live),以秒为单位
共有3种返回结果:
-1: 没有过期时间,永久有效
-2:已经过期或者不存在这个一个key
正数:代表还能在内存中存活的时间,单位:秒
5、Spring Data Redis使用方式
Redis 的 Java 客户端很多,常用的几种:
- Jedis: 在java中操作Redis
- Lettuce
- Spring Data Redis
Spring 对 Redis 客户端进行了整合,提供了 Spring Data Redis,在Spring Boot项目中还提供了对应的
Starter,即 spring-boot-starter-data-redis。
重点学习Spring Data Redis。
1).导入Spring Boot提供了对应的Starter,maven坐标:
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>
Spring Data Redis中提供了一个高度封装的类:RedisTemplate,对相关api进行了归类封装,将同一类型操作
封装为operation接口,具体分类如下:
- ValueOperations:string数据操作
- SetOperations:set类型数据操作
- ZSetOperations:zset类型数据操作
- HashOperations:hash类型的数据操作
- ListOperations:list类型的数据操作
2). 配置Redis数据源
#sky:
redis:
host: localhost
port: 6379
#设置密码,没有设置则注释掉
password: 123456
database: 0
database:指定使用Redis的哪个数据库,Redis服务启动后默认有16个数据库,编号分别是从0到15
#可以使用select 切换不同的数据库
select 0
select 1
在application.yml中添加读取application-dev.yml中的相关Redis配置
spring:
profiles:
active: dev
redis:
host: ${sky.redis.host}
port: ${sky.redis.port}
password: ${sky.redis.password}
database: ${sky.redis.database}
3). 编写配置类,创建RedisTemplate对象
@Configuration
@Slf4j
public class RedisConfiguration {
@Bean
public RedisTemplate redisTemplate(RedisConnectionFactory redisConnectionFactory){
log.info("开始创建redis模板对象...");
RedisTemplate redisTemplate = new RedisTemplate();
//设置redis的连接工厂对象
redisTemplate.setConnectionFactory(redisConnectionFactory);
//设置redis key的序列化器
redisTemplate.setKeySerializer(new StringRedisSerializer());
return redisTemplate;
}
}
/*********************************************************************************/
当前配置类不是必须的,因为 Spring Boot 框架会自动装配 RedisTemplate 对象:RedisAutoConfiguration,
但是默认的key序列化器为JdkSerializationRedisSerializer,导致我们存到Redis中后的数据和原始数据有
差别,故设置为StringRedisSerializer序列化器。
//jar包中RedisAutoConfiguration类的源码
@Bean
@ConditionalOnMissingBean(name = "redisTemplate")
@ConditionalOnSingleCandidate(RedisConnectionFactory.class)
public RedisTemplate<Object, Object> redisTemplate(RedisConnectionFactory redisConnectionFactory) {
RedisTemplate<Object, Object> template = new RedisTemplate<>();
template.setConnectionFactory(redisConnectionFactory);
return template;
}
4). 通过RedisTemplate对象操作Redis
@SpringBootTest
public class SpringDataRedisTest {
@Autowired
private RedisTemplate redisTemplate;
@Test //注意:使用长的import org.junit.jupiter.api.Test;
public void testRedisTemplate(){
System.out.println(redisTemplate);
//string数据操作
ValueOperations valueOperations = redisTemplate.opsForValue();
//hash类型的数据操作
HashOperations hashOperations = redisTemplate.opsForHash();
//list类型的数据操作
ListOperations listOperations = redisTemplate.opsForList();
//set类型数据操作
SetOperations setOperations = redisTemplate.opsForSet();
//zset类型数据操作
ZSetOperations zSetOperations = redisTemplate.opsForZSet();
}
}
6、测试实例
1). 操作字符串类型数据
//set name 小明
redisTemplate.opsForValue().set("name","小明");
//get name
String city = (String) redisTemplate.opsForValue().get("name");
System.out.println(city);
2). 操作哈希类型数据
HashOperations hashOperations = redisTemplate.opsForHash();
hashOperations.put("100","name","tom");
hashOperations.put("100","age","20");
String name = (String) hashOperations.get("100", "name");
System.out.println(name);
3). 操作列表类型数据
ListOperations listOperations = redisTemplate.opsForList();
listOperations.leftPushAll("mylist","a","b","c");
listOperations.leftPush("mylist","d");
List mylist = listOperations.range("mylist", 0, -1);
System.out.println(mylist);
4). 操作集合类型数据
SetOperations setOperations = redisTemplate.opsForSet();
setOperations.add("set1","a","b","c","d");
setOperations.add("set2","a","b","x","y");
Set members = setOperations.members("set1");
System.out.println(members);
Long size = setOperations.size("set1");
System.out.println(size);
5). 操作有序集合类型数据
ZSetOperations zSetOperations = redisTemplate.opsForZSet();
zSetOperations.add("zset1","a",10);
zSetOperations.add("zset1","c",9);
//默认升序
Set zset1 = zSetOperations.range("zset1", 0, -1);
System.out.println(zset1);
//降序:进行反转reverse
zset1 = zSetOperations.reverseRange("zset1", 0, -1);
System.out.println(zset1);
6). 通用命令操作
Set keys = redisTemplate.keys("*");
System.out.println(keys);
//是否存在:have
Boolean name = redisTemplate.hasKey("name");
System.out.println("是否存在name: " + name);
Boolean set1 = redisTemplate.hasKey("set1");
System.out.println("是否存在set1: " + set1);
for (Object key : keys) {
DataType type = redisTemplate.type(key);
System.out.println(type.name());
}
redisTemplate.delete("mylist");
//查询剩余存活时间:time to live
//expire: 过期
Long ttl = redisTemplate.getExpire("set1");
System.out.println(ttl);
7、数据同步
为了保证数据库和Redis中的数据保持一致,修改管理端接口 DishController的相关方法,加入清理缓存逻辑。
- 注意:在使用缓存过程中,要注意保证数据库中的数据和缓存中的数据一致
- 如果MySQL中的数据发生变化,需要及时清理缓存数据。否则就会造成缓存数据与数据库数据不一致的情况。
抽取清理缓存的方法:
在管理端DishController中添加
新增菜品优化
@PostMapping
@ApiOperation("新增菜品")
public Result save(@RequestBody DishDTO dishDTO) {
log.info("新增菜品:{}", dishDTO);
dishService.saveWithFlavor(dishDTO);
//==========================新增代码=====================
//清理缓存数据
String key = "dish_" + dishDTO.getCategoryId();
cleanCache(key);
return Result.success();
}
菜品批量删除优化
//==========================新增代码=====================
//将所有的菜品缓存数据清理掉,所有以dish_开头的key
cleanCache("dish_*");
修改菜品优化
//==========================新增代码=====================
cleanCache("dish_" + dishDTO.getCategoryId());
菜品起售停售优化
//==========================新增代码=====================
//将所有的菜品缓存数据清理掉,所有以dish_开头的key
cleanCache("dish_*");
8、Spring Cache 框架
Spring Cache 是一个框架,实现了基于注解的缓存功能,只需要简单地加一个注解,就能实现缓存功能。
- Spring Cache 提供了一层抽象,底层可以切换不同的缓存实现,例如:
- EHCache
- Caffeine
- Redis(常用)
起步依赖:
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-cache</artifactId>
<version>2.7.3</version>
</dependency>
常用的注解
注解 | 说明 |
---|---|
@EnableCaching | 开启缓存注解功能,通常加在启动类上 |
@Cacheable | 在方法执行前先查询缓存中是否有数据,如果有数据,则直接返回缓存数据;如果没有缓存数据,调用方法并将方法返回值放到缓存中 |
@CachePut | 将方法的返回值放到缓存中 |
@CacheEvict | 将一条或多条数据从缓存中删除 |
在spring boot项目中,使用缓存技术只需在项目中导入相关缓存技术的依赖包,并在启动类上使用
@EnableCaching开启缓存支持即可。
使用Redis作为缓存技术,只需要导入Spring data Redis的maven坐标即可。
创建名为spring_cache_demo数据库,将springcachedemo.sql脚本直接导入数据库中。
引导类上加@EnableCaching:
@Slf4j
@SpringBootApplication
@EnableCaching//开启缓存注解功能
public class CacheDemoApplication {
public static void main(String[] args) {
SpringApplication.run(CacheDemoApplication.class,args);
log.info("项目启动成功...");
}
}
检查密码:application.yml
#数据库密码和Redis密码
spring:
datasource:
druid:
username: root
password: root
redis:
host: localhost
port: 6379
password: 123456
2). @CachePut注解
@CachePut 说明:
作用: 将方法返回值,放入缓存
value: 缓存的名称, 每个缓存名称下面可以有很多key
key: 缓存的key ----------> 支持Spring的表达式语言SPEL语法
在save方法上加注解@CachePut
当前UserController的save方法是用来保存用户信息的,在该用户信息保存到数据库的同时,也往缓存中缓存
一份数据,我们可以在save方法上加上注解 @CachePut,用法如下:
/*
CachePut:将方法返回值放入缓存
value:缓存的名称,每个缓存名称下面可以有多个key
key:缓存的key
*/
@PostMapping
//@CachePut(value = "userCache", key = "#resutl.id")
@CachePut(value = "userCache", key = "#user.id")//key的生成:userCache::1
public User save(@RequestBody User user){
userMapper.insert(user);
return user;
}
#user.id : #user指的是方法形参的名称, id指的是user的id属性 , 也就是使用user的id属性作为key ;
#result.id : #result代表方法返回值,该表达式 代表以返回对象的id属性作为key ;
了解:
#p0.id:#p0指的是方法中的第一个参数,id指的是第一个参数的id属性,也就是使用第一个参数的id属性作为key
p: param
#a0.id:#a0指的是方法中的第一个参数,id指的是第一个参数的id属性,也就是使用第一个参数的id属性作为key
a: argument
#root.args[0].id:#root.args[0]指的是方法中第一个参数,id指的是第一个参数的id属性,也就是使用
第一个参数的id属性作为key
3). @Cacheable注解
作用: 在方法执行前,spring先查看缓存中是否有数据,如果有数据,则直接返回缓存数据;若没有数据,调用方法并将方法返回值放到缓存中
value: 缓存的名称,每个缓存名称下面可以有多个key
key: 缓存的key ----------> 支持Spring的表达式语言SPEL语法
在getById上加注解@Cacheable
/**
* Cacheable:在方法执行前spring先查看缓存中是否有数据,如果有数据,则直接返回缓存数据;
* 若没有数据,
* *调用方法并将方法返回值放到缓存中
* value:缓存的名称,每个缓存名称下面可以有多个key
* key:缓存的key
*/
@GetMapping
@Cacheable(cacheNames = "userCache",key="#id")
public User getById(Long id){
User user = userMapper.getById(id);
return user;
}
4). @CacheEvict注解
@CacheEvict 说明:
作用: 清理指定缓存
value: 缓存的名称,每个缓存名称下面可以有多个key
key: 缓存的key ----------> 支持Spring的表达式语言SPEL语法
在 delete 方法上加注解@CacheEvict
@DeleteMapping
@CacheEvict(cacheNames = "userCache",key = "#id")//删除某个key对应的缓存数据
public void deleteById(Long id){
userMapper.deleteById(id);
}
@DeleteMapping("/delAll")
@CacheEvict(cacheNames = "userCache",allEntries = true)//删除userCache下所有的缓存数据
public void deleteAll(){
userMapper.deleteAll();
}
5). 缓存非null值【扩展】
思考:如果getById时查询的是一个不存在的用户,那么会缓存一个null值,此时就毫无意义,该如何判断下
如果是null就不缓存呢?
condition : 表示满足条件, 再进行缓存 ;
unless : 表示满足条件则不缓存 ; 与上述的condition是反向的 ;
/**
* Cacheable:在方法执行前spring先查看缓存中是否有数据,如果有数据,则直接返回缓存数据;若没有数据,
* 调用方法并将方法返回值放到缓存中
* value:缓存的名称,每个缓存名称下面可以有多个key
* key:缓存的key
* condition:条件,满足条件时才缓存数据
* unless:满足条件则不缓存
*/
@Cacheable(value = "userCache",key = "#id", unless = "#result == null")
@GetMapping("/{id}")
public User getById(@PathVariable Long id){
User user = userService.getById(id);
return user;
}
#注意
#此处,我们只能使用 unless(什么时候不存储)
#1.condition中只能使用方法参数中数据:如果使用#result,不管是否查询到数据都是返回null
#2.unless才能使用方法返回值中的数据
Redis高级
1、Redis持久化
单点Redis的问题
- 1.数据丢失问题:Redis是内存存储,服务重启可能会丢失数据
- 2.并发能力问题:单节点Redis并发能力虽然不错,但也无法满足如618这样的高并发场景
- 3.故障恢复问题:如果Redis宕机,则服务不可用,需要一种自动的故障恢复手段
- 4.存储能力问题:Redis基于内存,单节点能存储的数据量难以满足海量数据需求
如何解决呢?
Redis有两种持久化方案:
- RDB持久化
- AOF持久化
Redis为什么快:
- 1、操作的是内存,使用C语言
- 2、是单线程,避免频繁的上下文切换
- 3、非阻塞IO,多路复用
1.1.RDB持久化
★ 1.RDB持久化
RDB全称Redis Database Backup file(Redis数据备份文件),也被叫做Redis数据快照。简单来说就是把内
存中的所有数据都记录到磁盘中。
作用:当Redis实例故障重启后,从磁盘读取快照文件rdb文件,恢复数据到内存中。快照文件称为RDB文件,默认
是保存在当前运行目录。
1).执行时机
RDB持久化在四种情况下会执行:
- 执行save命令
- 执行bgsave命令
- Redis停机时
- 触发RDB条件时
save命令
执行下面的命令,可以立即执行一次RDB:
save命令会导致主进程执行RDB,这个过程中其它所有命令都会被阻塞。只有在数据迁移时可能用到。
2)bgsave命令
下面的命令可以异步执行RDB:
bg: background
后台执行
这个命令执行后会开启独立进程完成RDB,主进程可以持续处理用户请求,不受影响。
3)停机时
Redis停机时会执行一次save命令,实现RDB持久化。
> 通过ctrl+c 正常中止Redis,不能直接杀进程
4)触发RDB条件【常用】
Redis内部有触发RDB的机制,可以在redis.conf文件中找到,格式如下:
# 900秒内,如果至少有1个key被修改,则执行bgsave (后台执行save,用子进程)
#save 900 1
#save 300 10
#save 60 10000
save 10 1
# 如果是save "" 则表示禁用RDB
#save ""
#RDB的其它配置也可以在redis.conf文件中设置:
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
# 是否压缩 ,建议不开启,压缩也会消耗cpu,磁盘的话不值钱
rdbcompression no
# RDB文件名称
dbfilename dump.rdb
# 文件保存的路径目录
dir ./
#dir /opt/data/sky/
#修改完配置文件后,需要重启redis,并且指定配置文件:
redis-server.exe redis.windows.conf
★ 2.RDB原理
bgsave开始时会fork主进程得到子进程,子进程共享主进程的内存数据。完成fork后读取内存数据写入 RDB 文件
fork采用的是copy-on-write技术:
- 当主进程执行读操作时,访问共享内存;
- 当主进程执行写操作时,则会拷贝一份数据,执行写操作。
RDB会在什么时候执行?save 60 1000代表什么含义?
- 默认是服务停止时
- 代表60秒内至少执行1000次修改则触发RDB
RDB的缺点?
- RDB执行有间隔时间,两次RDB之间写入数据有丢失的风险
- fork子进程、压缩、写出RDB文件都比较耗时
RDB方式bgsave的基本流程?
- fork主进程得到一个子进程,共享内存空间
- 子进程读取内存数据并写入新的RDB文件
- 用新RDB文件替换旧的RDB文件
1.2.AOF持久化
AOF全称为Append Only File(追加文件)。Redis处理的每一个写命令(增删改)都会记录在AOF文件,
可以看做是命令日志文件。
思考:
当修改Redis中的数据时,是先执行命令写入数据,还是先记录日志呢?
Redis采用了“写后”日志,意思即是Redis先执行了命令,把数据写入了内存了,再把命令记录到日志
为什么AOF是“写后”日志而不是“写前”?
- 可以避免额外的检查开销,Redis 在向 AOF 记录日志的时候,并不会先去对这些命令进行语法检查。
因此如果先记日志再执行命令的话,日志中就有可能记录了错误的命令,Redis 在使用日志恢复数据时,
就可能会出错。所以采取写后日志这种方式,就是先让系统执行命令,只有命令能执行成功,才会被
记录到日志中。而且在命令执行后才记录日志,不会阻塞当前的写操作。
AOF默认是关闭的,需要修改redis.conf配置文件来开启AOF:
# 是否开启AOF功能,默认是no
appendonly yes
# AOF文件的名称
appendfilename "appendonly.aof"
#&& AOF的命令记录的频率也可以通过redis.conf文件来配:
# 表示每执行一次写命令,立即记录到AOF文件
appendfsync always
# 默认方案每秒一次: 写命令执行完先放入AOF缓冲区,然后表示每隔1秒将缓冲区数据写到AOF文件:
every second
appendfsync everysec
# 写命令执行完先放入AOF缓冲区,由操作系统决定何时将缓冲区内容写回磁盘
appendfsync no
三种策略对比:
刷盘:将内存中的数据刷新到硬盘中(持久化)
配置项 | 刷盘时机 | 优点 | 缺点 |
---|---|---|---|
Always | 同步刷盘 | 可靠性高,几乎不丢数据 | 性能影响大 |
everysec | 每秒刷盘 | 性能适中 | 最多丢失1秒数据 |
no | 操作系统控制 | 性能最好 | 可靠性较差,可能丢失大量数据 |
AOF文件重写
因为是记录命令,AOF文件会比RDB文件大的多。而且AOF会记录对同一个key的多次写操作,但只有最后一次
写操作才有意义。通过执行bgrewriteaof命令,可以让AOF文件执行重写功能,用最少的命令达到相同效果。
#bgrewriteaof: background rewrite aof(后台重写aof日志文件)
#在客户端redis-cli手动执行
bgrewriteaof
如图,AOF原本有三个命令,但是`set num 123 和 set num 666`都是对num的操作,第二次会覆盖第一次的值,
因此第一个命令记录下来没有意义。
所以重写命令后,AOF文件内容就是:
mset name jack num 666
Redis也会在触发阈值时自动去重写AOF文件。阈值也可以在redis.conf中配置:
# AOF文件比上次文件 增长超过多少百分比则触发重写
auto-aof-rewrite-percentage 100
# AOF文件体积最小多大以上才触发重写
auto-aof-rewrite-min-size 64mb
1.3.RDB与AOF对比
RDB和AOF各有自己的优缺点,如果对数据安全性要求较高,在实际开发中往往会结合两者来使用。
RDB | AOF | |
---|---|---|
持久化方式 | 定时对整个内存做快照 | 记录每一次执行的命令 |
数据完整性 | 不完整,两次备份之间会丢失 | 相对完整,取决于刷盘速度 |
文件大小 | 会有压缩,文件体积小 | 记录命令,文件体积很大 |
宕机恢复速度 | 很快 | 慢 |
数据恢复速度 | 低,因为数据完整性不如AOF | 高,因为数据完整性更高 |
系统资源占用 | 高,大量CPU和内存消耗 | 低,主要是磁盘IO资源但AOF重写时会占用大量CPU和内存资源 |
使用场景 | 可以容忍数分钟的数据丢失,追求更快的启动速度 | 对数据安全性要求较高常见 |
注意:如果同时有appendonly.aof + dump.rdb,优先用appendonly.aof去恢复数据
1.4.混合持久化方式
Redis 4.0 开始支持 RDB 和 AOF 的混合持久化(默认关闭,可以通过配置项 `aof-use-rdb-preamble` 开启)。
> 如果把混合持久化打开,AOF 重写的时候就直接把 RDB 的内容写到 AOF 文件开头。这样做的好处是可以
结合 RDB 和 AOF 的优点, 快速加载同时避免丢失过多的数据。当然缺点也是有的,
AOF 里面的 RDB 部分就是压缩格式不再是 AOF 格式,可读性较差。
2、Redis主从集群
单节点Redis的并发能力是有上限的,要进一步提高Redis的并发能力,就需要搭建主从集群,实现读写分离。
2.1.搭建主从架构【运维】
验证主从数据同步:
- 利用redis-cli连接6381,执行```set num 123```
- 利用redis-cli连接6382,执行```get num```,再执行```set num 666```
- 利用redis-cli连接6383,执行```get num```,再执行```set num 888```
可以发现,只有在6381这个master节点上可以执行写操作,6382和6383这两个slave节点只能执行读操作。
#在任一redis-cli的客户端中都可以查看状态:
info replication
2.2.数据同步原理
★ 全量同步
主从第一次建立连接时,会执行全量同步,将master节点的所有数据都拷贝给slave节点
master如何得知salve是第一次来连接呢??
有几个概念,可以作为判断依据:
> - Replication Id:简称replid,是数据集的标记,id一致则说明是同一数据集。每一个master都有唯一的
replid,slave则会继承master节点的replid
> - offset:偏移量,随着记录在repl_baklog中的数据增多而逐渐增大。slave完成同步时也会记录当前同步
的offset。如果slave的offset小于master的offset,说明slave数据落后于master,需要更新。
因此slave做数据同步,必须向master声明自己的replication id 和offset(对应图中1.1),
master才能判断需要同步哪些数据。
因为slave原本也是一个master,有自己的replid和offset,当第一次变成slave,与master建立连接时,
发送的replid和offset是自己的replid和offset。
master判断发现slave发送来的replid与自己的不一致(对应图中1.2),说明这是一个全新的slave,就知道
要做全量同步了。master会将自己的replid和offset发送给这个slave(对应图中1.3),
slave保存这些信息(对应图中1.4)。以后slave的replid就与master一致了。
因此,master判断一个节点是否是第一次同步的依据,就是看replid是否一致。
完整流程描述:
- slave节点请求增量同步
- master节点判断replid,发现不一致,拒绝增量同步
- master将完整内存数据生成RDB,发送RDB到slave
- slave清空本地数据,加载master的RDB
- master将RDB期间的命令记录在repl_baklog,并持续将log中的命令发送给slave
- slave执行接收到的命令,保持与master之间的同步
★ 增量同步
全量同步需要先做RDB,然后将RDB文件通过网络传输个slave,成本太高了。因此除了第一次做全量同步,
其它大多数时候slave与master都是做增量同步。
什么是增量同步?就是只更新slave与master存在差异的部分数据。
那么master怎么知道slave与自己的数据差异在哪里呢?
★★★ repl_backlog原理
master怎么知道slave与自己的数据差异在哪里呢?
这就要说到全量同步时的repl_baklog文件了。这个文件是一个固定大小的数组,只不过数组是环形,也就是说
角标到达数组末尾后,会再次从0开始读写,这样数组头部的数据就会被覆盖。
repl_baklog中会记录Redis处理过的命令日志及offset,包括master当前的offset,和slave已经拷贝到的offset
slave与master的offset之间的差异,就是salve需要增量拷贝的数据了。
随着不断有数据写入,master的offset逐渐变大,slave也不断的拷贝,追赶master的offset
直到数组被填满:
此时,如果有新的数据写入,就会覆盖数组中的旧数据。不过,旧的数据只要是绿色的,说明是已经被同步到slave
的数据,即便被覆盖了也没什么影响。因为未同步的仅仅是红色部分。
但是,如果slave出现网络阻塞,导致master的offset远远超过了slave的offset:
如果master继续写入新数据,其offset就会覆盖旧的数据,直到将slave现在的offset也覆盖:
棕色框中的红色部分,就是尚未同步,但是却已经被覆盖的数据。此时如果slave恢复,需要同步,却发现自己的
offset都没有了,无法完成增量同步了。只能做全量同步。
● 注意:repl_baklog的大小有上限,写满后会覆盖最早的数据,如果slave断开时间过久,导致尚未备份的数据
被覆盖,则无法基于log做增量同步,只能再次全量同步。
2.3.主从同步优化
主从同步可以保证主从数据的一致性,非常重要。
可以从以下几个方面来优化Redis主从就集群:
- 在master中配置repl-diskless-sync yes启用无磁盘复制,避免全量同步时的磁盘IO。
- Redis单节点上的内存占用不要太大,减少RDB导致的过多磁盘IO
- 适当提高repl_baklog的大小,发现slave宕机时尽快实现故障恢复,尽可能避免全量同步
- 限制一个master上的slave节点数量,如果实在是太多slave,则可以采用主-从-从链式结构,减少master压力
主从从架构图:
2.4.小结
简述全量同步和增量同步区别?
- 全量同步:master将完整内存数据生成RDB,发送RDB到slave。后续命令则记录在repl_baklog,逐个发送给slave。
- 增量同步:slave提交自己的offset到master,master获取repl_baklog中从offset之后的命令给slave
什么时候执行全量同步?
- slave节点第一次连接master节点时
- slave节点断开时间太久,offset差距过大,repl_baklog中的offset已经被覆盖时
什么时候执行增量同步?
- slave节点断开又恢复,并且在repl_baklog中能找到offset时
3、Redis哨兵集群
Redis提供了哨兵(Sentinel)机制来实现主从集群的自动故障恢复。
3.1.哨兵原理
哨兵的结构如图:
★★★ 哨兵的作用如下:
- 监控:Sentinel 会不断检查您的master和slave是否按预期工作
- 自动故障恢复:如果master故障,Sentinel会将一个slave提升为master。当故障实例恢复后也以新的master为主
- 通知:Sentinel充当Redis客户端的服务发现来源,当集群发生故障转移时,会将最新信息推送给Redis的客户端
> 1.哨兵是一个集群,一般是奇数个节点防止脑裂
> 2.哨兵会与master slave保持心跳,判断服务是否可用
> 3.如果master宕机进行投票判断是否客观下线,如果客观下线选出新的主节点
> 4.发送命令slave of no one 新主节点
> 5.发送命令slave of 新的master ip 端口号 给所有其他节点
★★★ 集群监控原理
Sentinel基于心跳机制监测服务状态,每隔1秒向集群的每个实例发送ping命令:
•主观下线:如果某sentinel节点发现某实例未在规定时间响应,则认为该实例主观下线(个人判断)。
•客观下线:若超过指定数量(quorum)的sentinel都认为该实例主观下线,则该实例客观下线(真正下线)。
quorum值最好超过Sentinel实例数量的一半。
★★★ 集群故障恢复原理
一旦发现master故障,sentinel需要在salve中选择一个作为新的master,选择依据是这样的:
- 首先会判断slave节点与master节点断开时间长短,如果超过指定值(down-after-milliseconds * 10)
则会排除该slave节点
- 然后判断slave节点的slave-priority值,越小优先级越高,如果是0则永不参与选举
- 如果slave-prority一样,则判断slave节点的offset值,越大说明数据越新,优先级越高
- 最后是判断slave节点的运行id大小,越小优先级越高。
当选出一个新的master后,该如何实现切换呢?
流程如下:
- sentinel给备选的slave1节点发送slaveof no one命令,让该节点成为master
- sentinel给所有其它slave发送slaveof 192.168.150.101 7002 命令,让这些slave成为新master的从节点,
开始从新的master上同步数据。
- 最后,sentinel将故障节点标记为slave,当故障节点恢复后会自动成为新的master的slave节点
★★★★★ 小结:
Sentinel的三个作用是什么?
- 监控
- 自动故障转移(选一个新的slave做为master)
- 通知(通知其他的slave,master换人了)
Sentinel如何判断一个redis实例是否健康?
- 每隔1秒发送一次ping命令,如果超过一定时间没有相向则认为是主观下线
- 如果大多数sentinel都认为实例主观下线,则判定服务下线
故障转移步骤有哪些?
- 首先选定一个slave作为新的master,执行slaveof no one
- 然后让所有节点都执行slaveof 新master
- 修改故障节点配置,添加slaveof 新master
3.2.搭建哨兵集群
具体搭建流程参考快速安装Redis以及配置Redis集群
3.3.RedisTemplate
在Sentinel集群监管下的Redis主从集群,其节点会因为自动故障转移而发生变化,Redis的客户端必须感知这种变
化,及时更新连接信息。Spring的RedisTemplate底层利用lettuce实现了节点的感知和自动切换。
下面,我们通过一个测试来实现RedisTemplate集成哨兵机制。
★★★ 导入Demo工程
首先,导入我提供的Demo工程:
点击获取工程
提取码:mcpt
★★★ 检查依赖
在项目的pom文件中引入依赖:
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>
配置Redis地址
然后在配置文件application.yml中指定redis的sentinel相关信息:
spring:
redis:
sentinel: #哨兵
master: mymaster #指定master名称
nodes: #指定哨兵的集群信息
- 127.0.0.1:26401
- 127.0.0.1:26402
- 127.0.0.1:26403
为什么不配置master和slave的地址?
因为在集群运行过程中,master可能宕机,导致重新选举,产生新的master。
★★★ 配置读写分离
在项目的启动类中,添加一个新的bean:
@Bean
public LettuceClientConfigurationBuilderCustomizer clientConfigurationBuilderCustomizer(){
//readFrom:指定从什么地方读取数据
//replica: 副本=== slave(从)
//PREFERRED: 优先
return
clientConfigurationBuilder -> clientConfigurationBuilder.readFrom(ReadFrom.REPLICA_PREFERRED);
}
/*************************************************************************************************
这个bean中配置的就是读写策略,包括四种:
- MASTER:从主节点读取
- MASTER_PREFERRED:优先从master节点读取,master不可用才读取replica
- REPLICA:从slave(replica)节点读取
- REPLICA _PREFERRED:优先从slave(replica)节点读取,所有的slave都不可用才读取master
4、Redis分片集群【主流】
在生产环境(用户真实使用的服务器集群)
分片集群结构
主从和哨兵可以解决高可用、高并发读的问题。但是依然有两个问题没有解决:
- 海量数据存储问题(单个redis内存数据量过大的问题)
- 高并发写的问题(单个redis主节点写入操作并发过多的问题)
使用分片集群可以解决上述问题,如图:
分片集群特征:
- 集群中有多个master,每个master保存不同数据
- 每个master都可以有多个slave节点
- master之间通过ping监测彼此健康状态
- 客户端请求可以访问集群任意节点,最终都会被转发到正确节点
4.1.搭建分片集群
具体搭建流程参考快速安装Redis以及配置Redis集群:
4.2.散列插槽
★★★ 插槽原理
分片集群中(master数量)整体编号,分为16384个插槽;如果集群中有3个master,则每个master分到的插槽个数
为:16384 / 3 ≈ 5461,可以通过查询看到:
#打开集群客户端
redis-cli -c -p 端口号
#查看集群节点信息
cluster nodes
set name zhangsan
数据key不是与节点绑定,而是与插槽绑定。redis会根据key的有效部分计算插槽值,分两种情况:
- 计算方式:`HASH_SLOT=CRC16(key) % 16384`, 结果在0 -16383之间
- key中如果包含"{}",且“{}”中至少包含1个字符,“{}”中的部分是有效部分
`set goods-10001 xx`
`set goods-222000 xx`
`set {goods}-1001 xxxx`
`set {goods}-56889234 xxxx`
#计算存储时,
CRC16(goods) % 16384 = 一个固定值
key中不包含“{}”,整个key都是有效部分
例如:key是num,那么就根据num计算,如果是{itcast}num,则根据itcast计算。计算方式是利用CRC16算法得到一个
hash值(纯数字),然后对16384取余,得到的结果肯定位于0-16383之间就是插槽值。
如图,在7001这个节点执行`set a 1`时,对a做hash运算,对16384取余,得到的结果是15495,因此要存储到7003节点。
到了7003后,执行`get num`时,对num做hash运算,对16384取余,得到的结果是2765,因此需要切换到7001节点
★★★ 小结
Redis如何判断某个key应该在哪个Master实例?
- 计算方式:`HASH_SLOT=CRC16(key) % 16384`, 结果在0 -16383之间
- 将16384个插槽分配到不同的实例
- 根据key的有效部分计算哈希值,对16384取余
- 余数作为插槽,寻找插槽所在实例即可
如何将同一类数据固定的保存在同一个Redis实例?
- 这一类数据使用相同的有效部分,例如key都以{typeId}为前缀
set {goods}1001 info
set {goods}10002 info2
hash(goods) % 16384 = 固定值,
#这样所有商品的数据就能保存到同一个master中
4.3.集群伸缩
集群伸缩也可以称为:集群扩展
作用:如果添加或者减少 Master节点,手动进行分槽,将原来的一些槽移到新的节点上去
redis-cli --cluster提供了很多操作集群的命令,可以通过下面方式查看:
比如,添加节点的命令:
★★ 需求分析
需求:向集群中添加一个新的master节点,并向其中存储 num = 10
- 启动一个新的redis实例,端口为7004
- 添加7004到之前的集群,并作为一个master节点
- 给7004节点分配插槽,使得num这个key可以存储到7004实例
这里需要两个新的功能:
- 添加一个节点到集群中
- 将部分插槽分配到新插槽
★★ 创建新的redis实例
#创建一个文件夹:
mkdir 7004
#拷贝配置文件:
cp redis.conf /7004
#修改配置文件:
sed /s/6379/7004/g 7004/redis.conf
#启动
redis-server 7004/redis.conf
★★ 添加新节点到redis
添加节点的语法如下:
# 执行命令:
redis-cli --cluster add-node 192.168.150.101:7004 192.168.150.101:7001
#通过命令查看集群状态:
redis-cli -p 7001 cluster nodes
如图,7004加入了集群,并且默认是一个master节点:
但是,可以看到7004节点的插槽数量为0,因此没有任何数据可以存储到7004上
★★ 转移插槽
我们要将num存储到7004节点,因此需要先看看num的插槽是多少:
如上图所示,num的插槽为2765.
我们可以将0~3000的插槽从7001转移到7004,命令格式如下:
具体命令如下:
建立连接:
得到下面的反馈:
询问要移动多少个插槽,我们计划是3000个:
新的问题来了:
那个node来接收这些插槽??
显然是7004,那么7004节点的id是多少呢?
复制这个id,然后拷贝到刚才的控制台后:
这里询问,你的插槽是从哪里移动过来的?
- all:代表全部,也就是三个节点各转移一部分
- 具体的id:目标节点的id
- done:没有了
这里我们要从7001获取,因此填写7001的id:
填完后,点击done,这样插槽转移就准备好了:
确认要转移吗?输入yes:
然后,通过命令查看结果:
可以看到:下面这些内容就代表目的达成。
4.4.故障转移
> 当master宕机之后,集群会重新将slave提升成master集群可以继续工作
集群初识状态是这样的:
其中7001、7002、7003都是master,我们计划让7002宕机
★★★ 自动故障转移
当集群中有一个master宕机会发生什么呢?
直接停止一个redis的master实例,例如7002:
redis-cli -p 7002 shutdown
#1)首先是该实例与其它实例失去连接
#2)然后是疑似宕机:
#通过redis-cli.exe,查看集群信息
redis-cli -c -p 6501
cluster nodes
3)最后是确定下线,自动提升一个slave为新的master:
4)当7002再次启动,就会变为一个slave节点了:
★★★ 手动故障转移
利用cluster failover命令可以手动让集群中的某个master宕机,切换到执行cluster failover命令的这个slave节点,
实现无感知的数据迁移。其流程如下:
这种failover命令可以指定三种模式:
- 缺省:默认的流程,如图1~6歩
- force:省略了对offset的一致性校验
- takeover:直接执行第5歩,忽略数据一致性、忽略master状态和其它master的意见
案例需求:在7002这个slave节点执行手动故障转移,重新夺回master地位
步骤如下:
1)利用redis-cli连接7002这个节点
2)执行cluster failover命令
如图:
效果:
4.5.RedisTemplate访问分片集群
RedisTemplate底层同样基于lettuce实现了分片集群的支持,而使用的步骤与哨兵模式基本一致:
1)引入redis的starter依赖
2)配置分片集群地址
3)配置读写分离
与哨兵模式相比,其中只有分片集群的配置方式略有差异,如下:
spring:
redis:
# sentinel:
# master: mymaster #指定master名称
# nodes: #指定哨兵的集群信息
# - 127.0.0.1:26401
# - 127.0.0.1:26402
# - 127.0.0.1:26403
cluster: #分片集群
nodes:
- 127.0.0.1:6501
- 127.0.0.1:6502
- 127.0.0.1:6503
- 127.0.0.1:6504
- 127.0.0.1:6505
- 127.0.0.1:6506