2023-06-19:讲一讲Redis分布式锁的实现?
答案2023-06-19:
Redis分布式锁最简单的实现
要实现分布式锁,确实需要使用具备互斥性的Redis操作。其中一种常用的方式是使用SETNX
命令,该命令表示"SET if Not Exists",即只有在key不存在时才设置其值,否则不进行任何操作。通过这种方式,两个客户端进程可以执行SETNX
命令来实现互斥,从而达到分布式锁的目的。
下面是一个示例:
客户端1申请加锁,加锁成功:
SETNX lock_key 1
客户端2申请加锁,由于它处于较晚的时间,加锁失败:
SETNX lock_key 1
通过这种方式,您可以使用Redis的互斥性来实现简单的分布式锁机制。
对于加锁成功的客户端,可以执行对共享资源的操作,比如修改MySQL的某一行数据或调用API请求。
操作完成后,需要及时释放锁,以便后续的请求能够访问共享资源。释放锁非常简单,只需使用DEL
命令来删除相应的锁键(key)即可。
下面是释放锁的示例逻辑:
DEL lock_key
通过执行以上DEL
命令,成功释放锁,以让后续的请求能够获得锁并执行操作共享资源的逻辑。
这样,通过使用SETNX
命令进行加锁,然后使用DEL
命令释放锁,您就可以实现基本的分布式锁机制。
但是,它存在一个很大的问题,当客户端 1 拿到锁后,如果发生下面的场景,就会造成「死锁」:
1、程序处理业务逻辑异常,没有及时释放锁。
2、进程崩溃或意外停止,无法释放锁。
在这种情况下,客户端将永远占用该锁,其他客户端将无法获取该锁。如何解决这个问题呢?
如何避免死锁?
当考虑在申请锁时为其设置一个「租期」时,可以在Redis中通过设置「过期时间」来实现。假设我们假设操作共享资源的时间不会超过10秒,在加锁时,可以给该key设置一个10秒的过期时间即可。这样做可以确保在申请锁后的一段时间内,如果锁的持有者在该时间内没有更新锁的过期时间,锁将会自动过期,从而防止锁被永久占用
SETNX lock 1 // 加锁
EXPIRE lock 10 // 10s后自动过期
这样一来,无论客户端是否异常,这个锁都可以在 10s 后被「自动释放」,其它客户端依旧可以拿到锁。
但现在还是有问题:
当前的操作是将加锁和设置过期时间作为两个独立的命令执行,存在一个问题,即可能只执行了第一条命令而第二条命令却未能及时执行,从而导致问题。例如:
-
SETNX 命令执行成功后,由于网络问题导致 EXPIRE 命令执行失败。
-
SETNX 命令执行成功后,Redis 异常宕机,导致 EXPIRE 命令没有机会执行。
-
SETNX 命令执行成功后,客户端异常崩溃,同样导致 EXPIRE 命令没有机会执行。
总之,这两条命令不能保证是原子操作(一起成功),就有潜在的风险导致过期时间设置失败,依旧发生「死锁」问题。
幸运的是,在 Redis 2.6.12 版本之后,Redis 扩展了 SET 命令的参数。用这一条命令就可以了:
SET lock 1 EX 10 NX
锁被别人释放怎么办?
上面的命令执行时,每个客户端在释放锁时,并没有进行严格的验证,存在释放别人锁的潜在风险。为了解决这个问题,可以在加锁时为每个客户端设置一个唯一的标识符(unique identifier),并在解锁时对比标识符来验证是否有权释放锁。
例如,可以是自己的线程 ID,也可以是一个 UUID(随机且唯一),这里我们以UUID 举例:
SET lock $uuid EX 20 NX
之后,在释放锁时,要先判断这把锁是否还归自己持有,伪代码可以这么写:
if redis.get("lock") == $uuid:
redis.del("lock")
这里释放锁使用的是 GET + DEL 两条命令,这时,又会遇到我们前面讲的原子性问题了。这里可以使用lua脚本来解决。
安全释放锁的 Lua 脚本如下:
if redis.call("GET",KEYS[1]) == ARGV[1]
then
return redis.call("DEL",KEYS[1])
else
return 0
end
好了,这样一路优化,整个的加锁、解锁的流程就更「严谨」了。
这里我们先小结一下,基于 Redis 实现的分布式锁,一个严谨的的流程如下:
1、加锁
SET lock_key $unique_id EX $expire_time NX
2、操作共享资源
3、释放锁:Lua 脚本,先 GET 判断锁是否归属自己,再DEL 释放锁
go代码实现分布式锁
package main
import (
"context"
"fmt"
"sync"
"time"
"github.com/go-redis/redis/v8"
"github.com/google/uuid"
)
const (
LockTime = 5 * time.Second
RS_DISTLOCK_NS = "tdln:"
RELEASE_LOCK_LUA = `
if redis.call('get',KEYS[1])==ARGV[1] then
return redis.call('del', KEYS[1])
else
return 0
end
`
)
type RedisDistLock struct {
id string
lockName string
redisClient *redis.Client
m sync.Mutex
}
func NewRedisDistLock(redisClient *redis.Client, lockName string) *RedisDistLock {
return &RedisDistLock{
lockName: lockName,
redisClient: redisClient,
}
}
func (this *RedisDistLock) Lock() {
for !this.TryLock() {
time.Sleep(100 * time.Millisecond)
}
}
func (this *RedisDistLock) TryLock() bool {
if this.id != "" {
// 处于加锁中
return false
}
this.m.Lock()
defer this.m.Unlock()
if this.id != "" {
// 处于加锁中
return false
}
ctx := context.Background()
id := uuid.New().String()
reply := this.redisClient.SetNX(ctx, RS_DISTLOCK_NS+this.lockName, id, LockTime)
if reply.Err() == nil && reply.Val() {
this.id = id
return true
}
return false
}
func (this *RedisDistLock) Unlock() {
if this.id == "" {
// 未加锁
panic("解锁失败,因为未加锁")
}
this.m.Lock()
defer this.m.Unlock()
if this.id == "" {
// 未加锁
panic("解锁失败,因为未加锁")
}
ctx := context.Background()
reply := this.redisClient.Eval(ctx, RELEASE_LOCK_LUA, []string{RS_DISTLOCK_NS + this.lockName}, this.id)
if reply.Err() != nil {
panic("释放锁失败!")
} else {
this.id = ""
}
}
func main() {
client := redis.NewClient(&redis.Options{
Addr: "172.16.11.111:64495",
})
const LOCKNAME = "百家号:福大大架构师每日一题"
lock := NewRedisDistLock(client, LOCKNAME)
lock.Lock()
fmt.Println("加锁main")
ch := make(chan struct{})
go func() {
lock := NewRedisDistLock(client, LOCKNAME)
lock.Lock()
fmt.Println("加锁go程")
lock.Unlock()
fmt.Println("解锁go程")
ch <- struct{}{}
}()
time.Sleep(time.Second * 2)
lock.Unlock()
fmt.Println("解锁main")
<-ch
}
锁过期时间不好评估怎么办?
看上面这张图,加入key的失效时间是10s,但是客户端C在拿到分布式锁之后,然后业务逻辑执行超过10s,那么问题来了,在客户端C释放锁之前,其实这把锁已经失效了,那么客户端A和客户端B都可以去拿锁,这样就已经失去了分布式锁的功能了!!!
比较简单的妥协方案是,尽量「冗余」过期时间,降低锁提前过期的概率,但是这个并不能完美解决问题,那怎么办呢?
分布式锁加入看门狗
在加锁过程中,可以设置一个过期时间,并启动一个守护线程(也称为「看门狗」线程),定时检测锁的剩余有效时间。如果锁即将过期,但共享资源操作尚未完成,守护线程可以自动对锁进行续期,重新设置过期时间。
为什么要使用守护线程:
go中的红锁
package main
import (
"fmt"
"time"
"github.com/go-redis/redis/v8"
"github.com/go-redsync/redsync/v4"
"github.com/go-redsync/redsync/v4/redis/goredis/v8"
)
func main() {
client := redis.NewClient(&redis.Options{
Addr: "172.16.11.111:64495",
Password: "", // 如果有密码,请提供密码
DB: 0, // 如果使用不同的数据库,请修改为准确的数据库编号
})
pool := goredis.NewPool(client)
const LOCKNAME = "百家号:福大大架构师每日一题"
redsync := redsync.New(pool)
mutex := redsync.NewMutex(LOCKNAME)
if err := mutex.Lock(); err != nil {
fmt.Println("加锁失败:", err)
return
}
fmt.Println("加锁main")
ch := make(chan struct{})
go func() {
mutex := redsync.NewMutex(LOCKNAME)
if err := mutex.Lock(); err != nil {
fmt.Println("加锁失败:", err)
return
}
fmt.Println("加锁go程")
mutex.Unlock()
fmt.Println("解锁go程")
ch <- struct{}{}
}()
time.Sleep(time.Second * 2)
mutex.Unlock()
fmt.Println("解锁main")
<-ch
}