Redis设计与实现之Lua 脚本

news2024/11/25 21:23:31

目录

一、 Lua 脚本

1、初始化 Lua 环境

2、脚本的安全性

3、脚本的执行

4、 EVAL 命令的实现

定义 Lua 函数

执行 Lua 函数

5、 EVALSHA 命令的实现

二、 小结


一、 Lua 脚本

Lua 脚本功能是 Reids 2.6 版本的最大亮点,通过内嵌对 Lua 环境的支持,Redis 解决了长久 以来不能高效地处理 CAS (check-and-set)命令的缺点,并且可以通过组合使用多个命令,轻 松实现以前很难实现或者不能高效实现的模式。

本章先介绍 Lua 环境的初始化步骤,然后对 Lua 脚本的安全性问题、以及解决这些问题的方 法进行说明,最后对执行 Lua 脚本的两个命令——EVAL 和 EVALSHA 的实现原理进行介绍。

1、初始化 Lua 环境

在初始化 Redis 服务器时,对 Lua 环境的初始化也会一并进行。

为了让 Lua 环境符合 Redis 脚本功能的需求,Redis 对 Lua 环境进行了一系列的修改,包括添 加函数库、更换随机函数、保护全局变量,等等。

整个初始化 Lua 环境的步骤如下:
1. 调用 lua_open 函数,创建一个新的 Lua 环境。

2. 载入指定的 Lua 函数库,包括:

  • 基础库(base lib)。

  • 表格库(table lib)。

  • 字符串库(string lib)。

  • 数学库(math lib)。

  • 调试库(debug lib)。

  • 用于处理 JSON 对象的 cjson 库。

  • 在 Lua 值和 C 结构 (struct) 之间进行转换的 struct 库 (www.inf.puc- rio.br/ roberto/struct/)处理 MessagePack 数据的 cmsgpack 库(github.com/antirez/lua-cmsgpack)。

3. 屏蔽一些可能对 Lua 环境产生安全问题的函数,比如 loadfile 。

4. 创建一个 Redis 字典,保存 Lua 脚本,并在复制(replication)脚本时使用。字典的键为 SHA1 校验和,字典的值为 Lua 脚本。

5. 创建一个 redis 全局表格到 Lua 环境,表格中包含了各种对 Redis 进行操作的函数,包 括:

• 用于执行 Redis 命令的 redis.call 和 redis.pcall 函数。
• 用于发送日志(log)的redis.log函数,以及相应的日志级别(level):

– redis.LOG_DEBUG 
– redis.LOG_VERBOSE 
– redis.LOG_NOTICE 
– redis.LOG_WARNING

• 用于计算 SHA1 校验和的 redis.sha1hex 函数。

• 用于返回错误信息的redis.error_reply函数和redis.status_reply函数。

  1. 用 Redis 自己定义的随机生成函数,替换 math 表原有的 math.random 函数和 math.randomseed 函数,新的函数具有这样的性质:每次执行 Lua 脚本时,除非显 式地调用 math.randomseed ,否则 math.random 生成的伪随机数序列总是相同的。

  2. 创建一个对 Redis 多批量回复(multi bulk reply)进行排序的辅助函数。

  3. 对 Lua 环境中的全局变量进行保护,以免被传入的脚本修改。

  4. 因为 Redis 命令必须通过客户端来执行,所以需要在服务器状态中创建一个无网络连接 的伪客户端(fake client),专门用于执行 Lua 脚本中包含的 Redis 命令:当 Lua 脚本需 要执行 Redis 命令时,它通过伪客户端来向服务器发送命令请求,服务器在执行完命令 之后,将结果返回给伪客户端,而伪客户端又转而将命令结果返回给 Lua 脚本。

  5. 将 Lua 环境的指针记录到 Redis 服务器的全局状态中,等候 Redis 的调用。

以上就是 Redis 初始化 Lua 环境的整个过程,当这些步骤都执行完之后,Redis 就可以使用Lua 环境来处理脚本了。
严格来说,步骤 1 至 8 才是初始化 Lua 环境的操作,而步骤 9 和 10 则是将 Lua 环境关联到服务器的操作,为了按顺序观察整个初始化过程,我们将两种操作放在了一起。
另外,步骤 6 用于创建无副作用的脚本,而步骤 7 则用于去除部分 Redis 命令中的不确定性(non deterministic),关于这两点,请看下面一节关于脚本安全性的讨论。

2、脚本的安全性

当将 Lua 脚本复制到附属节点,或者将 Lua 脚本写入 AOF 文件时,Redis 需要解决这样一个 问题:如果一段 Lua 脚本带有随机性质或副作用,那么当这段脚本在附属节点运行时,或者从 AOF 文件载入重新运行时,它得到的结果可能和之前运行的结果完全不同。

考虑以下一段代码,其中的 get_random_number() 带有随机性质,我们在服务器 SERVER 中 执行这段代码,并将随机数的结果保存到键 number 上:

# 虚构例子,不会真的出现在脚本环境中
redis> EVAL "return redis.call('set', KEYS[1], get_random_number())" 1 number
OK
redis> GET number
"10086"

现在,假如 EVAL 的代码被复制到了附属节点 SLAVE ,因为 get_random_number() 的随机 性质,它有很大可能会生成一个和 10086 完全不同的值,比如 65535 : 

# 虚构例子,不会真的出现在脚本环境中
redis> EVAL "return redis.call('set', KEYS[1], get_random_number())" 1 number

OK
redis> GET number
"65535"

可以看到,带有随机性的写入脚本产生了一个严重的问题:它破坏了服务器和附属节点数据之 间的一致性。

当从 AOF 文件中载入带有随机性质的写入脚本时,也会发生同样的问题。

Note: 只有在带有随机性的脚本进行写入时,随机性才是有害的。 如果一个脚本只是执行只读操作,那么随机性是无害的。

比如说,如果脚本只是单纯地执行 RANDOMKEY 命令,那么它是无害的;但如果在执行RANDOMKEY 之后,基于 RANDOMKEY 的结果进行写入操作,那么这个脚本就是有害的。

和随机性质类似,如果一个脚本的执行对任何副作用产生了依赖,那么这个脚本每次执行所产 生的结果都可能会不一样。

为了解决这个问题,Redis 对 Lua 环境所能执行的脚本做了一个严格的限制——所有脚本都必 须是无副作用的纯函数(pure function)。

为此,Redis 对 Lua 环境做了一些列相应的措施:
• 不提供访问系统状态状态的库(比如系统时间库)。 • 禁止使用 loadfile 函数。

• 如果脚本在执行带有随机性质的命令(比如 RANDOMKEY ),或者带有副作用的命令 (比如 TIME )之后,试图执行一个写入命令(比如 SET ),那么 Redis 将阻止这个脚本 继续运行,并返回一个错误。

• 如果脚本执行了带有随机性质的读命令(比如 SMEMBERS ),那么在脚本的输出返回给Redis 之前,会先被执行一个自动的字典序排序,从而确保输出结果是有序的。

用 Redis 自己定义的随机生成函数,替换 Lua 环境中 math 表原有的 math.random 函数 和 math.randomseed 函数,新的函数具有这样的性质:每次执行 Lua 脚本时,除非显式 地调用 math.randomseed ,否则 math.random 生成的伪随机数序列总是相同的。

经过这一系列的调整之后,Redis 可以保证被执行的脚本:
1. 无副作用。
2. 没有有害的随机性。
3. 对于同样的输入参数和数据集,总是产生相同的写入命令。

3、脚本的执行

在脚本环境的初始化工作完成以后,Redis 就可以通过 EVAL 命令或 EVALSHA 命令执行 Lua脚本了。
其中,EVAL 直接对输入的脚本代码体(body)进行求值:

redis> EVAL "return 'hello world'" 0
"hello world"

而 EVALSHA 则要求输入某个脚本的 SHA1 校验和,这个校验和所对应的脚本必须至少被EVAL 执行过一次:

redis> EVAL "return 'hello world'" 0
"hello world"
redis> EVALSHA 5332031c6b470dc5a0dd9b4bf2030dea6d65de91 0 // 上一个脚本的校验和 "hello world"

或者曾经使用 SCRIPT LOAD 载入过这个脚本:

redis> SCRIPT LOAD "return 'dlrow olleh'"
"d569c48906b1f4fca0469ba4eee89149b5148092"
redis> EVALSHA d569c48906b1f4fca0469ba4eee89149b5148092 0
"dlrow olleh"

因为 EVALSHA 是基于 EVAL 构建的,所以下文先用一节讲解 EVAL 的实现,之后再讲解 EVALSHA 的实现。

4、 EVAL 命令的实现

EVAL 命令的执行可以分为以下步骤:

1. 为输入脚本定义一个 Lua 函数。

2. 执行这个 Lua 函数。以下两个小节分别介绍这两个步骤。

定义 Lua 函数

所有被 Redis 执行的 Lua 脚本,在 Lua 环境中都会有一个和该脚本相对应的无参数函数:当 调用 EVAL 命令执行脚本时,程序第一步要完成的工作就是为传入的脚本创建一个相应的 Lua 函数。

举个例子,当执行命令 EVAL "return 'hello world'" 0 时,Lua 会为脚本 "return 'hello world'" 创建以下函数:

其中,函数名以 f_ 为前缀,后跟脚本的 SHA1 校验和(一个 40 个字符长的字符串)拼接而 成。而函数体(body)则是用户输入的脚本。

以函数为单位保存 Lua 脚本有以下好处:

  • 执行脚本的步骤非常简单,只要调用和脚本相对应的函数即可。

  • Lua 环境可以保持清洁,已有的脚本和新加入的脚本不会互相干扰,也可以将重置 Lua 环境和调用 Lua GC 的次数降到最低。

  • 如果某个脚本所对应的函数在 Lua 环境中被定义过至少一次,那么只要记得这个脚本的 SHA1 校验和,就可以直接执行该脚本——这是实现 EVALSHA 命令的基础,稍后在介 绍 EVALSHA 的时候就会说到这一点。

在为脚本创建函数前,程序会先用函数名检查 Lua 环境,只有在函数定义未存在时,程序才创建函数。重复定义函数一般并没有什么副作用,这算是一个小优化。

另外,如果定义的函数在编译过程中出错(比如,脚本的代码语法有错),那么程序向用户返回 一个脚本错误,不再执行后面的步骤。

执行 Lua 函数

在定义好 Lua 函数之后,程序就可以通过运行这个函数来达到运行输入脚本的目的了。

不过,在此之前,为了确保脚本的正确和安全执行,还需要执行一些设置钩子、传入参数之类 的操作,整个执行函数的过程如下:

  1. 将 EVAL 命令中输入的 KEYS 参数和 ARGV 参数以全局数组的方式传入到 Lua 环境中。

  2. 设置伪客户端的目标数据库为调用者客户端的目标数据库:fake_client->db =

    caller_client->db ,确保脚本中执行的 Redis 命令访问的是正确的数据库。

  3. 为 Lua 环境装载超时钩子,保证在脚本执行出现超时时可以杀死脚本,或者停止 Redis

    服务器。

  4. 执行脚本对应的 Lua 函数。

  5. 如果被执行的 Lua 脚本中带有 SELECT 命令,那么在脚本执行完毕之后,伪客户端 中的数据库可能已经有所改变,所以需要对调用者客户端的目标数据库进行更新: caller_client->db = fake_client->db 。

  6. 执行清理操作:清除钩子;清除指向调用者客户端的指针;等等。

  7. 将 Lua 函数执行所得的结果转换成 Redis 回复,然后传给调用者客户端。

  8. 对 Lua 环境进行一次单步的渐进式 GC 。

以下是执行 EVAL "return 'hello world'" 0 的过程中,调用者客户端(caller)、Redis 服务 器和 Lua 环境之间的数据流表示图:

 

上面这个图可以作为所有 Lua 脚本的基本执行流程图,不过它展示的 Lua 脚本中不带有 Redis 命令调用:当 Lua 脚本里本身有调用 Redis 命令时(执行 redis.call 或者 redis.pcall ), Redis 和 Lua 脚本之间的数据交互会更复杂一些。

举个例子,以下是执行命令 EVAL "return redis.call('DBSIZE')" 0 时,调用者客户端 (caller)、伪客户端(fake client)、Redis 服务器和 Lua 环境之间的数据流表示图:

因为 EVAL "return redis.call('DBSIZE')" 只是简单地调用了一次 DBSIZE 命令,所以 Lua 和伪客户端只进行了一趟交互,当脚本中的 redis.call 或者 redis.pcall 次数增多时,Lua 和伪客户端的交互趟数也会相应地增多,不过总体的交互方法和上图展示的一样。

5、 EVALSHA 命令的实现

前面介绍 EVAL 命令的实现时说过,每个被执行过的 Lua 脚本,在 Lua 环境中都有一个 和它相对应的函数,函数的名字由 f_ 前缀加上 40 个字符长的 SHA1 校验和构成:比如 f_5332031c6b470dc5a0dd9b4bf2030dea6d65de91 。

只要脚本所对应的函数曾经在 Lua 里面定义过,那么即使用户不知道脚本的内容本身,也可以 直接通过脚本的 SHA1 校验和来调用脚本所对应的函数,从而达到执行脚本的目的——这就是 EVALSHA 命令的实现原理。

可以用伪代码来描述这一原理:

def EVALSHA(sha1):
    # 拼接出 Lua 函数名字
    func_name = "f_" + sha1
    # 查看该函数是否已经在 Lua 中定义
    if function_defined_in_lua(func_name): 
        # 如果已经定义过的话,执行函数
        return exec_lua_function(func_name) 
    else:
        # 没有找到和输入 SHA1 值相对应的函数则返回一个脚本未找到错误 
        return script_error("SCRIPT NOT FOUND")

除了执行 EVAL 命令之外,SCRIPT LOAD 命令也可以为脚本在 Lua 环境中创建函数:

redis> SCRIPT LOAD "return 'hello world'"
"5332031c6b470dc5a0dd9b4bf2030dea6d65de91"
redis> EVALSHA 5332031c6b470dc5a0dd9b4bf2030dea6d65de91 0
"hello world"

二、 小结

• 初始化 Lua 脚本环境需要一系列步骤,其中最重要的包括: – 创建 Lua 环境。

– 载入 Lua 库,比如字符串库、数学库、表格库,等等。
– 创建 redis 全局表格,包含各种对 Redis 进行操作的函数,比如 redis.call 和redis.log ,等等。
– 创建一个无网络连接的伪客户端,专门用于执行 Lua 脚本中的 Redis 命令。

• Reids 通过一系列措施保证被执行的 Lua 脚本无副作用,也没有有害的写随机性:对于 同样的输入参数和数据集,总是产生相同的写入命令。

• EVAL 命令为输入脚本定义一个 Lua 函数,然后通过执行这个函数来执行脚本。
• EVALSHA 通过构建函数名,直接调用 Lua 中已定义的函数,从而执行相应的脚本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1321133.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

加特兰Demo点迹数据Python读取和显示

加特兰当前主推的芯片,拿到了样件做了几个基本Demo测试,录取的点迹数据为txt文档,数据格式如下: FT 0.10 CMN1 263 CMN2 150 BNK 0 --- F 0 O 140/2/140!0/0/0/0/0/0.00! --- BK00: P 25.67, R 4.11, V 0.00, A -39.04,…

AR室内导航如何实现?技术与原理分析

随着科技的进步,我们生活中许多方面正在被重新定义。其中之一就是导航,尤其是室内导航。增强现实(AR)技术的出现为室内导航带来了革命性的变革。本文将深入探讨AR室内导航的技术与原理,以及它如何改变我们的生活方式。…

bat批处理:git上传更新

查看专栏目录 Network 灰鸽宝典专栏主要关注服务器的配置,前后端开发环境的配置,编辑器的配置,网络服务的配置,网络命令的应用与配置,windows常见问题的解决等。 文章目录 批处理背景批处理代码代码说明:使…

Hadoop Single Node Cluster的安装

Hadoop Single Node Cluster的安装 安装JDK查看java -version更新本地软件包安装JDK查看java安装位置 设置SSH无密码登录安装hadoop下载安装设置hadoop环境变量修改hadoop配置设置文件设置core-site.xml设置YARN-site.xml设置mapred-site.xml设置HDFS分布式文件系统创建并格式化…

[ CTF ]【天格】战队WriteUp-第七届“强网杯”全国安全挑战赛

第七届“强网杯”全国安全挑战赛 2023.12.16~2023.12.17 文章目录 【Misc】Pyjail ! Its myFILTER !!!easyfuzz谍影重重2.0签到Pyjail ! Its myRevenge !!!server_8F6C72124774022B.py 问卷调查 【Reverse】ezre 【Web】happygame 【强网先锋】石头剪刀布TrieSpeedUpezreez_fmt…

翻译: LLMs新的工作流程和新的机会 New workflows and new opportunities

生成人工智能正以多种方式引领着不仅仅是成本节约,更是收入增长。但是,就像生成人工智能这样的通用技术创造价值的方式有很多,谈论这些方式是很多的。但在这个视频中,我想看看一些我看到的新兴的,或者更常见的走向这种…

Java 8 中的 Stream:优雅的集合处理

Java 8 中的 Stream:优雅的集合处理 为什么需要 Stream?Stream 的特性Stream 基本操作1. 创建 Stream2. 中间操作2.1 过滤(Filter)2.2 映射(Map)2.3 截断(Limit) 3. 终端操作3.1 遍历…

STM32内部是怎么工作的

STM32是怎么工作的 1 从孩子他妈说起2 早期计算机的组成2.1 五大元件(1)第一个出场的是电容元件(2)第二个出场的是二极管(3)第三个出场的是电阻元件(4)第四个出场的是电感&#xff0…

其他配置相关安装

consul安装和配置 docker run -d -p 8500:8500 -p 8300:8300 -p 8301:8301 -p 8302:8302 -p 8600:8600/udp consul consul agent -dev -client0.0.0.0访问:http://192.168.0.102:8500/ DNS查询 dig 192.168.0.102 -p 8600 consul.service.consul SRVnacos安装 ht…

华为OS与麒麟OS:华为自研操作系统的对决

导言 在移动操作系统领域,华为OS和麒麟OS代表了华为在自主研发方面的努力。本文将深入探讨这两个操作系统的特点、竞争关系以及它们在用户体验、生态系统建设等方面的差异。 1. 背景与起源 华为OS的诞生: 华为OS是华为公司为应对外部环境而自主…

12.18_黑马数据结构与算法笔记Java

目录 thinking:orElse? thinking:map.computerifabsent? thinking:subString? 184 哈希表 问2 解释拆分 185 哈希算法 概述 186 哈希算法 Object.hashCode 187 哈希算法 String.hashCode 188 哈希算法 冲突测试 189 哈希算法 MurmurHash 190…

Linux操作系统:自由、稳定、强大的开源之光

导言 Linux操作系统作为一个开源的、多用户、多任务、支持多线程和多CPU的UNIX类操作系统,不仅在服务器领域占有显著份额,也逐渐在桌面和嵌入式系统中崭露头角。Linux操作系统的多样性体现在各种不同的发行版上,而Ubuntu、CentOS和Red Hat可以…

用Python编辑PDF文件:拆分合并、加密解密、页面编辑

文章目录 安装和初步使用合并与拆分页面编辑加密解密 安装和初步使用 PyPDF2支持拆分、合并、页面旋转、添加水印、加密解密等操作。支持pip安装,过程很丝滑。 pip install PyPDF2PyPDF2提供了PdfFileReader类,可用于读取PDF文件,其metadat…

用户行为分析遇到的问题-ubantu16,hadoop3.1.3

用户行为分析传送门 我的版本 ubantu16 hadoop 3.1.3 habse 2.2.2 hive3.1.3 zookeeper3.8.3 sqoop 1.46/1.47 我sqoop把MySQL数据往hbase导数据时候有问题 重磅:大数据课程实验案例:网站用户行为分析(免费共享) 用户行为分析-小…

使用ffmpeg将图片合成为mp4

首先在在图片文件夹输入cmd 这里确保已经安装ffmpeg并配置好环境变量。 然后这是我的文件夹目录: 将21张图片合成为mp4视频 这里使用如下命令: ffmpeg -framerate 1 -start_number 0 -i %d.png -c:v libx264 -pix_fmt yuv420p output.mp4 -framerat…

rabbitmq-常见七种消息队列-控制台界面管理-python-实现简单访问

文章目录 1.消息的基本概念1.1.生产者和消费者1.2.消息队列(Queue)1.3.交换机(Exchange)1.4.消息确认 2.七种队列模式2.1.简单模式(Hello World)2.2.工作队列模式(Work queues)2.3.发布订阅模式(Publish/Subscribe)2.4.路由模式(Routing)2.5.主题模式(Topics)2.6.远程过程调用(…

windows下wsl(ubuntu)ldconfig报错

错误 sudo ldconfig /sbin/ldconfig.real: Cant link /usr/lib/wsl/lib/libnvoptix_loader.so.1 to libnvoptix.so.1 /sbin/ldconfig.real: /usr/lib/wsl/lib/libcuda.so.1 is not a symbolic link解决: 处理 sudo ldconfig 报错 libcuda.so.1 is not a symbolic …

GZ015 机器人系统集成应用技术样题8-学生赛

2023年全国职业院校技能大赛 高职组“机器人系统集成应用技术”赛项 竞赛任务书(学生赛) 样题8 选手须知: 本任务书共 25页,如出现任务书缺页、字迹不清等问题,请及时向裁判示意,并进行任务书的更换。参赛队…

RPC(3):HttpClient实现RPC之GET请求

1HttpClient简介 在JDK中java.net包下提供了用户HTTP访问的基本功能,但是它缺少灵活性或许多应用所需要的功能。 HttpClient起初是Apache Jakarta Common 的子项目。用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 H…

3.2 内容管理模块 - 课程分类、新增课程、修改课程

内容管理模块-课程分类、新增课程、修改课程 文章目录 内容管理模块-课程分类、新增课程、修改课程一、课程分类1.1 课程分类表1.2 查询树形结构1.2.1 表自连接1.2.2 SQL递归 1.3 Mapper1.4 Service1.5 Controller1.6 效果图 二、添加课程2.1 需求分析2.2 数据表2.2.1 课程基础…