2023 年 12 月 16 日,Oracle 公司在一篇名为 《Introducing JavaScript support in MySQL》的文章中宣布 MySQL 数据库服务器将开始支持 JavaScript 语言。
这个举措标志着继PostgreSQL之后, MySQL 也支持使用 JavaScript 编写函数和存储过程了。作为最流行的开源数据库,这一消息在技术界引起了广泛关注。
PostgreSQL 通过其PL/v8扩展自 2012 年起就已经支持 JavaScript。当前所有版本均支持 PLV8,包括像 Amazon RDS 这样的托管服务,并可用在存储过程和触发器中。
这一新功能目前仅在 MySQL 企业版和 MySQL Heatwave 中提供,并处于预览阶段。开发人员现在可以在 MySQL 数据库服务器中编写 JavaScript 存储过程(函数和过程)。存储的程序将与 GraalVM 运行时一起运行。
*存储过程(Stored Procedure)
存储过程是一种在数据库中存储复杂程序,以便外部程序调用的一种数据库对象。存储过程是为了完成特定功能的 SQL 语句集,经编译创建并保存在数据库中,用户可通过指定存储过程的名字并给定参数(需要时)来调用执行。存储过程思想上很简单,就是数据库 SQL 语言层面的代码封装与重用。MySQL 5.0 版本开始支持存储过程。
为什么使用 JavaScript 存储过程?
JavaScript 是最流行的编程语言之一,除了更简单的语法和对现代语言特性的支持外,它受欢迎的一个关键因素是丰富的生态系统,它在浏览器、服务端、客户端等场景提供了大量可重用的代码模块。
当需要持久存储时,最流行的开源数据库 MySQL 将是 JavaScript 开发人员的自然选择。通过在存储过程中支持 JavaScript,开发人员将能够用熟悉的语言编写 MySQL 存储过程,并利用广泛的 JavaScript 生态系统。
对 JavaScript 存储过程的支持,不仅会通过利用大型生态系统来提高开发人员的生产力;现在,更多的开发人员将拥有编写存储过程的必要技能。换句话说,公司企业现在可以利用广泛访问的 JavaScript 技能集进行后端开发,从而挖掘更广泛的开发人员人才。
存储过程最大限度地减少了数据库服务器和应用程序之间的数据移动,从而提供了一个关键优势。
传输大量数据,特别是批处理数据,可能会出现问题,原因有很多:
- 这是非常耗时的,并且可能会导致大量的网络开销。
- 当应用程序进行频繁交互时,延迟的增加可能会变得明显。
- 在中间层或应用层处理大数据量需要大量的内存和存储,增加了成本。
- 由于安全风险和数据保护需求,通常必须避免机器之间的数据传输,特别是在云环境中。
- 将大量数据移出数据库服务将增加出口成本。
使用存储过程在数据库内部处理数据是解决这些问题的常见方法。
使用场景
MySQL-JavaScript 在应用程序设计中释放了新的机会,这些机会曾经受到权衡的限制。JavaScript 存储过程使开发人员能够轻松地避开数据移动,并在数据库中无缝地实现高级数据处理逻辑。下面列出了一些简单用例的例子:
- 数据提取: 从数据库中常用的复杂对象中提取信息,如 URL 字符串。
- 数据格式化: 使用广泛使用的模板方案(如 JavaScript Mustache 包)生成格式化字符串。
- 近似搜索: 在 SELECT 查询中使用相似性评分函数,例如,从表中检索相似的字符串。
- 数据验证: 使用复杂的验证规则清理数据。例如,使用 JavaScript 验证器包。
- 压缩/编码: 使用自定义算法,不包含在 MySQL 中,用于数据压缩和加密。
- 数据转换: 更改数据表示,例如将字符串列转换为特征工程中使用的稀疏矩阵表示。
所提供的示例只是对该特性潜力的一瞥。还有更复杂的用例,比如部署完整的数据管道和为机器学习应用程序设置登台环境。
MySQL-JavaScript
MySQL 正在引入对 JavaScript 存储过程的支持。用户现在可以在数据库中表达丰富的过程逻辑。JavaScript 运行时是通过 GraalVM 集成的,用户可以使用 GraalVM 的所有企业版(EE)功能,如编译器优化、性能和安全功能,而不需要额外的费用。
此版本支持:
- 基于ECMAScript 2021的 js 语言
- 存储过程和存储函数
- MySQL 数据类型,如所有的整数、浮点数和 CHAR/VARCHAR 类型的变化
ECMAScript 标准库包括许多基本的使用操作和数据结构,使实现变得简单而富有表现力。开发人员还可以重用来自在线包管理器(如“npm”)的数百万个可用的第三方包。
*GraalVM是一个 Oracle 编译器生态系统,包括 JDK,语言实现,如 JavaScript, R, Python, Ruby 和 Java。它包括即时(JIT)和提前(AOT)编译技术。它还提供了一个完全托管的虚拟机,具有沙箱功能和工具支持。MySQL-JavaScript 与 GraalVM 企业版集成。
定义 JavaScript 存储过程
要在 MySQL 中创建一个 JavaScript 存储过程,您可以使用用于传统存储函数和过程的相同 SQL 语句的变体:
CREATE FUNCTION gcd_js (a INT, b INT) RETURNS INT
LANGUAGE JAVASCRIPT AS $$
let [x, y] = [Math.abs(a), Math.abs(b)];
while(y) [x, y] = [y, x % y];
return x;
$$;
从上面的示例中可以看出,JavaScript 代码直接嵌入到 sql 可调用函数的定义中。参数的名称可以在 JavaScript 代码中直接引用,当调用函数时,SQL 类型和 JavaScript 类型之间会有隐式的类型转换。
要调用 JavaScript 存储过程,应该使用 call 语句,类似于常规的 SQL 存储过程。存储过程支持输入和输出参数。
在 SQL 语句中执行 JavaScript 代码
JavaScript 函数可以在传统 SQL 函数调用的任何地方从 SQL 语句调用;在 SELECT 表达式、WHERE、GROUP BY 和 ORDER BY 子句、dml、ddl、Views 等中。下面是一个 SQL 语句调用我们上面定义的函数的例子:
SELECT col1, col2, gcd_js(col1,col2)
FROM my_table
WHERE gcd_js(col1, col2) > 1
ORDER BY gcd_js(col1, col2);
CREATE TABLE gcd_table
AS SELECT gcd_js(col1,col2)
FROM my_table;
在 MySQL 中调试 JavaScript 代码
调试与软件开发是密切相关的。当 JavaScript 程序在数据库中运行时,MySQL-JavaScript 特性公开了额外的 SQL 接口以帮助进行故障排除。
CREATE PROCEDURE division (IN a INT, IN b INT,
OUT result DOUBLE) LANGUAGE JAVASCRIPT AS $$
function validate(num) {
console.log("validating input value: ", num);
if (num === 0) throw ("Division by Zero!");
}
validate(b);
result = a / b;
$$
JavaScript 异常到 MySQL 错误的转换是透明的。除了标准输出,开发人员还可以访问 JavaScript 堆栈跟踪。
CALL division( 5, 0, @res);
ERROR 6000 (HY000): JavaScript> Division by Zero!
SELECT mle_session_state("stdout");
validating input value: 0
SELECT mle_session_state("stack_trace");
<js> validate(division:9:187-214)
<js> division(division:11:222-232)
<js> :anonymous(division:15:256-265)
</js></js></js>
各项指标
安全性
按 Oracle 宣称,MySQL 中对 JavaScript 的支持提供了最高级别的安全性、隔离性和数据保护。MySQL 的 JavaScript 依赖于业界公认的 Oracle 的 GraalVM 安全保证。
虚拟机沙箱保证了恶意代码无法危害 MySQL 服务器的其他模块。每个存储过程都在它自己的上下文中被解析和执行。此隔离策略不允许一个存储过程读取或修改其他存储过程的数据或代码。从 JavaScript 用户代码中生成或操作线程是受限制的,JavaScript 用户代码不能访问网络通信或文件系统。
JavaScript 存储过程建立在标准 MySQL 特权模型之上。只有特权用户才能创建存储过程。对 SP 的访问也可以通过特权来控制。一个用户可以定义可由其他用户执行的存储过程。
兼容性
JavaScript 存储过程可以与传统的 SQL 存储过程无缝协作。该特性与存储引擎无关,数据可以透明地从 InnoDB、Lakehouse 和 HeatWave 访问。
MySQL 热浪服务现在在 OCI、AWS 和 Azure 服务部署上预装和配置了 JavaScript。对于 MySQL 企业版,该功能需要手动安装和配置。
性能
MySQL-JavaScript 集成为其特定用例使用定制的 VM,以实现最佳的端到端性能。这种定制基于 GraalVM 的提前(AOT)编译,其中语言实现被编译成本机二进制表示,以便快速处理。
GraalVM 有自己的基于 ECMAScript 2021 标准的 JavaScript 实现。该语言的实现在性能上是有竞争力的,尽管它是使用 GraalVM 的 Polyglot 框架实现的,该框架专注于在同一个 VM 中支持多种编程语言。
最后,MySQL-JavaScript 特性受益于 GraalVM 企业版带来的各种最先进的优化,例如编译器优化,包括积极的内联和部分转义分析。它还包括一个配置文件引导的即时(JIT)编译器,该编译器在运行时在解释器和本机编译之间切换。
结论
MySQL- javascript 使开发人员能够直接在 MySQL 服务器中表达复杂的编程逻辑。这允许开发人员将应用程序的数据密集型部分推到数据附近,从而降低数据移动成本。使用基于 ECMAScript 2021 的 JavaScript 可以防止供应商锁定问题,而开发人员无需额外费用即可享受 GraalVM(企业版)的所有好处。要免费试用 MySQL- javascript,请从 Oracle Technology Network (OTN)下载 MySQL 企业版。MySQL- javascript 还与 MySQL HeatWave 云服务无缝集成,开发人员只需动动指尖即可获得最新的创新。
另外,有关 MySQL 对 JavaScript 支持的详细描述文档可以见:https://downloads.mysql.com/docs/mysql-manual-js-preview.en.pdf
作者联系方式
michealwayne@163.com
GitHub:http://github.com/MichealWayne
相关链接
- Oracle 《Introducing JavaScript support in MySQL》:https://blogs.oracle.com/mysql/post/introducing-javascript-support-in-mysql
- Oracle 《MySQL 8.3 Reference Manual——JavaScript Programs Technology Preview》:https://downloads.mysql.com/docs/mysql-manual-js-preview.en.pdf
- InfoQ 《MySQL 支持 JavaScript,目前处于预览阶段》:https://www.infoq.cn/article/6bT6kDa1ADuCKeTU4VlI
- code 秘密花园 《MySQL 正式引入 JavaScript 支持!》:https://mp.weixin.qq.com/s/5XGhgs5PI9RPwHD0RjbroA