适用于MySQL、PostgreSQL、Oracle等各种数据库的优化技巧
问题剖析
设想我们为customer
表的c_acctbal
列创建了一个B树索引c_acctbal_idx
,以加速相关查询。然而,一个看似无害的计算可能会阻碍索引的使用。比如这样的查询:
SELECT *
FROM customer
WHERE c_acctbal + 100 = 10000.0
通过EXPLAIN
命令查看查询计划:
-> Filter: ((customer.C_ACCTBAL + 100) = 10000.0) (cost=102301.50 rows=900955)
-> Table scan on customer (cost=102301.50 rows=900955)
显而易见,数据库优化器选择了全表扫描而非预期的索引查找,导致查询成本激增。
深入诊断
我们尝试将计算从左侧移至右侧,改写查询条件:
SELECT *
FROM customer
WHERE c_acctbal = 10000.0 - 100;
再次使用EXPLAIN
:
-> Index lookup on customer using c_acctbal_idx (C_ACCTBAL=(10000.0 - 100)) (cost=5.50 rows=5)
这次,优化器明智地选择了c_acctbal_idx
索引,查询成本降至原来的1%以下。
诊断结论: 实验表明,在索引列上进行计算会导致索引失效。这不仅适用于算术运算,也适用于函数调用和其他所有索引列上的计算。
解决方案
面对这一问题,我们有两种解决策略:
-
重写查询,将计算从索引列移至其他位置,以便查询能够利用现有的索引。
-
创建函数索引以匹配特定条件。例如:
CREATE INDEX phone_func_idx ON customer(LEFT(c_phone, 3))
注意:函数索引仅适用于与索引定义完全一致的条件,譬如LEFT(c_phone, 4) = '1390'将不会采用这个函数索引。
PawSQL的智能优化
PawSQL通过自动检测问题条件,并将其自动重写为等价形式,实现了上述第一个解决方案。
支持的内置运算符
PawSQL的自动重写优化支持以下算术运算符及其组合在条件上的运算:
-
乘法 (*)
-
加法 (+)
-
减法 (-)
-
除法 (/)
-
一元负号 (-)
支持的内置函数
PawSQL智能重写多种MySQL 8.0内置函数,包括但不限于:
-
日期时间函数:
ADDDATE()
,DATE_ADD()
,DATE_SUB()
,SUBDATE()
,DATEDIFF()
等 -
时间计算函数:
ADDTIME()
,SUBTIME()
,TIMEDIFF()
-
时间戳函数:
TIMESTAMPADD()
,TIMESTAMPDIFF()
-
时间转换函数:
SEC_TO_TIME()
,TIME_TO_SEC()
,FROM_DAYS()
,TO_DAYS()
-
IP地址转换函数:
INET_ATON()
,INET_NTOA()
,INET6_ATON()
,INET6_NTOA()
-
字符串函数:
LEFT()
,STRCMP()
-
日期格式化函数:
DATE_FORMAT()
,STR_TO_DATE()
-
其他函数:
YEAR()
,EXTRACT()
,CAST()
,IFNULL()
,ISNULL()
其他数据库的函数支持将在后续添加.
PawSQL重写前后的SQL对比
PawSQL重写前后的执行计划对比
总结
通过应用PawSQL的
重写优化,SQL查询不仅能够:
-
利用索引减少数据访问成本,还能
-
通过将计算从列上移到常量字面值上,避免对每一行进行计算。
这大大提升了查询的性能和效率。🚀
🌐 关于PawSQL
PawSQL专注数据库性能优化的自动化和智能化,提供的解决方案覆盖SQL开发、测试、运维的整个流程,支持MySQL,PostgreSQL,openGauss,Oracle等各种数据库。
欢迎点击关注PawSQL公众号👇👇👇