【MySQL】聊聊你不知道的前缀索引原理以及使用场景

news2025/1/20 14:50:52

背景

在本周的时候,接到一个需求,需要通过加密后的身份证 md5 去数据库里匹配。由于业务方存储的是身份证 md5+username 构建的一列,并且没有加索引。
解决方案:1.新建一列 md5的列,加索引 2.对现有的列进行加前缀索引。

并且由于是md5值,使用前缀索引区分度很高。但是为了后期业务的拓展,采用了方案1。
那么结合遇到的场景,就来聊聊前缀索引的使用场景细节。

前缀索引

在平时的使用过过程,其实很多网站支持使用邮箱进行登陆。所以可能出现。

select f1, f2 from SUser where email='xxx';
create table SUser(
ID bigint unsigned primary key,
email varchar(64), 
email_2 varchar(64)
)engine=innodb;

那么针对email字段 如何添加索引比较好。其实如果email的区分度比较好的话,可以直接对email加整个索引。 或者针对指定前缀索引。

alter table SUser add index index1(email);
alter table SUser add index index2(email_2(6));

index1索引图结构如下
在这里插入图片描述
index_2 索引如下
在这里插入图片描述
接着我们来分析index1 和 index2索引的查询过程。
其实针对于index1来说,由于对email整个字段添加了索引,当查询 email = ‘qxlxi@qq.com’ 会直接从索引树上查询到满足条件的记录。找到对应的id,然后通过主键索引树上找到整行记录。然后接着判断是否存在图和条件的,没有直接退出。

但是对于index2来说,由于只针对部分加索引,会查询符合条件的索引,比如找到第一条,然后找到id,发现不符合,接着查询,所以整个过程需要不断的拿主键id 判断等。所以合理的设置前缀索引的长度 非常有讲究,否则,可能会增加额外的记录扫描次数。

用前缀索引,定义好长度,就可以做到既节省空间,又不用额外增加太多的查询成本。

其实主要还是看字段长度的区分度,区分度高就可以避免额外查询。

select count(distinct email) as L from SUser;

select 
  count(distinct left(email,4)as L4,
  count(distinct left(email,5)as L5,
  count(distinct left(email,6)as L6,
  count(distinct left(email,7)as L7,
from SUser;

说白了就是,进行对比,选择一个区分度比较高的长度。

对覆盖索引的影响

EXPLAIN SELECT id,email FROM Suser WHERE email = 'qxlxi@qq.com';

在这里插入图片描述

EXPLAIN SELECT id,email FROM Suser WHERE email_2 = 'qxlxi@qq.com';

在这里插入图片描述
可以发现,使用前缀索引没有办法进行使用覆盖索引,而整个字符串的可以使用。这是因为对于前缀索引需要在回到id索引查下具体的值是否符合条件。

其他方式

比如针对身份证这种,前6位区分度不高,可以采用倒叙存储的方式。或者针对特定列创建对应的额外的索引字段。

select field_list from t where id_card = reverse('input_id_card_string');

针对特定学号,城市编号和@gamil.com 没有区分度,这种情况我们可以采用只保存学校编号入学年份、顺序编号即可。
在这里插入图片描述

小结

本篇文章,主要简单的介绍了下,使用字符串创建前缀索引的一些优缺点。
1.创建整个字符串可能比较浪费空间
2.创建前缀索引,节省空间,但是可能有多余的查询。
3.使用一定的区分度减少多余查询。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1667599.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数组实现循环队列

1、分析 循环队列最主要的特点为当前面的空间被pop后,后面的数据可以插入到前面空余的数据中去; 所以最难的部分为判断什么时候为空什么时候为满: a、空满问题 我们先来分析当数据满时,head和tail相等(tail认为是指…

C++:9.scanf扩展——原来这么好用!

——scanf:我**不常用了? 有一天看到了一道题: C 输入一个时间,输出它属于,白天,下午还是黑夜。 输入样例: 15:20 00:00 13:14 05:20 11:45 14:00 ……??? 大胆题目小瞧我的编程水平!!!!!…

什么是 IIS

什么是 IIS 一、什么是 IIS二、IIS 的功能三、IIS 几点说明四、IIS 的版本五、IIS 常见的组合 欢迎关注【云边小网安】 一、什么是 IIS IIS:指 Internet Information Services ,是一种由微软公司开发的 Web 服务器应用程序。IIS:是一种 Web …

GPU prompt

提问: GPU是如何与CPU协调工作的? GPU也有缓存机制吗?有几层?速度差异是多少? GPU渲染流程有哪些阶段?他们的功能分别是什么? Early-Z技术是什么?发生在哪个阶段?这个…

MySQL表死锁查询语句

步骤1:查询表死锁的sql语句: SELECT * FROM information_schema.PROCESSLIST where length(info) >0 ; 或 SELECT * FROM information_schema.INNODB_TRX; 步骤2:删除 kill "对应的线程id"

hadoop克隆虚拟机

克隆虚拟机 小白的Hadoop学习笔记 2024/5/11 9:42 文章目录 克隆虚拟机准备好模板机克隆* 记得先将模板机关机 配置ipifcfg-ens33hostnamehosts重启 测试是否成功ifconfigping xshell 准备好模板机 克隆 * 记得先将模板机关机 下一页>>下一页 选择创建完整克隆 起名字…

【大模型赋能开发者】海云安入选数世咨询LLM驱动数字安全2024——AI安全系列报告

近日,国内知名数字产业领域第三方调研咨询机构数世咨询发布了LLM驱动数字安全2024——AI安全系列报告。报告通过调研、公开信息收集等方式对目前十余家已具备LLM相关的应用能力安全厂商对比分析出了这一领域当前的产业现状并进行了各厂商的能力展示。 海云安凭借近…

Linux:文件系统

Linux:文件系统 磁盘物理结构存储结构逻辑结构 文件系统inode分区 & 分组分区管理inode Bitmap & inode TableBlock Bitmap & Data BlocksGDT & Super Block & Boot Block 重新理解目录 软硬链接软链接硬链接软硬链接的使用场景 磁盘 计算机需…

C++中vector的简单实现

文章目录 一、主要任务1. 查看文档的网站的链接2.内部模拟的函数 二、本人的模拟实现过程1. 所需模拟实现的函数a.构造、拷贝构造b. reverse()扩容c.insert()、push_back()插入数据d. erase()、pop_back()删除数据e. swap()交换f. begin()、end()非const与const迭代器g. 完善构…

什么是$t?$t的介绍及使用

目录 $t介绍&#xff1a; 作用&#xff1a; 安装国际化插件&#xff1a; 创建国际化资源文件 配置 vue-i18n &#xff1a; 切换语言&#xff1a; 下面为中文和英文状态下的效果&#xff1a; 如下面所示&#xff0c;这是一段前端代码&#xff1a; <el-form-item :label…

如何在 Linux / Ubuntu 上下载和安装 JMeter?

Apache JMeter 是一个开源的负载测试工具&#xff0c;可以用于测试静态和动态资源&#xff0c;确定服务器的性能和稳定性。在本文中&#xff0c;我们将讨论如何下载和安装 JMeter。 安装 Java&#xff08;已安装 Java 的此步骤可跳过&#xff09; 安装 Java 要下载 Java&…

序列到序列模型在语言识别Speech Applications中的应用 Transformer应用于TTS Transformer应用于ASR 端到端RNN

序列到序列模型在语言识别Speech Applications中的应用 A Comparative Study on Transformer vs RNN in Speech Applications 序列到序列(Seq2Seq)模型在语音识别(Speech Applications)中有重要的应用。虽然Seq2Seq模型最初是为了解决自然语言处理中的序列生成问题而设计的…

访客管理系统对于校园安全的重要性

校园访客办理计划是针对校园安全需求规划的安全办理体系&#xff0c;主要用于对校园外来人员的科学办理。要做好校园安全作业&#xff0c;把风险分子拒之门外尤为要害。校园访客办理计划实现访客实名制&#xff0c;并结合公安网、黑名单功用&#xff0c;对风险人员进行提前预警…

指针的奥秘(四):回调函数+qsort使用+qsort模拟实现冒泡排序

指针 一.回调函数是什么&#xff1f;二.qsort函数使用1.qsort介绍2.qsort排序整型数据3.qsort排序结构体数据1.通过结构体中的整形成员排序2.通过结构体中的字符串成员排序 三.qsort模拟实现冒泡排序 一.回调函数是什么&#xff1f; 回调函数就是一个通过函数指针调用的函数。 …

机器人系统ros2-开发实践07-将机器人的状态广播到 tf2(Python)

上个教程将静态坐标系广播到 tf2&#xff0c;基于这个基础原理这个教程将演示机器人的点位状态发布到tf2 1. 写入广播节点 我们首先创建源文件。转到learning_tf2_py我们在上一教程中创建的包。在src/learning_tf2_py/learning_tf2_py目录中输入以下命令来下载示例广播示例代码…

显卡、显卡驱动、CUDA、cuDNN、CUDA Toolkit、NVCC、nvidia-smi等概念的区别与联系

在科技日新月异的今天&#xff0c;显卡、显卡驱动、CUDA、cuDNN、CUDA Toolkit、NVCC、nvidia-smi等术语已经成为了科技领域的重要组成部分。本文旨在阐述这些术语之间的区别与联系&#xff0c;帮助您更好地理解它们在技术生态系统中的作用。 一、显卡 显卡&#xff0c;也称为…

利用PS在不伤背景的前提下根据颜色去除图像上不想要的内容

下面为一个例子&#xff0c;去除图像上红色的虚线 Step1.用套索工具框选带有颜色的部分 Step2.切换到魔术棒工具&#xff0c;上端选项中&#xff0c;点击与选区交叉&#xff0c;连续这一项不要勾选 Step3.在需要去除的部分点击一下即可在框选范围内选中所有同颜色的区域&#x…

“二代”接班进行时:达利食品许阳阳揭秘“零食大王”成长密钥

“二代接班”早已不是一个新鲜话题。近年来&#xff0c;随着时间的推移&#xff0c;那些伴随改革开放和中国制造崛起的民营企业&#xff0c;更多的正在经历或已完成“二代接班”。 “毛巾王子”家的洁丽雅&#xff0c;最近因大手笔签约多位代言人而引起讨论的九牧王&#xff0…

用python写算法——队列笔记

1.队列定义 队列是一种特殊的线性表&#xff0c;它只允许在表的前端进行删除操作&#xff0c;在表的后端进行插入操作&#xff0c;和栈一样&#xff0c;队列是一种操作受限制的线性表。进行插入操作的端称为队尾&#xff0c;进行删除操作的端称为队头。队列中没有元素时&#…

MATLAB的Bar3函数调节渐变色(内附渐变色库.mat及.m文件免费下载链接)

一. colormap函数 可以使用colormap函数&#xff1a; t1[281.1,584.6, 884.3,1182.9,1485.2; 291.6,592.6,896,1197.75,1497.33; 293.8,596.4,898.6,1204.4,1506.4; 295.8,598,904.4,1209.0,1514.6];bar3(t1,1) set(gca,XTickLabel,{300,600,900,1200,1500},FontSize,10) set…