MySQL 索引介绍和最佳实践

news2024/11/25 13:53:53

目录

    • 一、前言
    • 二、索引类型
      • 1.1 主键索引(PRIMARY KEY)
      • 1.2 唯一索引(UNIQUE)
      • 1.3 普通索引(NORMAL)
        • 1.3.1 单列普通索引
        • 1.3.2 单列前缀普通索引
        • 1.3.3 多列普通索引
        • 1.3.4 多列前缀普通索引
      • 1.4 空间索引(SPATIAL)
      • 1.5 全文索引(FULLTEXT)
    • 三、表数据准备(后续演示都基于这个表)
    • 四、索引最佳实践
      • 4.1 全值匹配
      • 4.2 最左前缀原则
      • 4.3 在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描
      • 4.4 不能使用索引中范围查询条件右边的列
      • 4.5 尽量使用覆盖索引
      • 4.6 MySQL8.0之前在使用不等于(!=或者<>),not in ,not exists 的时候无法使用索引会导致全表扫描
      • 4.7 is null,is not null 一般情况下也无法使用索引
      • 4.8 like以通配符开头('%abc...')索引失效会变成全表扫描操作
      • 4.9 字符串不加单引号索引失效
      • 4.10 少用or或in,用它查询时,MySQL不一定使用索引
      • 4.11 范围查询索引失效
    • 五、索引使用总结

一、前言

索引是帮助高效获取数据排好序的数据结构,这里都会以MySQL InnoDB 存储引擎做讲解。

  • InnoDB 存储引擎索引有两个特点
    • 聚簇索引
      索引与数据存放在一起、一张表只有一个聚簇索引找到索引的同时也找到了数据,同时聚簇索引具有唯一性,默认是主键,如果表中没有定义主键,InnoDB 会选择一个非空唯一索引代替。如果没有,InnoDB 会定义一个隐藏的_rowid 列来作为聚簇索引。
    • 非聚簇索引
      索引与数据分开存放,索引结构的叶子节点指向了数据的对应行,如:一个表id字段是主键索引,创建一个name字段的普通索引,叶子节点是指向对应主键索引的值,通过name字段的普通索引找到对应id值,然后通过id回表主键索引获取到行数据。

二、索引类型

1.1 主键索引(PRIMARY KEY)

主键索引非空且唯一,在 InnoDB 存储引擎中会作为聚簇索引叶子节点会存放所有行数据。

ALTER TABLE `table_name` ADD PRIMARY KEY (`column`);

1.2 唯一索引(UNIQUE)

唯一索引值唯一,可为NULL值,而且可以多行数据为NULL值,也可以使用多个列作为唯一索引,在存储索引时会对多列组合唯一判断。

ALTER TABLE `table_name` ADD UNIQUE INDEX `index_name`(`column`) USING BTREE;

1.3 普通索引(NORMAL)

普通索引是我们最常用的一类索引,可以使用单个列作为索引,也可以使用多个列作为索引,多列索引也叫做复合索引或者组合索引,在字段的长度超过索引限制(索引最大长度是768字节),可以为字段的部分前缀创建索引。

1.3.1 单列普通索引
ALTER TABLE `table_name` ADD INDEX `index_name`(`column`);
1.3.2 单列前缀普通索引
ALTER TABLE `table_name` ADD INDEX `index_name`(`column`(2));
1.3.3 多列普通索引
ALTER TABLE `table_name` ADD INDEX `index_name`(`column1`, `column2`);
1.3.4 多列前缀普通索引
ALTER TABLE `table_name` ADD INDEX `index_name`(`column1`(2), `column2`(3));

1.4 空间索引(SPATIAL)

空间索引是对空间数据类型的字段建立的索引,MYSQL使用SPATIAL关键字进行扩展,使其能够在空间数据类型的语法上创建空间索引。

# 建表
CREATE TABLE `gis_position` (
	`id` INT NOT NULL,
	`gis` geometry NOT NULL COMMENT '空间位置信息',
	`geohash` VARCHAR ( 20 ) GENERATED ALWAYS AS (st_geohash ( `gis`, 12 )) VIRTUAL,
	PRIMARY KEY ( `id` ) 
) ENGINE = INNODB DEFAULT CHARSET = utf8mb4 COMMENT = '空间位置信息';

# 创建空间索引
ALTER TABLE gis_position ADD SPATIAL INDEX `idx_gis` ( `gis` );

1.5 全文索引(FULLTEXT)

全文索引类似于 elasticsearch 这样的搜索引擎,会对索引内容进行分词,当然比起 elasticsearch 还是差一些。

ALTER TABLE `table_name` ADD FULLTEXT INDEX `index_name`(`column`);

三、表数据准备(后续演示都基于这个表)

我这里库使用的字符集为utf8mb4,一个字符占用4个字节,utf8占用3个字节,如果字段为varchar类型,需要加的2字节用来存储字符串长度,因为varchar是变长字符串。

CREATE TABLE `company_staff` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `name` varchar(30) NOT NULL DEFAULT '' COMMENT '姓名',
  `age` int(11) NOT NULL DEFAULT '0' COMMENT '年龄',
  `position` varchar(20) NOT NULL DEFAULT '' COMMENT '职位',
  `interest` varchar(20) DEFAULT NULL COMMENT '兴趣爱好',
  `entry_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入职时间',
  PRIMARY KEY (`id`),
  KEY `idx_name_age_position` (`name`,`age`,`position`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_as_cs COMMENT='公司员工表';

INSERT INTO company_staff(name,age,position,interest,entry_time) VALUES('Kerwin',28,'cto','唱跳',NOW());
INSERT INTO company_staff(name,age,position,interest,entry_time) VALUES('Alia',26,'dev','rap',NOW());
INSERT INTO company_staff(name,age,position,interest,entry_time) VALUES('Coco',26,'dev','篮球',NOW());

四、索引最佳实践

对MYSQL的 explain SQL分析工具不熟的可以看看 MySQL explain SQL分析工具详解与最佳实践

4.1 全值匹配

  • 通过 name 字段精准匹配
EXPLAIN SELECT * FROM company_staff WHERE name= 'Kerwin';

在这里插入图片描述
这里可以看到使用了组合索引idx_name_age_position,我们的name字段为varchar(30),计算出name字段占用字节数为key_len = 30*4+2=122,和我们的执行计划中的key_len相等,同时ref为const,可以确定通过name字段精准匹配,使用到了组合索引idx_name_age_position,但是只使用到了一个name字段。

  • 通过 name + age 字段精准匹配
EXPLAIN SELECT * FROM company_staff WHERE name= 'Kerwin' AND age=28;

在这里插入图片描述
和上面通过name字段匹配执行计划类似,name字段占用字节数为122,age字段为int类型,int类型占用4个字节,name + age 字段一共为126字节和执行计划的key_len相等,同时ref为const,const代表使用了两个字段常量,可以确定使用到了组合索引idx_name_age_position,并且使用到了两个字段name + age。

  • 通过 name + age + position 字段精准匹配
EXPLAIN SELECT * FROM company_staff WHERE name= 'Kerwin' AND age=28 AND position='cto';

在这里插入图片描述
position字段为varchar(20),计算出字节数为20*4+2=82,在加上 name、age占用的字节数合计122+4+82=208字节和执行计划的key_len相等,同时ref为const,const,const代表使用了三个字段常量,确认idx_name_age_position索引中三个字段全部被使用到了。

4.2 最左前缀原则

如果索引了多列,要遵守最左前缀原则,指的是查询从索引的最左前列开始并且不跳过索引中的列。

PS:在MySQL8.0的时候加入了一个跳跃索引,在某些情况下会跳过中间没有被匹配的列去匹配后面的列,如果使用到了跳跃索引那么在Extra中会出现 Index skip scan。

  • 通过 age 字段精准匹配
EXPLAIN SELECT * FROM company_staff WHERE age= 28;

在这里插入图片描述
我们直接使用age查询,这里发现没有使用到索引,因为我们的组合索引第一个值是name,如果查询条件中没有name值是无法使用索引的。

  • 通过 name + position 字段精准匹配
EXPLAIN SELECT * FROM company_staff WHERE name= 'Kerwin' AND position='cto';

在这里插入图片描述
我们这里使用name + position 字段精准匹配,执行计划中显示使用到了索引,但是key_len=122,name字段占用的字节数刚好是122,证明这里虽然使用到了idx_name_age_position索引,但是只使用到了name一个字段匹配。

4.3 在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描

  • 这里将name转化成小写查询
EXPLAIN SELECT * FROM company_staff WHERE LOWER(name)= 'kerwin';

在这里插入图片描述

4.4 不能使用索引中范围查询条件右边的列

  • 通过name + position 精准匹配和age范围查询
EXPLAIN SELECT * FROM company_staff WHERE name= 'Kerwin' AND age<35 AND position='cto';

在这里插入图片描述
我们查询时age条件使用范围查询,这里可以看到key_len=126,name+age字节数为126,没有使用到position

4.5 尽量使用覆盖索引

查询条件和响应结果的列都存在索引中,这样只需要通过索引就能获取需要的数据,就不会在进行回表。

EXPLAIN SELECT name,age,position FROM company_staff WHERE name= 'Kerwin' AND age=28 AND position='cto';

在这里插入图片描述

4.6 MySQL8.0之前在使用不等于(!=或者<>),not in ,not exists 的时候无法使用索引会导致全表扫描

in、< 小于、 > 大于、 <=、>= 这些,MySQL内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引,MySQL8.0的时候不等于(!=或者<>),not in 也会根据检索比例、表大小等多个因素整体评估是否使用索引。

EXPLAIN SELECT * FROM company_staff WHERE name != 'Kerwin';

在这里插入图片描述

4.7 is null,is not null 一般情况下也无法使用索引

EXPLAIN SELECT * FROM company_staff WHERE name IS NULL;

在这里插入图片描述

4.8 like以通配符开头(‘%abc…’)索引失效会变成全表扫描操作

like查询是可以走索引的,但是只能通过前缀查询,不能以通配符开头。

  • 模糊匹配 name 字段,以win结尾的数据
EXPLAIN SELECT * FROM company_staff WHERE name LIKE "%win";

在这里插入图片描述

  • 模糊匹配 name 字段,以Ker开头的数据
EXPLAIN SELECT * FROM company_staff WHERE name LIKE "Ker%";

在这里插入图片描述

4.9 字符串不加单引号索引失效

字符串字段查询如果不加单引号或者算引号会发生隐式转换导致索引失效,如果是数字类型字段查询时使用单引号索引不会失效。

EXPLAIN SELECT * FROM company_staff WHERE name = 666;

在这里插入图片描述
发生隐式转换后SQL相当于变成SELECT * FROM company_staff WHERE CAST(name AS signed int) = 666;,name字段使用了函数索引失效

4.10 少用or或in,用它查询时,MySQL不一定使用索引

MySQL内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引,拿我这里的数据来说,表里一共三条数据,我IN查询4个值以内(包含4个值)是可以走索引的,一旦超过4个值到了5个值索引就会失效了,MySQL内部优化器会认为我们要IN查询这5个值全表扫描耗时会比使用索引要快,因为使用非聚簇索引是需要回表的。

EXPLAIN SELECT * FROM company_staff WHERE name IN ('4Kerwin','3Kerwin','2Kerwin','1Kerwin','Kerwin');

在这里插入图片描述

4.11 范围查询索引失效

MySQL内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引,可能是由于单次数据量查询过大导致优化器最终选择不走索引。

要想看到效果需要先添加10000条数据的样子,如果只有几条数据是会一直走索引。

  • 使用存储过程插入10000条数据
## 创建一个插入数据的存储过程
DROP PROCEDURE IF EXISTS insert_company_staff;
delimiter;;
CREATE PROCEDURE insert_company_staff () 
BEGIN
	DECLARE i INT;
	SET i = 1;
	WHILE ( i <= 10000 ) DO
		INSERT INTO `company_staff`(`name`, `age`, `position`, `interest`, `entry_time`) VALUES (CONCAT('Kerwin',i), 28 + i, 'cto', '唱跳', NOW());
		SET i = i + 1;
	END WHILE;
END;;
delimiter;

// 调用存储过程插入数据
CALL insert_company_staff ();
  • 给年龄添加单值索引
ALTER TABLE `company_staff` ADD INDEX `idx_age`(`age`);
  • 范围查询数据
EXPLAIN SELECT * FROM company_staff WHERE age >= 1 AND age <= 3000

在这里插入图片描述
如果查询范围比较大索引可能会失效,缩小查询范围是可以走索引的,最终是否走索引还是MySQL内部优化器会根据检索比例根据表大小等多个因素整体评估。

五、索引使用总结

假设有一个组合索引 index(a,b,c)

where语句是否使用索引
where a = 3是:使用到a
where a = 3 and b = 5是:使用到a,b
where a = 3 and b= 5 and c = 4是:使用到a,b.c
where b = 3 或 where b = 3 and c = 4 或 where c = 4
where a = 3 and c = 5是:使用到a,但是c不可以,b中间断了
where a = 3 and b > 4 and c=5是:使用到a和b,c不能用在范围之后,b断了
where a = 3 and b like "kk%’ and c =4是:使用到a,b.c
where a = 3 and b like ‘%kk’ and c = 4是:只用到a
where a = 3 and b like ‘%kk%’ and c =4是:只用到a
where a = 3 and b like ‘k%kk%’ and c = 4是:使用到a,b,c

like KK%相当于=常量,%KK和%KK%相当于范围

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1050618.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

商场做小程序商城的作用是什么?

商场是众多商家聚集在一起的购物公共场所&#xff0c;大商场也往往入驻着众多行业商家&#xff0c;是每个城市重要的组成部分。 随着互联网电商深入及客户消费行为改变&#xff0c;不少商场如今的客流量非常有限&#xff0c;甚至可以说是员工比客人多&#xff0c;这就导致撤店…

三相Vienna整流器电流畸变的抑制方法

该博客参考丁文龙的博士论文《低成本充电系统高性能多端口Vienna整流器关键控制策略研究》&#xff0c;他的博士论文深入浅出&#xff0c;分析透彻。感谢师妹Miss Young提供的技术指导&#xff0c;她是一位优秀的电力电子工程师&#xff0c;祝她事业顺利&#xff0c;身体健康。…

【教学类-06-06】20230905数字题目随便玩( 加减法、分合、比大小,纸张消耗)

背景需求&#xff1a; 3年前第一次设计加减法题目时&#xff0c;打印了一大堆加减法、数字分合、比大小的纸张。太多了&#xff0c;以至于三年后整理素材库&#xff0c;发现还有很多这样的纸片。这些20以内、50以内的题目难度大、题量多&#xff0c;完全不适合幼儿园孩子做&am…

Linux基础命令汇总

用户管理 su 切换用户&#xff1a;su 用户名 logname 显示当前用户的登录用户名&#xff1a;logname useradd 创建用户&#xff1a;useradd 用户名创建用户时指定用户的主组&#xff1a;useradd -g 组名 用户名 usermod 添加附属组&#xff1a;usermod -G 组…

基于 Python+DenseNet121 算法模型实现一个图像分类识别系统

项目展示 一、介绍 DenseNet&#xff08;Densely Connected Convolutional Networks&#xff09;是一种卷积神经网络&#xff08;CNN&#xff09;架构&#xff0c;2017年由Gao Huang等人提出。该网络的核心思想是密集连接&#xff0c;即每一层都接收其前面所有层的输出作为输…

CISSP学习笔记:安全脆弱性、威胁和对策

第九章 安全脆弱性、威胁和对策 9.1 评估和缓解安全脆弱性 9.1 硬件 处理器执行类型 多任务处理&#xff1a; 同时处理两个或更多任务多处理&#xff1a; 利用多个处理器完成一个应用程序的处理能力多程序设计&#xff1a;通过操作系统对单个处理器上的两个任务进行协调&…

AHH HackerHouse @Move大理站完美谢幕

Antalpha HackerHouse Move 大理站于2023年9月23日在面包树举办了Final DemoDay&#xff0c;这也代表着为期21天的 HackerHouse 活动完美谢幕。 自从9月3日开始&#xff0c;整整21天的共居时间里&#xff0c;我们从个体逐渐融汇成小团队&#xff0c;最终成为了一个紧密团结的大…

新手教程,蛋糕小程序的搭建流程一网打尽

作为一名新手&#xff0c;想要搭建一个蛋糕小程序可能会觉得有些困惑。但是&#xff0c;不用担心&#xff01;今天我将为大家详细介绍蛋糕小程序的搭建流程&#xff0c;并带大家一步步完成。 首先&#xff0c;我们需要登录乔拓云网的后台。在登录成功后&#xff0c;点击进入商城…

OCI 发布了容器运行时和镜像规范!

7 月 19 日是开放容器计划Open Container Initiative&#xff08;OCI&#xff09;的一个重要里程碑&#xff0c;OCI 发布了容器运行时和镜像规范的 1.0 版本&#xff0c;而 Docker 在这过去两年中一直充当着推动和引领的核心角色。 我们的目标是为社区、客户以及更广泛的容器行…

医疗小程序开发:技术门槛高?

随着移动互联网的普及&#xff0c;医疗行业也逐渐转向线上。医疗小程序开发成为了很多企业和医疗机构关注的焦点。但是&#xff0c;对于一些技术小白来说&#xff0c;可能会觉得医疗小程序开发技术门槛高&#xff0c;无从下手。实际上&#xff0c;使用乔拓云平台进入后台&#…

《Python趣味工具》——ppt的操作(刷题版)

前面我们对PPT进行了一定的操作&#xff0c;并将其中的文字提取到了word文档中。现在就让我们来刷几道题巩固巩固吧&#xff01; 文章目录 1. 查看PPT&#xff08;上&#xff09;2. 查看PPT&#xff08;中&#xff09;3. 查看PPT&#xff08;下&#xff09;4. PPT的页码5. 大学…

KUKA机器人通过3点法设置工作台基坐标系的具体方法

KUKA机器人通过3点法设置工作台基坐标系的具体方法 具体方法和步骤可参考以下内容: 进入主菜单界面,依次选择“投入运行”—“测量”—基坐标,选择“3点法”, 在系统弹出的基坐标编辑界面,给基座标编号为3,命名为table1,然后单击“继续”按钮,进行下一步操作, 在弹出的…

【论文极速读】Prompt Tuning——一种高效的LLM模型下游任务适配方式

【论文极速读】Prompt Tuning——一种高效的LLM模型下游任务适配方式 FesianXu 20230928 at Baidu Search Team 前言 Prompt Tuning是一种PEFT方法&#xff08;Parameter-Efficient FineTune&#xff09;&#xff0c;旨在以高效的方式对LLM模型进行下游任务适配&#xff0c;本…

车联网时代,能链车联凭什么成为“关键先生”?

又到国庆长假&#xff0c;许多人开启远途旅行&#xff0c;高速路上一如既往的拥堵。在密密麻麻的汽车中&#xff0c;新能源汽车变得越来越多。 事实上&#xff0c;新能源汽车的热潮&#xff0c;已经成为不可抵挡的趋势。据中国乘联会的最新数据&#xff0c;今年中国新能源乘用…

USB TypeC接口说明

USB TypeC 拥有诸多优点:双面可插不担心正反、可做USB/雷电高速传输载体,支持 PD快充、音频设备、HDMI传输、调试模式等诸多功能。 市面上的其他USB接口和充电接口在逐步被TypeC替代,可以预见的是,TypeC作为一种多兼容性接口,其未来会具有非常长的生命周期。 本文主要介…

Eclipse环境基于HDFS的API进行开发

文章目录 IOUtils方式读取文件1.文件准备2.下载安装Eclipse3.打开eclipse&#xff0c;新建java项目&#xff0c;添加关于hadoop的一些包4.包内新建类进行开发5.利用打包的方式生成java jar包6.验证代码正确性 其它问题&#xff1a;Exception in thread “main“ java.lang.Unsu…

TouchGFX界面开发 | 添加触摸屏驱动

使用STM32CubeMX移植TouchGFX 一文中介绍了如何用TouchGFX点亮屏幕&#xff0c;但是此时屏幕还没有触摸的功能。下面将介绍如何添加触摸屏驱动到TouchGFX中 一、STM32CubeMX配置 在使用STM32CubeMX移植TouchGFX 文中的STM32CubeMX配置基础上&#xff0c;再激活一个定时器&…

Pikachu靶场——XXE 漏洞

文章目录 1. XXE1.1 查看系统文件内容1.2 查看PHP源代码1.3 查看开放端口1.4 探测内网主机 1. XXE 漏洞描述 XXE&#xff08;XML External Entity&#xff09;攻击是一种利用XML解析器漏洞的攻击。在这种攻击中&#xff0c;攻击者通过在XML文件中插入恶意实体来触发解析器加载…

自然语言处理(NLP)学习之与HanLP的初相识

目录 前言 一、自然语言处理基本知识 1、NLP类别 2、核心任务 二、Hanlp简要介绍 三、Hanlp云服务能力 1、全新云原生2.x 2、Python api调用 3、Go api调用 4、Java api调用 四、Hanlp native服务 1、本地开发 总结 前言 在ChatGPT的滚滚浪潮下&#xff0c;也伴随着人工智…

深入理解JavaScript中的事件冒泡与事件捕获

在JavaScript中&#xff0c;事件是交互式网页开发中的关键概念之一。了解事件冒泡和事件捕获是成为一名优秀的前端开发者所必需的技能之一。本文将深入探讨这两个概念&#xff0c;解释它们是如何工作的&#xff0c;以及如何在实际应用中使用它们来处理事件。 一.什么是事件冒泡…