MySQL(二)索引原理以及优化

news2025/1/9 2:06:43

MySQL系列文章

MySQL(一)基本架构、SQL语句操作、试图
MySQL(二)索引原理以及优化
MySQL(三)SQL优化、Buffer pool、Change buffer
MySQL(四)事务原理及分析
MySQL(五)缓存策略
MySQL(六)主从复制
数据库三范式


文章目录

  • MySQL系列文章
  • 前言
  • 一、索引
    • 主键索引
    • 唯一索引
    • 普通索引
    • 组合索引
    • 全文索引
  • 二、主键选择
  • 约束
    • 约束与索引的区别
  • 索引存储
  • 自增id
  • 最左匹配原则
  • 覆盖索引
  • 索引下推
  • 索引失效
  • 索引原则
  • 后记


前言

MySQL数据库是用来保存海量数据的,但是海量数据涉及到一个快速查找问题,怎么从海量数据查找到我想要的数据呢?
常见的办法就是将表中每一列类比成索引来定位我是这一列哪一个单元。那我定位表中这一列的某一个数据,就通过索引去查找就好了。
但肯定不能一个一个去遍历,这里就涉及到MySQL 数据库的数据结构组成。用一些数据结构可以加快查找效率。

而MySQL常用的innodb存储引擎采用的是B+树作为索引的数据结构。

为什么选B+树?
简单说一下有哪些便于查找的数据结构和不足:

  • 有序数组+二分法:数组不便于增删节点,增删节点需变化节点之后的数据。
  • 二分查找树:解决了增删节点的问题,但是可能会退化成链表。
  • 平衡二叉树:解决了退化链表的问题,但是数据多了,树的高度会很高(二叉树的每多一层就需要多一次IO磁盘操作)。且插入删除数据自旋节点的次数会比较多。
  • 红黑树:不是完全平衡,但可以减少增删节点的自旋次数。同样有树的高度会很高的问题。
  • B树:解决了树高度问题,但是每个节点包含了索引和数据,IO操作会占用内存资源。并且范围查找效率也不是很高。

最后来到了B+树:解决了范围查找,IO磁盘次数这些问题。

详细内容参考https://www.xiaolincoding.com/mysql/index/why_index_chose_bpuls_tree.html


一、索引

索引存储结构分类:聚集索引和非聚集索引
刚刚提到MySQL 用的B+树存储索引。聚集索引和非聚集索引都是用各自的B+树存储的。

区别在于:

  • 聚集索引的叶子节点存放的是实际数据,所有完整的用户记录都存放在聚集索引的叶子节点。
  • 非聚集索引的叶子节点存放的是主键值(就是聚集索引值),而不是实际数据。

例子:S0001是辅助索引,生成的B+树的叶子节点存的是主键的值,通过辅助索引查数据时需要先找到主键,再在主键的表中找到相应的数据。
在这里插入图片描述

详细内容参考:https://juejin.cn/post/7001094401858469918


索引除了结构分类,还可以通过使用特性分类:主键索引、唯一索引、普通索引、组合索引、以及全文索引(elasticsearch);

主键索引

非空唯一索引,一个表只有一个主键索引;在 innodb 中,主键索引的 B+ 树包含表数据信息;

PRIMARY KEY(key)

唯一索引

不可以出现相同的值,可以有 NULL 值;

UNIQUE(key)

普通索引

允许出现相同的索引内容;

INDEX(key)
-- OR
KEY(key[,...])

组合索引

对表上的多个列进行索引

INDEX idx(key1,key2[,...]);
UNIQUE(key1,key2[,...]);
PRIMARY KEY(key1,key2[,...]);

使用组合索引可以减少开销,因为分开的话,一个索引需要建立一个B+树,而组合索引只需要一颗B+树。

全文索引

将存储在数据库当中的整本书和整篇文章中的任意内容信息查找出来的技术;关键词 FULLTEXT;
在短字符串中用 LIKE % ;在全文索引中用 match 和against ;

FULLTEXT(KEY)
SELECT * FROM article WHERE MATCH(title,content)AGAIN('查询字符串');

————————————————
上述只有主键索引是聚集索引,其他索引都是辅助索引;例如唯一索引,普通索引等。

二、主键选择

innodb 中表是索引组织表,每张表有且仅有一个主键,可以设置,也可以让系统自动生成;

如果显示设置 PRIMARY KEY ,则该设置的 key 为该表的主键;
如果没有显示设置,则从非空唯一索引中选择;
只有一个非空唯一索引,则选择该索引为主键;
有多个非空唯一索引,则选择声明的第一个为主键;
没有非空唯一索引,则自动生成一个 6 字节的 _rowid 作为主键;

约束

为了实现数据的完整性,对于 innodb,提供了以下几种约束,primary key,unique key,foreign key,default,not null;

外键约束
外键用来关联两个表,来保证参照完整性;MyISAM 存储引擎本身并不支持外键,只起到注释作用;而 innodb 完整支持外键,并具备事务性;

create table parent (
id int not null,
primary key(id)
) engine=innodb;
create table child (
id int,
parent_id int,
foreign key(parent_id) references parent(id)
ON DELETE CASCADE ON UPDATE CASCADE
) engine=innodb;
-- 被引用的表为父表,引用的表称为子表;
-- 外键定义时,可以设置行为 ON DELETE 和 ON UPDATE,行
为发生时的操作可选择:
-- CASCADE 子表做同样的行为
-- SET NULL 更新子表相应字段为 NULL
-- NO ACTION 父类做相应行为报错
-- RESTRICT 同 NO ACTION
INSERT INTO parent VALUES (1);
INSERT INTO parent VALUES (2);
INSERT INTO child VALUES (10, 1);
INSERT INTO child VALUES (20, 2);
DELETE FROM parent WHERE id = 1;

约束与索引的区别

创建主键索引或者唯一索引的时候同时创建了相应的约束;
约束是逻辑上的概念;
索引是一个数据结构既包含逻辑的概念也包含物理的存储方式;

索引存储

innodb 由段、区、页组成;段分为数据段、索引段、回滚段等;区大小为 1 MB(一个区由 64 个连续页构成);页的默认值为 16k;页为逻辑页,磁盘物理页大小一般为 4K 或者 8K;为了保证区中的页的连续,存储引擎一般一次从磁盘中申请4~5 个页;
在这里插入图片描述

页是 innodb 磁盘管理的最小单位;默认16K,可通过innodb_page_size 参数来修改;

特点:
B+ 树的一个节点的大小就是该页的值;
主键B+树非叶子节点中的页数据存储的是索引,叶子节点存储的是索引和表的行数据。

自增id

超过类型最大值会报错;
big int 类型 的范围:(-263 ,263-1)
假设采用 big int 类型的话,1 秒插入 1 亿条数据,大概需要 5849 年才会用完索引;

最左匹配原则

对于组合索引,从左到右依次匹配,遇到 > < between like就停止匹配会采用遍历查询。索引组合索引时尽量避免使用范围查询。

覆盖索引

从非聚集索引中就能找到数据,而不需通过聚集索引查找;利用非聚集索引树高度一般低于聚集索引树;较少磁盘 IO;所以用select时,尽量避免使用 select * from …。应该将所需要的列都标明。

索引下推

为了减少回表次数,提升查询效率;在 MySQL 5.6 的版本开始推出;
MySQL 架构分为 server 层和存储引擎层;
没有索引下推机制之前,server 层向存储引擎层请求数据,在server 层根据索引条件判断进行数据过滤;
有索引下推机制之后,将部分索引条件判断下推到存储引擎中过滤数据;最终由存储引擎将数据汇总返回给 server 层;

索引失效

  • select … where A and B 若 A 和 B 中有一个不包含索引,则索引失效;
  • 索引字段参与运算,则索引失效;例如:select * from student where id-1 = 1;
  • 索引字段发生隐式转换,则索引失效;例如:将列隐式转换为某个类型,实际等价于在索引列上作用了隐式转换函数;例如查询字符串时没用引号括起来,导致转换成int类型。
  • LIKE 模糊查询,通配符 % 开头,则索引失效;例如: select * from user where name like ‘%Mark’;
  • 组合索引中,没使用第一列索引,索引失效;
  • 查询条件中有or;例如SELECT * FROM student where id =1 or birthday = “2021-12-23”;

索引失效就会使用全表查询,也就是遍历查询,非常耗时。

索引原则

  • 查询频次较高且数据量大的表建立索引;索引选择使用频次较高,过滤效果好的列或者组合;
  • 使用短索引;节点包含的信息多,较少磁盘 IO 操作;比如:smallint , tinyint ;
  • 对于很长的动态字符串,考虑使用前缀索引;
  • 对于组合索引,考虑最左侧匹配原则和覆盖索引;
  • 尽量选择区分度高的列作为索引;该列的值相同的越少越好;
  • 尽量扩展索引,在现有索引的基础上,添加复合索引;最多6个索引。
  • 不要 select * ; 尽量只列出需要的列字段;方便使用覆盖索引;
  • 索引列,列尽量设置为非空;
  • 可选:开启自适应 hash 索引或者调整 change buffer;

后记

索引大大提高了查询速度,同时却会降低更新表的速度,比如对表进行INSERT,UPDATE和DELETE。因为更新表时,Mysql不仅要保存数据,还要保存一下索引文件,建立索引会占用磁盘空间的索引文件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/757167.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

滚珠螺杆的使用优势

滚珠螺杆主要是由螺杆、螺帽、钢珠、固定座、刮刷器以及回流管所构成的&#xff0c;根据循环系统的不同&#xff0c;还可以分为外循环式、内循环式、端塞循环式的滚珠螺杆。 滚珠螺杆发展至今&#xff0c;已经广泛应用到各产业机械的定位精度控制上&#xff0c;像精密工具机、产…

Karmada: Open, Multi-Cloud, Multi-Cluster Kubernetes Orchestration

Karmada是一个开源的多云应用编排和管理平台&#xff0c;旨在帮助用户在多个云提供商之间无缝地部署、编排和管理应用程序。 Karmada&#xff08;Kubernetes Armada&#xff09;是一个Kubernetes管理系统&#xff0c;它使您能够在多个Kubernetes集群和云环境中运行云原生应用程…

JavaFX 用户界面控件1——ChoiceBox ComboBox

1.选择框ChoiceBox JavaFX的ChoiceBox是一个用户界面控件&#xff0c;用于向用户显示一个选项列表&#xff0c;并允许用户从中选择一个或多个选项。下面是一个ChoiceBox的简单示例和使用介绍&#xff1a; 首先&#xff0c;导入JavaFX的相关类&#xff1a; import javafx.appl…

『表面』在平面模型上提取凸(凹)多边形

原始点云 直通滤波,z轴0~1.1 分割模型为平面&#xff0c;分割结果进行投影 提取多边形 代码: #include <pcl/ModelCoefficients.h> // 模型系数的数据结构&#xff0c;如平面、圆的系数 #include <pcl/io/pcd_io.h>#include <pcl/point_types.h> // 点云数据…

[SSM]Spring6基础

目录 一、Spring启示录 1.1OCP开闭原则 1.2DIP依赖倒置原则 1.3IoC控制反转 1.4DI依赖注入 二、Spring概述 2.1Spring简介 2.2Spring八大模块 2.3Spring特点 三、Spring的入门程序 3.1Spring的文件 3.2第一个Spring程序 3.3第一个Spring程序详细剖析 3.4Spring6启…

【LGR-145-Div.4】洛谷入门赛 #14(ABCDEI题解)

离开CSDN近五分之一坤年后&#xff0c;我又回归了&#xff0c;这段时间没刷题&#xff08;忙中考去了&#xff09;&#xff0c;于是乎参加了【LGR-145-Div.4】洛谷入门赛 #14&#xff0c;那才叫。。。&#xff08;这就是为什么没有FGH题解的原因&#xff09; T1 T352128 数字判…

【JavaEE】HTTPS及其安全机制

目录 1、什么是HTTPS 2、HTTPS的基本工作过程 2.1、使用对称密钥进行加密 2.2、使用非对称密钥进行加密 2.3、中间人攻击 2.4、证书 1、什么是HTTPS HTTPS是在HTTP协议的基础上引入了一个加密层&#xff08;SSL&#xff09;。HTTP协议内容都是按照文本的方式传输的&#x…

ChatGPT引领你掌握网站创建的秘诀!从0开始,轻松打造自己的个性化网站!

1 使用 HTML 生成一个完整的创业公司网站的落地页 prompt&#xff1a;Create a complete landing page for a start up company using HTML 生成整个网页的基础框架&#xff1a; 切换到WebStorm&#xff0c;将代码粘贴到新建的 HTML 文件。 接着右击浏览器打开 html 文件&am…

测试各个版本的飞鸽传书

测试各个版本的飞鸽传书 测试材料有windows系统的飞鸽传书有4个&#xff0c;linux系统的信使iptux&#xff08;类似飞鸽传书&#xff09;有2个&#xff0c;android系统的飞鸽传书有5个&#xff0c;都是以前下载保存在移动硬盘中&#xff0c;如今都找出来归类一起测试&#xff0…

124、仿真-基于51单片机智能电表系统设计(Proteus仿真+程序+原理图+配套资料等)

方案选择 单片机的选择 方案一&#xff1a;STM32系列单片机控制&#xff0c;该型号单片机为LQFP44封装&#xff0c;内部资源足够用于本次设计。STM32F103系列芯片最高工作频率可达72MHZ&#xff0c;在存储器的01等等待周期仿真时可达到1.25Mip/MHZ(Dhrystone2.1)。内部128k字节…

奇奇怪怪的知识点-EXCEL(1)

如何用Excel提取想要的数据 参考链接&#xff1a;Excel表格中如何在一串数字中提取几位数字 在日常工作中经常会用到EXCEL表格来进行数据的提取和处理&#xff0c;有时候很长一串数据我们只需要提取指定位数后面的数字&#xff0c;EXCEL中内置了很多丰富的函数可以帮助我们高…

图文讲解“延时双删”原因及必要性

目录 一、前言 二、常见更新策略 2.1 先删缓存&#xff0c;再更新数据库 2.2 先更新数据库&#xff0c;再删除缓存 2.3 普通双删 2.4 延迟双删 三、是否必要建议 一、前言 我们在实际项目中经常会使用到Redis缓存用来缓解数据库压力&#xff0c;但是当更新数据库时&…

NVIDIA Video Codec SDK简介

NVIDIA的Video Codec SDK提供API对视频进行加速编解码。最新发布版本为12.0&#xff0c;支持Windows和Linux平台。可从 https://developer.nvidia.com/video-codec-sdk-archive 下载。用于视频解码(NVDEC)和编码(NVENC)的GPU硬件加速器引擎比实时视频处理速度更快&#xff0c;非…

vue做移动端上拉加载 删除当前列表某个数据 保持当前状态 继续获取下一页不影响正常的数据

本文中使用vant组件的list列表制作的 当然主要是看这个难题的思路 不必计较用的什么组件库 换做其他的组件库 思路还是一样的 //主要思路是把点击删除的数据让后端置为false // 比如我请求了3页&#xff0c;一页10条数据 // 一共30条&#xff0c;我一条一条删除&#xff0c;点…

SU-03T语音模块

一、官网 智能公元/AI产品零代码平台 在官网中可以添加设备进行配置&#xff0c;SDK的下载 二、烧录SDK 产品实物&#xff1a; 第一步&#xff1a;接线 烧录SDK时接线&#xff1a;4根杜邦线与USB转TTL连接 B6接TX&#xff0c;B7接RX&#xff0c;GND接GND&#xff0c;VCC接…

创建一门简单的解释性编程语言并实现它的解释器

背景 最近刷到大佬的教程&#xff0c;跟着学一下 效果 开始时 输入姓名和年龄后 代码 自创编程语言SimpleScript: 自创一门简易脚本支持中文编程 (gitee.com) 解析 1.词法分析 将程序的每个字符串精准划分出来&#xff0c;形成多个单词Token 2.语法分析 将各段Token再…

Docker命令详解

一、帮助启动命令 启动docker : systemctl start docker 停止docker&#xff1a;systemctl stop docker 重启docker&#xff1a;systemctl restart docker 查看docker状态&#xff1a;systemctl status docker 开机启动&#xff1a;systemctl enable docker 查看docker概…

电动汽车路由问题的基准测试

摘要 有几家物流公司开始在日常运营中利用电动汽车&#xff08;EVs&#xff09;来减少温室气体污染。然而&#xff0c;电动汽车有限的驾驶范围可能需要在运行期间访问充电站。这些潜在的访问必须得到解决&#xff0c;避免不必要的长时间绕行。我们制定了电容式车辆路由问题&…

【Vue3】setup参数细讲!computed计算属性和watch监听属性

setup参数细讲&#xff01;computed计算属性和watch监听属性 setup细讲!setup参数&#xff0c;steup&#xff08;props&#xff0c;context&#xff09;参数1.props&#xff0c;负责接收父组件传过来的值参数2.contextcontext.attrscontext.emitcontext.slots&#xff0c; 插槽…

MySQL(六)主从复制

MySQL系列文章 MySQL&#xff08;一&#xff09;基本架构、SQL语句操作、试图 MySQL&#xff08;二&#xff09;索引原理以及优化 MySQL&#xff08;三&#xff09;SQL优化、Buffer pool、Change buffer MySQL&#xff08;四&#xff09;事务原理及分析 MySQL&#xff08;五&a…