MySQL8.0优化 - 索引的数据结构、B+树、常见索引概念、索引的代价

news2024/12/25 9:17:13

文章目录

  • 学习资料
  • 索引的数据结构
    • B+树
    • 常见索引概念
      • 聚簇索引
        • 特点
        • 优点
        • 缺点
        • 限制
      • 二级索引(辅助索引、非聚簇索引)
        • 回表
        • 联合索引
    • Innodb的B+树索引注意事项
      • 1、根页面位置万年不动
      • 2、内节点中目录项记录的唯一性
      • 3、一个页面最少存储2条记录
    • 索引的代价


学习资料

【MySQL数据库教程天花板,mysql安装到mysql高级,强!硬!-哔哩哔哩】
【阿里巴巴Java开发手册】https://www.w3cschool.cn/alibaba_java

索引的数据结构

B+树

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
这个数据结构,它的名称是B+树

默认数据页大小为16kb

在这里插入图片描述

常见索引概念

索引按照物理实现方式,索引可以分为2中:聚簇(聚集)和非聚簇(非聚集)索引。我们也把聚簇索引称为二级索引和辅助索引。

聚簇索引

聚簇索引并不是一种单独的索引类型,而是一种数据存储方式(所有的用户记录都存储在了叶子节点),也就是所谓的索引及数据,数据及索引

术语“聚簇”表示数据和相邻的键值聚簇的存储在一起。

特点

1、使用记录主键值的大小进行记录和页的排序,这包括三个方面的含义:
页内的记录是按照主键的大小顺序排成一个单向链表
各个存放用户记录的页也是根据页中用户记录的主键大小顺序排成一个双向链表
存放目录项记录的页分为不同的层次,在同一层次中的页也是根据页中目录项记录的主键大小顺序排成一个双向链表

2、B+树的叶子节点存储的是完整的用户记录。
所谓完整的用户记录,就是指这个记录中存储了所有列的值(包括隐藏列)。
我们把具有这两种特性的B+树称为聚簇索引,所有完整的用户记录都存放在这个聚簇索引的叶子节点处。这种聚簇索引并不需要我们在MySQL语句中显式的使用INDEX语句去创建,InnoDB存储引擎会自动为我们创建聚簇索引。

优点

数据访问更快,因为聚簇索引将索引和数据保存在同一个B+树种,因此聚簇索引中获取数据比非聚簇索引更快。
聚簇索引对于主键的排序查找范围查找速度非常快。
按照聚簇索引排列的顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多个数据块中提取数据,所以节省了大量的io操作

缺点

插入速度严重依赖插入顺序,按照主键的顺序插入是最快的方式,否则将会出现页分裂,严重影响性能。因此,对于InnoDB表,我们一般都会定义为一个自增的ID列为主键
更新主键的代价很高,因为将会导致被动更新的行移动。因此,对于InnoDB表,我们一般定义主键为不可更新。
二级索引访问需要两次索引查找,第一次找到主键值,第二次根据主键值找到行数据。

限制

对于MySQL数据库目前只有InnoDB数据引擎支持聚簇索引,而MyISAM并不支持聚簇索引。
由于物理存储排序方式只能有一种,所以每个MySQL的表只能有一个聚簇索引。一般情况下就是该表的主键。
如果没有定义主键,Innodb会选择非空的唯一索引代替,如果没有这样的索引,Innodb会隐式的定义一个主键来作为聚簇索引。
为了充分利用聚簇索引和聚簇的特性,所以Innodb表的主键尽量选用有序的顺序id,而不建议无序的id,比如UUID、MD5、HASH、字符串列作为主键无法保证数据的顺序增长。

二级索引(辅助索引、非聚簇索引)

在这里插入图片描述

回表

在这里插入图片描述
在这里插入图片描述

聚簇索引与非聚簇索引原理不同,在使用上也有一些区别:
1、聚簇索引的叶子结点存储的就是我们的数据记录,非聚簇索引的叶子节点上存储的是数据位置。非聚簇索引不会影响数据表的物理存储顺序。
2、一个表只能有一个聚簇索引,因为只能有一种排序存储方式,但可以有多个非聚簇索引,也就是多个索引目录提供数据检索。
3、使用聚簇索引的时候,数据的查询效率高,但如果对数据进行插入、删除、更新的操作,效率会比非聚簇索引低。

联合索引

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Innodb的B+树索引注意事项

1、根页面位置万年不动

在这里插入图片描述

2、内节点中目录项记录的唯一性

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3、一个页面最少存储2条记录

在这里插入图片描述

MySQL会自动给每个页里加两条记录,由于这两条记录不是我们自己插入的,所以有时候也称伪记录虚拟记录。这两个伪记录一个代表最小记录,一个代表最大记录

索引的代价

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/14376.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机毕业设计ssm+vue基本微信小程序的小学生兴趣延时班预约小程序

项目介绍 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱小学生兴趣延时班预约小程序的设计与开发被用户普遍使用,为方便用户能够可以随时进行小学生兴趣延时班预约小程序的…

mMED影响组蛋白甲基化和表观遗传

2019 年 8 月 8 日,来自美国 NIH 的 Rafael Casellas 与科罗拉多大学 Francisco J. Asturias 在 Cell 杂志上发表文章 《A Pliable Mediator Acts as a Functional Rather Than an ArchitecturalBridge between Promoters and Enhancers》,综合运用 CRIS…

Landsat Collection 2 数据集详细介绍(T1/T2产品差异)

Landsat Collection 2 是对 Landsat 档案的第二次主要再处理工作,它带来了多项数据产品改进,这些改进应用了数据处理、算法开发以及数据访问和分发功能方面的进步。 Landsat Collection 2 包含来自 Landsat 1-9 的 Level-1 数据和来自 Landsat 4-9 的科…

Spring IOC源码:invokeBeanFactoryPostProcessors 后置处理器详解

前言 前面篇幅介绍了Bean配置的解析过程,包括注解、xml配置文件的解析。下面进入refresh方法中另一个重要的节点,即BeanFactoryPostProcessor的注册及其执行过程。 正文 进入refresh,前面篇幅已经介绍了obtainFreshBeanFactory()&#xff…

说出你常用的20个linux命令,你还是只会说ls、cat那20个命令吗?3分钟让你发现新大陆

服务器排障常用命令 🍊 博客主页:作者主页 🍊 简介:云计算领域优质创作者🏆、在校期间参与众多计算机ICT相关的省赛、国赛,斩获系列荣誉。考取华为资深工程师、红帽工程师、阿里云ACP云计算工程等系列认证。…

java图书推荐协同过滤算法网站

目 录 摘 要 2 Abstract 3 1绪论 6 1.1背景和意义 6 1.2国内外发展现状 6 2系统技术分析 7 2.1技术选型 7 2.2 MVC模式 7 3功能分析 8 3.1系统角色 8 3.2系统用例图 8 3.3系统功能 8 3.3.1网站前台功能 8 3.3.2网站后台功能 13 4系…

使用Android辅助功能AccessibilityService实现微信自动聊天【外挂插件】

本文是使用Android辅助功能AccessibilityService实现微信自动聊天demo; 只是为了跟深入的了解Android辅助功能, 提高自身的动手能力。 请勿用于商用,或非法用途。 动手前,基本的准备要求: 聊天机器人app demo,去操作…

供应PEG试剂Azide-PEG-Acrylamide,N3-PEG-ACA,叠氮-聚乙二醇-丙烯酰胺

1、名称 英文:Azide-PEG-Acrylamide,N3-PEG-ACA 中文:叠氮-聚乙二醇-丙烯酰胺 2、CAS编号:N/A 3、所属分类: Acrylate/Acrylamide PEG Azide PEG 4、分子量:可定制,5k、2k、10k、20k、3.4k…

DarkNet网络结构

一、darknet53网络结构图 文字版:卷积(下采样卷积1残差块)(下采样卷积2残差块)(下采样卷积8残差块)(下采样卷积8残差块)(下采样卷积4*残差块) 不难看出,darknet53就是重复堆叠下采样卷积n*残差块(n为残差块的个数)这个结构而组成的。而更基本的结构就是…

数据库视图的基本操作(sql语句)

表视图的增删改查(sql语句) 概念:视图是一张虚拟表,它是从数据库的一张或多张表中导出的表,其内容由查询语句定义。 作用: 简单性、安全性、逻辑数据独立性;如果应用建立在视图上&#xff0c…

Node.js学习19~37(模块化)

1 模块化的基本概念 1.1 什么是模块化 模块化是指解决一个复杂问题时,自顶向下逐层把系统划分成若干模块的过程。对于整个系统来说,模块是可组合、分解和更换的单元。 编程领域中的模块化 编程领域中的模块化,就是遵守固定的规则&#xf…

【Pytorch with fastai】第 15 章 :深入探讨应用程序架构

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

Docker概念基本介绍以及安装

目录 一、Docker概述 1.1Docker是什么 1.2Docker和虚拟机的区别 1.3使用场景 1.4 Docker 三要素(核心组件) 1.5六大名称空间 1.6 Docker引擎 1.7资源控制——cgroups 1.8容器特性 1.9 容器小的架构体系 二、Docker和虚拟化的区别 三、dock…

MATLAB循环类型

MATLAB 提供以下类型的循环处理循环的要求。点击链接,查看个循环类型的细节: 循环类型描述while 循环一个给定的条件为真时重复语句或语句组。测试条件才执行循环体。for 循环执行的语句序列多次缩写管理循环变量的代码。nested 循环可以使用一个或多个…

2022年深度学习最新研究成果

一、开源深度学习编译器 二、 开源深度学习加速器 三、AITemplate引擎 四、微型机器学习框架 参考文献:https://arxiv.org/pdf/1510.00149.pdf 五、Contrastive Learning 对比学习综述 六、Diffusion Model 扩散模型综述 Diffusion Models: A Comprehensive Surv…

【Python百日进阶-WEB开发】Day180 - Django案例:12用户登录

文章目录十、异步发送短信验证码 - 异步方案Celery10.1 生产者消费者设计模式10.2 Celery介绍10.3 Celery介绍和使用10.3.1十一、用户账号 登录11.1 用户登录11.1.1 用户登录逻辑分析11.1.2 用户登录接口设计和定义11.1.3 用户登录后端逻辑11.2 多账号登录11.2.1 自定义用户认证…

实战三:基于LGB实现车联网大数据碰撞识别 代码+数据(非常详细可作为毕设)

项目介绍: 使用的数据为采集车辆信号。车辆信息非常多,而且用户路况信息和使用偏好千人千面,很难找到一种准确识别碰撞的方法,希望参赛者通过车联网大数据识别车辆碰撞和碰撞时间。车辆标签信息如下: 车号LabelCollec…

SpringBoot SpringBoot 开发实用篇 4 数据层解决方案 4.5 SpringBoot 整合 Redis

SpringBoot 【黑马程序员SpringBoot2全套视频教程,springboot零基础到项目实战(spring boot2完整版)】 SpringBoot 开发实用篇 文章目录SpringBootSpringBoot 开发实用篇4 数据层解决方案4.5 SpringBoot 整合 Redis4.5.1 环境准备4.5.2 使用…

多系统-单点登录测试

单点登录 文章目录单点登录单点登录 单点登录全程Single Sign On(SSO),在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统,包括单点登录和单点注销两部分,是目前比较流行的企业业务整合的解决方案…

SpringBoot SpringBoot 开发实用篇 4 数据层解决方案 4.1 内置数据源

SpringBoot 【黑马程序员SpringBoot2全套视频教程,springboot零基础到项目实战(spring boot2完整版)】 SpringBoot 开发实用篇 文章目录SpringBootSpringBoot 开发实用篇4 数据层解决方案4.1 内置数据源4.1.1 现有数据层解决方案4.1.2 小结…