Mysql进阶-索引篇(上)

news2024/12/26 10:35:08

目录

索引概述

 索引结构

数据结构

二叉树

 红黑树

 B-Tree

 B+Tree

 Hash

 索引分类

聚集索引&二级索引

聚集索引选取规则:

 具体结构

索引基础语法

 SQL性能分析

SQL执行频率

慢查询日志 

profile详情

explain



索引概述

介绍:

索引( index )是帮助 MySQL 高效获取数据的数据结构 ( 有序 ) 。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据, 这样就可以在这些数据结构上 实现高级查找算法 ,这种数据结构就是索引。可以简单理解为我们先排好特定的顺序再查找,查找速度会大大提高
演示:
表结构及其数据

 假如我们要执行的SQL语句为 : select * from user where age = 45;

  • 无索引情况

相当于全表扫描,从第一行扫描到末尾,遇到满足条件的数据,仍会继续遍历下去,进而扫描全表,这相当于数组的遍历,时间复杂度很高,性能很差

  • 有索引情况
如果我们针对于这张表建立了索引, 假设索引结构就是二叉树 ,那么也就意味着,会对 age 这个字段建立一个二叉树的索引结构。即左子树的age值<根节点<右子树, 可将数据范围划分为两个范围 ,变成类似二分查找的查找算法, 极大提高搜索效率,而不用全局遍历。 下图只需要比较三次就可以得到45

 特点:

  • 优势
提高 数据检索的效率 ,降低数据库的IO 成本
通过索引列对数据进行排序,降低数据排序的成本, 降低CPU的消耗(不用频繁低性能的查询数据)
  • 劣势                                       

索引列也是要占用空间的

索引大大提高了查询效率,同时却也 降低更新表的速度 ,如对表进行INSERT UPDATE DELETE 时,效率降低,因为 更新表的同时也要更新索引

 索引结构

MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的索引结构, MySQL 所支持的所有的索引结构 主要包含以下几种:

不同的存储引擎对于索引结构的支持情况, 我们平常所说的索引,如果没有特别指明,都是指B+树结构组织的索引。

数据结构

二叉树

MySQL 的索引结构采用二叉树的数据结构,比较理想的结构如下:
但如果主键是顺序插入的,那 二叉树就会退化为单向链表,每次检索时都要遍历链表,检索效率大大降低

选择二叉树作为索引结构,会存在以下缺点:
顺序插入时,会形成一个链表,查询性能大大降低
大数据量情况下,层级较深,检索速度慢

 红黑树

由于二叉树会一直加深层级,我们可以想到红黑树作为自平衡的二叉树,能很好弥补这一缺点,那这样即使是顺序插入数据,最终形成的数据结构也是一颗平衡的二叉树,但由于红黑树也是一颗二叉树,也会出现层级较深的问题结构如下:

 B-Tree

B-Tree,B树是一种多叉路衡查找树,相对于二叉树,B树每个节点可以有多个分支,即多叉。 以一颗最大度数(max-degree)为5(5阶)的b-tree为例,那这个B树每个节点最多存储4个key,5 个指针,比二叉树多了三个key,可以多走三个分支,即五个范围。树的度数就是一个节点的子节点的个数

 

 进入b树的可视化演示网站,可以帮助我们理解b树的演变过程,这里选用的五阶b树B-Tree Visualization

 插入900时,由于每个节点只能存储四个key,此时会进行裂变,将插入900之后,五个元素进行排序之后,选取中间元素作为父节点,以中间元素为分界线,分割为两个节点

 

 特点:

  • 5阶的B树,每一个节点最多存储4个key,对应5个指针。
  • 一旦节点存储的key数量到达5,就会裂变,中间元素向上分裂。
  • 在B树中,非叶子节点和叶子节点都会存放数据。

 B+Tree

B+Tree是B-Tree的变种,我们以一颗最大度数(max-degree)为4(4阶)的b+tree为例,来看一 下其结构示意图

绿色框框起来的部分,是索引部分,仅仅起到索引数据的作用,不存储数据

红色框框起来的部分,是数据存储部分,在其叶子节点中要存储具体的数据

 插入元素达到裂变的同时,叶子节点之间会形成一个单向链表,注意是传统的b+树就是形成单向链表

 B+Tree 与 B-Tree相比,主要有以下三点区别:

所有的数据都会出现在叶子节点。

叶子节点形成一个单向链表。

非叶子节点仅仅起到索引数据作用,具体的数据都是在叶子节点存放的。

 MySQL索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上,增加一个指向相邻叶子节点的链表指针,即是双向链表,这就形成了带有顺序指针的B+Tree,提高区间访问的性能,利于排序。

 Hash

MySQL中除了支持B+Tree索引,还支持一种索引类型---Hash索引。

结构:

哈希索引就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在 hash表中,如果有哈希冲突,就会形成一个单向链表,挂在槽位之后,类似于hashtable

 哈希冲突的情况

 特点:

A. Hash索引只能用于对等比较(=,in),不支持范围查询(between,>,< ,...)

B. 无法利用索引完成排序操作

C. 查询效率高,通常(不存在hash冲突的情况)只需要一次检索就可以了,效率通常要高于B+tree索引

 索引分类

MySQL 数据库,将索引的具体类型主要分为以下几类:主键索引、唯一索引、常规索引、全文索引。
分类含义特点关键字
主键索引
针对于表中主键创建的索引
默认自动创建 , 只能
有一个 ,因为 主键只能有
一个
PRIMARY
唯一索引
避免同一个表中某数据列中的值重复
可以有多个
UNIQUE
常规索引
快速定位特定数据,(例如手机验证码登录时,用手机号查询用户,这一场景下就可以定义手机号为常规索引)
可以有多个
全文索引
全文索引查找的是文本中的关键词,而不是比较索引中的值
可以有多个
FULLTEXT

聚集索引&二级索引

 在InnoDB存储引擎中,根据索引的存储形式,又可以分为以下两种:

分类含义特点
聚集索引 (ClusteredIndex)
将数据存储与索引放到了一块,索引结构的叶子节点保存了行数据
必须有 , 而且只
有一个
二级索引 (Secondary Index)
将数据与索引分开存储,索引结构的叶子节点 关联的是对应的主键, 而对应的主键索引就会指向真正的行数据
可以存在多个

聚集索引选取规则:

总之聚集索引是必须要有的,如果没有主键索引,就会采用唯一索引,如果二者都没有,就会随机生成

  • 如果存在主键,主键索引就是聚集索引
  • 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引
  • 如果表没有主键,或没有合适的唯一索引,则InnoDB自动生成一个rowid作为隐藏的聚集索引。

 具体结构

聚集索引的叶子节点下挂的是这一行的具体数据 , 相当于一级指针,直接指向数据本身
二级索引的叶子节点下挂的是该字段值对应的主键值,即指向了聚集索引, 相当于二级指针

当我们用name这个二级索引查询数据时,具体的执行流程为:

. 由于是根据 name 字段进行查询,所以先根据 name='Arm' name 字段的 二级索引中进行匹配查找 。但是在二级索引中只能查找到 Arm 对应的主键值 10
. 由于查询返回的数据是 所有的行数据 ,所以此时,还需要根据主键值 10,到聚集索引中查找10 对应的记录,最终找到10 对应的行 row
. 最终拿到这一行的数据,直接返回即可。

 这一流程也称为回表查询

先到二级索引中查找数据,找到主键值,然后再到聚集索引中根据主键值,获取
数据的方式,就称之为回表查询。

索引基础语法

创建索引

CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name ( index_col_name,... ) ;

 查看索引

SHOW INDEX FROM table_name ;

 删除索引

DROP INDEX index_name ON table_name ;

 创建一张表 tb_user,并且查询测试数据。

需求如下:

A.name字段为姓名字段,该字段的值可能会重复,为该字段创建索引

create index idx_user_name on tb_user(name)

 B.phone手机号字段的值,是非空,且唯一的,为该字段创建唯一索引。

create unique index idx_user_phone on tb_user(phone);

 C.为profession、age、status创建联合索引。

create index idx_user_pro_age_sta on tb_user(profession,age,status)

 D.为email建立合适的索引来提升查询效率。

create index idx_user_email on tb_user(email);

 查看建立的索引,索引的命名规范应为idx_表名_列名

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1148772.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于哈里斯鹰算法的无人机航迹规划-附代码

基于哈里斯鹰算法的无人机航迹规划 文章目录 基于哈里斯鹰算法的无人机航迹规划1.哈里斯鹰搜索算法2.无人机飞行环境建模3.无人机航迹规划建模4.实验结果4.1地图创建4.2 航迹规划 5.参考文献6.Matlab代码 摘要&#xff1a;本文主要介绍利用哈里斯鹰算法来优化无人机航迹规划。 …

IOC课程整理-18 Spring注解

1. Spring 注解驱动编程发展历程 2. Spring 核心注解场景分类 3. Spring 注解编程模型 https://github.com/spring-projects/spring-framework/wiki/Spring-Annotation-Programming-Model 4. Spring 元注解&#xff08;Meta-Annotations&#xff09; 元注解&#xff08;Meta-A…

PostGreSQL:JSON|JSONB数据类型

JSON JSON 指的是 JavaScript 对象表示法&#xff08;JavaScript Object Notation&#xff09;JSON 是轻量级的文本数据交换格式JSON 独立于语言&#xff1a;JSON 使用 Javascript语法来描述数据对象&#xff0c;但是 JSON 仍然独立于语言和平台。JSON 解析器和 JSON 库支持许…

什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(1)

先看卷积是啥&#xff0c;url: https://www.bilibili.com/video/BV1JX4y1K7Dr/?spm_id_from333.337.search-card.all.click&vd_source7a1a0bc74158c6993c7355c5490fc600 下面这个式子就是卷积 看完了&#xff0c;感觉似懂非懂 下一个参考视频&#xff1a;https://www.y…

linux PELT算法中的load计算

滑窗平均的累加计算 权重y按滑窗距离衰减&#xff0c;y^32 0.5&#xff0c;也就是经历32个周期将衰减一半的权重&#xff0c;假设本周期值是&#xff36;&#xff0c;本周期的加权累加值为&#xff36;x&#xff0c;则&#xff1a; 一个完整周期是T&#xff0c;给一个基础值1…

【技能树笔记】网络篇——练习题解析(十)

【技能树笔记】网络篇系列前九篇 【技能树笔记】网络篇——练习题解析&#xff08;一&#xff09;-CSDN博客 【技能树笔记】网络篇——练习题解析&#xff08;二&#xff09;-CSDN博客 【技能树笔记】网络篇——练习题解析&#xff08;三&#xff09;-CSDN博客 【技能树笔记】网…

大数据Flink(一百零五):SQL性能调优

文章目录 SQL性能调优 一、 ​​​​​​​MiniBatch 聚合

2023 年值得关注的国外网络安全初创公司

网络安全初创公司试图解决的问题往往有点超前于主流。他们可以比大多数老牌公司更快地填补空白或新兴需求。初创公司通常可以更快地创新&#xff0c;因为它们不受安装基础的限制。 当然&#xff0c;缺点是初创公司往往缺乏资源和成熟度。公司致力于初创公司的产品或平台是有风…

JavaWeb 怎么在servlet向页面输出Html元素?

service()方法里面的方法体&#xff1a; resp.setContentType("text/html;charsetutf-8");//获得输出流PrintWriter对象PrintWriter outresp.getWriter();out.println("<html>");out.println("<head><title>a servlet</title>…

SDL事件处理以及线程使用(2)

事件使用 #include <stdio.h> #include <SDL.h>#define FF_QUIT_EVENT (SDL_USEREVENT 1) // 定义自定义事件#undef main int main() {SDL_Window* pWindow NULL;SDL_Init(SDL_INIT_VIDEO);// 创建窗口pWindow SDL_CreateWindow("Event Test Title&…

DAY38 动态规划 + 509. 斐波那契数 + 70. 爬楼梯 + 746. 使用最小花费爬楼梯

动态规划理论 动态规划&#xff0c;Dynamic Programming&#xff0c; DP&#xff0c; 如果某一问题有很多重叠子问题&#xff0c;使用动态规划是最有效的。 所以动态规划中每一个状态一定是由上一个状态推导出来的&#xff0c;这一点就区分于贪心&#xff0c;贪心没有状态推导…

OpenTiny Vue 支持 Vue2.7 啦!

你好&#xff0c;我是 Kagol。 前言 上个月发布了一篇 Vue2 升级 Vue3 的文章。 &#x1f596;少年&#xff0c;该升级 Vue3 了&#xff01; 里面提到使用了 ElementUI 的 Vue2 项目&#xff0c;可以通过 TinyVue 和 gogocode 快速升级到 Vue3 项目。 有朋友评论替换butto…

校园物业报修小程序开发笔记一

背景 校园规模和复杂性&#xff1a; 大型学校和校园通常拥有众多的建筑物、设施和设备&#xff0c;需要有效的维护和报修系统&#xff0c;以满足学生、教职员工和校园管理人员的需求。 学生和员工需求&#xff1a; 学生和员工在校园内可能遇到各种维修问题&#xff0c;如故障的…

精品Python的大学教室资源预约管理系统

《[含文档PPT源码等]精品基于Python的大学教室资源管理系统的设计与实现》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、项目发布教程、包运行成功&#xff01; 软件开发环境及开发工具&#xff1a; 开发语言&#xff1a;python 使用框架&#xff1a;Django 前…

0028Java程序设计-智能农场监控报警系统设计与实现

文章目录 摘要目 录系统设计开发环境 摘要 我国是一个以农业为主的国家&#xff0c;在当今社会信息化迅速发展的背景下&#xff0c;将信息技术与农业相融合是必然的趋势。现代信息技术在农业生产中的运用&#xff0c;主要体现在两个领域&#xff1a;一是传感器技术&#xff1b…

基于SpringBoot和Vue的车辆违章信息查询系统

一、绪论 1.1 研究背景 当前社会交通事故频发&#xff0c;车辆违章现象屡见不鲜。为了解决这一问题&#xff0c;车辆违章信息查询系统应运而生。该系统能够自动检测车辆违章行为并提供相关信息&#xff0c;为交通管理提供了便利。 目前&#xff0c;基于 Java 语言的前后端完…

0030Java程序设计-积分管理系统论文

文章目录 摘  要**目  录**系统实现系统功能需求3.2.1 管理员功能3.2.2 柜员功能 开发环境 摘  要 随着计算机和网络的不断革新&#xff0c;世界已经进入了前所未有的电子时代。作为实用性强、应用范围广泛的会员管理系统也正在被越来越多的各类企业用于消费管理领域。然…

丰富你的场景验证用例

即使对于一个非常简单的IP&#xff0c;我们也无法验证充分&#xff0c;或者说无法证明芯片没有bug。一个验证人员所能够做的就是尽可能地发现更多的bug&#xff0c;增强流片成功的信心。 对于芯片的验证用例&#xff0c;在各个基本分支通路都已经覆盖了之后&#xff0c;还需要考…

Proteus仿真--单个数码管循环显示0-9(仿真文件+程序)

本文主要介绍基于51单片机的单个数码管循环显示0-9&#xff0c;Proteus仿真&#xff08;完整仿真源文件及代码见文末链接&#xff09; 仿真运行视频 Proteus仿真--单个数码管循环显示0-9&#xff08;仿真文件程序&#xff09; 附完整Proteus仿真资料代码资料 百度网盘链接: ht…

【波形图】在X轴上显示时间和日期

下面的VI截图展示了使用“获取日期/时间&#xff08;秒&#xff09;VI”的不同方法。 然后需要设置一下波形图的属性。 由“获取日期/时间&#xff08;秒&#xff09;&#xff08;Get Date/Time In Seconds&#xff09;”VI创建的时间标识表示自世界时间1904年1月1日星期五12:0…