【MySQL】数据库的索引机制

news2024/11/19 0:48:12

在这里插入图片描述

文章目录

  • 前言
  • 1. 索引是什么
  • 2. 索引的优缺点
    • 2.1 优点
    • 2.2 缺点
  • 3. 索引的操作
    • 3.1 创建索引
    • 3.2 查看索引
    • 3.3 删除索引
  • 4. 索引的存储原理
    • 4.1 B树
    • 4.2 B+树
  • 结语


前言

在数据库中,我们经常使用到的操作就是查询,当数据量小的时候,查询的速度很快,一下子就找到了;但当数据量特别大时,我们应该要怎么做才能提高查询效率呢?哎,索引刚好就是干这个的


1. 索引是什么

索引(index):在 MySQL 中,索引是一种数据库优化技术用于提高数据库查询的效率。索引可以类比于书籍的目录,相当于在数据库中构建一个特殊的“目录”,它允许数据库系统快速定位到数据,而不必扫描整个表来查找记录,避免了针对表数据进行遍历操作

类似字典,它的前面会有各种目录。我们在查字的时候就可以根据目录来加快查询速度,比无头苍蝇一样一页一页翻要快的多的多

要注意:索引是以“列”为维度进行创建的,只有当我们针对有索引的列为条件来查询,索引才能生效,才能够真正的提升查询速度

假设我们对表中的 a 列创建了一个索引,当我们使用 select ... where ... 语句时若以 a 列为条件判断,如 select * from where a = xxx,此时索引才会生效;但如果是以 b、c、d 等其他列进行查询,那查询速度也不会变快


2. 索引的优缺点


2.1 优点

  • 可以大大提高数据库的查询速度
  • 可以提高数据库系统的性能,减少查询所需要的时间,降低服务器的负载
  • 可以用来加速数据的查找、排序、分组等操作

2.2 缺点

与其是缺点,倒不如说是代价:

  • 需要消耗额外的存储空间(硬盘)
  • 有可能会影响到 “增删改” 的效率,因为我们在进行 “增删改” 的时候,需要同步更新维护索引
  • 在数据量很大的时候,创建索引可能会触发大量的硬盘IO,直接把机器卡死

索引的使用场景:

  • 数据量比较大,而且经常对某些列进行查询操作
  • 某些列的插入修改操作频率比较低

总的来说,正确使用索引可以极大地提升数据库的性能,但我们也需要根据实际的查询模式和数据使用情况来设计索引策略

在实际开发中,我还是很建议使用索引的,“性价比”很高。不过在建表的时候,我们就要规划好哪些列需要创建索引,避免后期修改而导致一系列的问题


3. 索引的操作

在我们创建主键约束、唯一约束、外键约束的时候,数据库会自动帮我们创建这些列的索引,因为它们都高频使用到查询操作


3.1 创建索引

create index 索引名 on 表名(字段名);
  • 对于非主键约束、非唯一约束、非外键约束的字段,我们可以创建普通索引
  • 索引名习惯以 idx 或 ix 做前缀,后面的名字最好有意义
-- 演示
-- 为学生表的成绩列创建索引
-- 先建表
create table student (
	id int primary key,
	name varchar(20) unique,
	grade int
);

-- 创建成绩列的索引
create index grade_index on student(grade);

image-20240625095934723


3.2 查看索引

show index from 表名;
-- 演示
-- 我们直接查看上面刚创建的学生表
show index from student;

image-20240625100601616

我们可以发现:除了我们自己创建的成绩列索引,还有数据库自动生成的主键索引和唯一索引。还有一点,外键约束也会生成索引,此处就不展示了


3.3 删除索引

drop index 索引名 on 表名;
  • 删除索引时,我们只能够删除手动创建的普通索引,如果删除数据库自动生成的索引,则会导致约束消失,非常不建议这样的操作(博主的 MySQL 版本为5.7,版本号偏低,具体删除情况请以实际版本号为准)
  • 删除索引也是一个十分危险的操作,数据量大的时候直接删除索引可能会触发大量硬盘IO,使数据库宕机
-- 演示
-- 删除手动创建的索引
drop index grade_index on student;

image-20240625101256179


4. 索引的存储原理

MySQL 索引的存储使用的是 B+ 树,而想要搞懂 B+树,我们得先来了解 B 树


4.1 B树

B 树,又叫做 B-tree,通常读作 “Bee-tree” 而非 “B 减树”,它是一种自平衡树形数据结构,同时也是一棵多叉平衡搜索树

B 树的特点有:

  • 每个节点可以有多个子节点,可以存储多个元素
  • 通过分裂和合并操作保持树的平衡,使得树的高度尽可能低
  • 查询效率高,减少了硬盘IO的次数

以下是 B 树的结构:

img

相较于二叉树,我们在查找元素的过程中,数据比较的次数并没有减少,但是对于硬盘IO的次数大大减少。我们在和某个节点比较时,是先一次硬盘IO,把该节点上的所有内容都读取出来,接下来的比较都是在内存中进行的

但是,B 树还是有一些不足之处:不支持快速进行范围查询,当查找到叶子节点时,还需返回到根节点重新遍历查询;时间复杂度不稳定,与目标元素的位置有很大关系


4.2 B+树

B+ 树跟 B 树类似,不同点有:

  • 所有数据记录节点都是叶子节点,非叶子节点仅包含键值和指向子节点的指针,不存储数据记录
  • 所有叶子节点都是数据记录,并且叶子节点之间通过指针连接,形成一个有序链表
  • 可以提供更快的顺序访问性能,特别是对于范围查询

以下是 B+ 树的结构:

img

由于 B+ 树将所有的索引项都放在了叶子节点上。所有的查询都需要落到叶子节点上完成的,那么每次检索的时候,经历的硬盘IO次数和比较次数都是差不多的,使得查询的开销变得很稳定,即时间复杂度稳定

而且在 B+ 树里,只有叶子节点上存储数据行,非叶子节点只存储索引列的 key 值,所以非叶子节点占据的空间很小,可以加载到内存中,相对于 B 树来说,B+ 树的树高理论情况下是比 B 树要矮的,进而可以减少相应的硬盘IO操作


综上所述,B+ 树可以确保数据库进行快速、精准的查询


结语

关于本篇博客,我们需要知道索引的定义、索引的操作(增删查)、索引的优缺点、以及索引背后的数据结构(B+ 树的特点和优势),知道并熟练掌握这些知识点对我们来说非常重要

希望大家能够喜欢本篇博客,有总结不到位的地方还请多多谅解。若有纰漏,希望大佬们能够在私信或评论区指正,博主会及时改正,共同进步!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1863927.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Windows Server 2019 OVF, updated Jun 2024 (sysin) - VMware 虚拟机模板

Windows Server 2019 OVF, updated Jun 2024 (sysin) - VMware 虚拟机模板 2024 年 6 月版本更新,现在自动运行 sysprep,支持 ESXi Host Client 部署 请访问原文链接:https://sysin.org/blog/windows-server-2019-ovf/,查看最新…

Charles抓包工具系列文章(六)-- Block List 和 Allow List (黑白名单)

一、背景 Allow List 是白名单,请求的接口如果在白名单里,就被允许。 Block List 是黑名单,请求的接口如果在黑名单里,就被拒绝。 黑白名单是可以一起启用的,优先黑名单。 二、白名单 Allow List 1、新增白名单接口…

201.回溯算法:全排列(力扣)

class Solution { public:vector<int> res; // 用于存储当前排列组合vector<vector<int>> result; // 用于存储所有的排列组合void backtracing(vector<int>& nums, vector<bool>& used) {// 如果当前排列组合的长度等于 nums 的长度&am…

HDOJ5616 Jam‘s balance

目录 HDOJ5616 Jams balance题目描述背景输入输出 题解解法一解法二优化 打赏 HDOJ5616 Jam’s balance 题目描述 背景 有 N N N个已知质量的砝码&#xff0c;分别询问给出的 M M M个质量能否被称出 输入 第一行输入一个变量 T T T&#xff0c;表示有 T T T组数据&#xf…

二轮平衡车直立控制VREP仿真及python上位机监控实现基础环境

目录 1.引言2. 实验流程2.1. V-REP环境搭建2.2. 电机和部件建模 3.控制策略描述3.1. PID控制3. 2. 控制参数调整 4.代码结构5.结论配套环境和源代码PS.扩展阅读ps1.六自由度机器人相关文章资源ps2.四轴机器相关文章资源ps3.移动小车相关文章资源 1.引言 在机器人学和自动化领域…

东南亚本地化游戏

通常&#xff0c;亚洲电子游戏市场首先与中国联系在一起。但最近&#xff0c;分析人士越来越关注一个邻近地区&#xff1a;东南亚。而且有充分的理由。 该地区包括中南半岛、马来群岛和邻近岛屿上的十一个国家。1967年&#xff0c;其中10个国家&#xff08;除东帝汶外&#xf…

.NET C# 使用GDAL将mdb转换gdb数据

.NET C# 使用GDAL将mdb转换gdb数据 目录 .NET C# 使用GDAL将mdb转换gdb数据1 环境2 Nuget3 Code 1 环境 VisualStudio2022 .NET6 GDAL 3.8.5 2 Nuget 3 Code FeatureExtension.cs public static class FeatureExtension {[DllImport("gdal.dll", EntryPoint &…

各大广告商竞相厮杀下,诞生了一个偏门的副业方式

前段时间&#xff0c;想买摩托车&#xff0c;但是媳妇不让买&#xff0c;所以我打算偷偷买&#xff0c;然后萌生了去摆摊赚钱的想法&#xff0c;但是还没有实施就在网上接触到了“某赚”APP&#xff0c;于是一发不可收拾&#xff0c;用我的话来说&#xff0c;我做的不是副业&am…

从一万英尺外看libevent(源码刨析)

从一万英尺外看libevent 温馨提示&#xff1a;阅读时间大概二十分钟 前言 Libevent是用于编写高速可移植非阻塞IO应用的库&#xff0c;其设计目标是&#xff1a; 可移植性&#xff1a;使用libevent编写的程序应该可以在libevent支持的所有平台上工作。即使没有好的方式进行非…

多业态、多品牌企业,如何实现积分通积通兑?(附大会员方案)

2021年&#xff0c;龙湖升级珑珠为全业态通用积分&#xff0c;招商荟深度接入招商蛇口大会员体系建设&#xff1b;2022年&#xff0c;华润置地大会员“万象星”正式上线&#xff1b;2023年&#xff0c;“蒙牛生活家会员中心”全新上线…… 越来越多地产、零售等行业的集团品牌…

【学习】如何利用Python技术进行软件测试相关工作

Python是一种广泛使用的高级编程语言&#xff0c;它因其简洁的语法、强大的库支持和跨平台特性而受到开发者的喜爱。在软件测试领域&#xff0c;Python同样发挥着重要作用&#xff0c;它可以帮助测试人员编写自动化测试脚本、进行接口测试、性能测试、以及处理测试数据等。以下…

迅为RK3588开发板支持LVDS信号,标准 HDMI信号,IMIPI信号

性能强--iTOP-3588开发板采用瑞芯微RK3588处理器&#xff0c;是全新一代ALoT高端应用芯片&#xff0c;采用8nm LP制程&#xff0c;搭载八核64位CPU&#xff0c;四核Cortex-A76和四核Cortex-A55架构&#xff0c;主频高达2.4GHZ&#xff0c;8GB内存&#xff0c;32GB EMMC。 四核心…

2024第十三届中国PMO大会主持人介绍

全国PMO专业人士年度盛会 由PMO评论主办的2024第十三届中国PMO大会邀请了到十几位知名企业的PMO和项目管理专家来担任大会主持人。大会将于6月29-30日在北京举办&#xff0c;敬请关注&#xff01; 主持人介绍 肖杨&#xff0c;国际知名组织级项目管理专家&#xff0c;微薄之力…

[深度学习] 自编码器Autoencoder

自编码器&#xff08;Autoencoder&#xff09;是一种无监督学习算法&#xff0c;主要用于数据的降维、特征提取和数据重建。自编码器由两个主要部分组成&#xff1a;编码器&#xff08;Encoder&#xff09;和解码器&#xff08;Decoder&#xff09;。其基本思想是将输入数据映射…

软考《信息系统运行管理员》-1.2信息系统运维

1.2信息系统运维 传统运维模式&#xff08;软件&#xff09; 泛化&#xff1a;软件交付后围绕其所做的任何工作纠错&#xff1a;软件运行中错误的发现和改正适应&#xff1a;为适应环境做出的改变用户支持&#xff1a;为软件用户提供的支持 新的不同视角下的运维 “管理”的…

【八股系列】Vue中的<keep-alive>组件:深入解析与实践指南

&#x1f389; 博客主页&#xff1a;【剑九 六千里-CSDN博客】 &#x1f3a8; 上一篇文章&#xff1a;【探索响应式布局的奥秘&#xff1a;关键技术与实战代码示例】 &#x1f3a0; 系列专栏&#xff1a;【面试题-八股系列】 &#x1f496; 感谢大家点赞&#x1f44d;收藏⭐评论…

三、用户中心项目笔记----后端多环境实战+原始部署

后端多环境主要是修改&#xff1a; 依赖的环境地址 数据库地址 缓存地址 消息队列地址 项目端口号 服务器配置 后端怎么去区分不同的环境&#xff1f; 我们后端的SpringBoot项目&#xff0c;通过application.yml添加不同后缀来区分配置文件 application.yml就是公共的配置&a…

NeRF从入门到放弃6:两种OpenCV去畸变模型

针孔相机和鱼眼相机的去畸变模型是不一样的。 针孔相机的畸变参数有12个&#xff0c;k1~k6是径向畸变参数&#xff0c;p1 p2是切向畸变&#xff0c;s1s4&#xff1b;而鱼眼相机是等距模型&#xff0c;畸变参数只有4个k1k4。 针孔相机 畸变分为径向畸变和切向畸变。 把相机平…

链式结构二叉树练习

一.二叉树的前序遍历 想要输出所给值&#xff0c;就要先用数组将数据存储起来&#xff0c;所以这里我们单独创建一个前序遍历函数&#xff0c;将所要数据前序遍历并放入数组&#xff0c;代码如下&#xff1a; void preOrder(struct TreeNode* root, int* a, int* pi)//前序遍历…

新鲜出炉的信息化一机两用方案

在信息化日益发展的今天&#xff0c;网络安全问题愈发凸显其重要性。尤其是在政府和企事业单位中&#xff0c;如何在保证业务流畅和工作效率的同时&#xff0c;确保信息高安全性&#xff0c;成为了一个亟待解决的问题。而“一机两用”政策&#xff0c;正是针对这一需求而提出的…