MySQL:为什么说应该优先选择普通索引,尽量避免使用唯一索引

news2024/12/24 11:03:26

前言

在使用MySQL的过程中,随着表数据的逐渐增多,为了更快的查询我们需要的数据,我们会在表中建立不同类型的索引。

今天我们来聊一聊,普通索引和唯一索引的使用场景,
以及为什么说推荐大家优先使用普通索引,尽量避免使用唯一索引。

对于一个普通的二级索引,目的就是为了加速查询,
所以我们可能会为表中的某个字段或者某些字段,建立一个普通的二级索引。

而对于唯一索引来说,由于其唯一键约束的特性,有时我们会更多的赋予其业务含义。
比如有一张存储身份证号的表,为了保证身份证号的唯一性,我们会在身份证号字段上建立唯一索引。

那为什么说,不推荐大家使用唯一索引呢?

接下来,我们从查询和更新两方面分析一下唯一索引和普通索引的性能差距。

查询性能

我们知道每个索引其实都是一棵二叉树,所以我简单画了一个索引图,不太好看,大家多多担待。

给大家稍微解释一下这张图,不同颜色代表不同的数据页,这里假设一个数据页里面存放两条数据。

我们知道MySQL磁盘与内存交互是通过一个叫做数据页的单位,每个数据页默认的大小是16K。

在一棵树上,只有叶子节点才会真正的存放数据,非叶子节点存放的是每个下级数据页中最小的索引字段以及指向下级数据页的指针。

对于主键索引,叶子节点存放的是一行真正的数据,而对于二级索引来说,在叶子节点存储的是索引字段以及对应的主键id。

好了,下面我们分析一下,普通二级索引和唯一索引是如何查数据的?

以一个简单的查询sql为例:select id from t where m=103;

1,MySQL从根节点出发,通过二分法判断m=103大于100小于104,所以会找到根节点中100对应的数据页100-102;

2,在100-102的数据页上,由于103大于102,所以会找到102对应的102-103的数据页;

3,在这个数据页上,找到了m=103的记录,并获取到了要查询的id字段。

对于普通的二级索引来说,找到第一条m=103的记录之后,会继续向后查找,在104-105这个数据页中判断是否还有符合m=103条件的记录,如果没有则结束查询。

而对于唯一索引来说,由于其唯一性约束,所以在查找到第一条记录之后,就结束了查找。

可以看到,二者的差别就在于是否继续查到下一条。

那这两者有多大的性能差距呢?答案是几乎没有。

我们知道,MySQL的数据是以页为单位存放的,以一个int类型的二级索引为例,一个int占4个字节,加上MySQL的头信息6个字节,相当于10个字节。

那么一个16k的页上能存放多少记录呢?

16*1024/10 = 1638。也就是说,一个数据页就可能放下1600多条记录。那么我们在查询数据时,会把整个数据页都加载进内存,此时对于普通二级索引判断下一个记录的操作所需的消耗是非常非常小的。

可以说,从查询方面来看,普通二级索引和唯一索引的性能基本是相当的。

更新性能

唯一索引和普通二级索引的性能差距主要体现在更新操作上。

对于MySQL来说,更新一条语句的逻辑是首先读到要更新的记录,如果这个记录没有在内存里,就先加载到内存。然后执行更新的语句,之后再把变更的数据刷新到磁盘中。

但是,对于MySQL来说,把数据从磁盘读到内存涉及到随机IO,是成本非常高的一种操作。

如果每次更新数据都要这么来一次的话,高性能这个指标恐怕很难保证。

所以,设计MySQL的大神们引入了一个叫做change buffer的东西。

change buffer是一种可以持久化的缓存数据,当我们要更新数据时,如果要更新的数据不存在于内存,此时并不需要把数据从磁盘加载到内存,而是将更新操作记录在change buffer中,更新操作就算完成了。

当下次要读取这些数据时,会把读到的数据和change buffer进行合并,或者叫merge。

通过change buffer,更新操作就不需要去读磁盘了,全程都是内存操作,性能自然可以得到极大的提升。

但是!但是问题又来了!

change buffer只对普通二级索引有效,对于唯一索引是没有效果的。

为什么呢?

因为在更新一条记录时,我们需要检查索引的唯一性约束。

如何检查呢?自然首先要把数据从磁盘加载到内存里面才能进行判断。

可是如果都已经把数据加载到内存里,再去使用change buffer不就显得多此一举了。

所以,唯一索引不能,也没必要去使用change buffer来提升性能了。

由于对唯一索引的更新涉及到读磁盘这个随机IO操作,性能自然也是比不上普通二级索引了,这就是推荐大家优先使用普通二级索引的原因了。

经过对比,大家也可以看到,这两种索引在查询上性能基本是一致的,其性能差距主要体现在更新操作上。

其实即便是大家有一些特殊的业务需要,比如存放唯一的身份证号等,还是建议大家通过业务层去约束。

总的来说,普通的二级索引比唯一索引带来的收益要更大。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/341943.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

面试题(二十四)数据结构与算法

9.1哈希 请谈一谈,hashCode() 和equals() 方法的重要性体现在什么地方? 考察点:JAVA哈希表 参考回答: Java中的HashMap使用hashCode()和equals()方法来确定键值对的索引,当根据键获取值的时候也会用到这两个方法。…

【OJ】本土化

📚Description: 激动人心的时刻到了!我们开发的记账软件即将在欧美地区发布,但我希望能把本土化工作做得更好。所谓的本土化可不仅仅是把软件界面语言翻译成英语,还要根据当地的习俗来调整软件的使用方法。 比如我国在书写数字…

【yolov5】首次尝试目标检测利用prompt

1、打开prompt 2、切换到pytorch所在环境 conda activate freezing我的环境名是freezing,这里根据自己环境名去激活切换 3、进入到yolov5项目所在路径 激活完环境后立即执行指令当然是无效的,首先要进入到你的项目目录 首先看一下自己的项目在那个位…

MongoDB分片集群部署及实践

文章目录MongoDB分片集群部署及实践一、前言二、了解分片集群1.简介2.分片集群组件3.副本集模式三.安装部署1.分片集群环境2.安装1)CPU 检测2)修改机器名称3)配置 hosts 文件4)配置防火墙5)创建目录6)安装 …

PowerBI的使用和基本效果

1. 什么是PowerBI Power BI 是一套商业分析工具,用于在组织中提供见解。可连接数百个数据源、简化数据准备并提供即席分析。生成美观的报表并进行发布,供组织在 Web 和移动设备上使用。每个人都可创建个性化仪表板,获取针对其业务的全方位独…

加一-力扣66-java高效方案

一、题目描述给定一个由 整数 组成的 非空 数组所表示的非负整数,在该数的基础上加一。最高位数字存放在数组的首位, 数组中每个元素只存储单个数字。你可以假设除了整数 0 之外,这个整数不会以零开头。示例 1:输入:di…

PostgreSQL的下载安装教程(macOS、Windows)

postgresql是GIS服务端几乎不可避免要打交道的数据库。因为mysql的空间扩展真是不尽人意。所以想要学会GIS服务端知识,postgresql(下文简称pg)你是必须要会的。 首先要知道,pg是一个空间数据库,和普通数据库不同的是pg支持空间数据的存储与操作。这里所谓的空间数据一般指…

1、为什么要经常对数据做特征归一化

前言: feature scaling 即为特征归一化、标准化,是数据预处理中的重要技术。在实际运用中,使用梯度下降算法的模型都需要归一化,包括线性回归、逻辑回归、支持向量机、神经网络等模型。但对决策树模型并不适用,因为信…

【LeetCode】每日一题(3)

目录 题目:1234. 替换子串得到平衡字符串 - 力扣(Leetcode) 题目的接口: 解题思路: 代码: 过啦!!! 写在最后: 题目:1234. 替换子串得到平衡…

handler解析(3)-同步消息、异步消息、同步屏障

Message分为3种:普通消息(同步消息)、屏障消息(同步屏障)和异步消息。我们通常使用的都是普通消息,而屏障消息就是在消息队列中插入一个屏障,在屏障之后的所有普通消息都会被挡着,不…

使用继承与派生的6大要点

概述 面向对象编程技术非常看重软件的可重用性,在C中,可重用性是通过继承机制来实现的。继承机制允许程序员在保持原有类的数据和功能的基础上进行扩展,增加新的数据和功能,从而构成一个新的类,也称为派生类。原有类&a…

分销系统逻辑

相关概念 主营商户: 提供分销商品和佣金的商户分销商: 拥有自己的销售渠道,能够帮助推动产品销售的个人或商户消费者: 购买分销商品的人。佣金: 主营商户返还给经销商的比例抽成 分销功能设计 (1)分销商准入规则设计 无规则: 没有分销商的准入门槛限制&#xf…

七大设计原则之依赖倒置原则应用

目录1 依赖倒置原则2 依赖倒置应用1 依赖倒置原则 依赖倒置原则(Dependence Inversion Principle,DIP)是指设计代码结构时,高层模块不应该依赖底层模块,二者都应该依赖其抽象。抽象不应该依赖细节;细节应该依赖抽象。…

VHDL语言基础-Testbech

目录 VHDL仿真概述: 基本结构: VHDL一般仿真过程: 仿真测试平台文件: 编写测试平台文件的语言: 一个测试平台文件的基本结构如下: 测试平台文件包含的基本语句: 产生激励信号的方式: 时钟信号: 复位信号: 周期信性信号: 使用延迟DELAYD: 一般的激励信号…

算法leetcode|36. 有效的数独(rust重拳出击)

文章目录36. 有效的数独:样例 1:样例 2:提示:分析:题解:rustgoccpythonjava36. 有效的数独: 请你判断一个 9 x 9 的数独是否有效。只需要 根据以下规则 ,验证已经填入的数字是否有效…

【C++】类和对象---需掌握的功能

目录1.初始化列表1.1构造函数赋值1.2初始化列表格式:编译器执行的顺序:特性:1.3explicit关键字类型替换过程多参数构造函数类型替换(C11)2.static成员编程题3.匿名对象4.友元4.1友元函数4.2友元类5.内部类6.拷贝对象时…

linux高级命令之获取管理员权限的相关命令

获取管理员权限的相关命令学习目标能够知道切换到管理员用户的命令1. sudo命令的使用命令说明sudo -s切换到root用户,获取管理员权限sudo某个命令的执行需要获取管理员权限可以在执行命令前面加上sudosudo -s效果图:sudo 命令效果图:说明:如果只是某次操作需要使用管…

面向对象与面向过程编程

从语言角度来讲: C是面向过程编程; C一半是面向过程编程,一半是面向对象编程; Java是面向对象编程。 一、什么是面向对象编程与面向过程编程? 面向过程(Procedure Oriented 简称 PO)&#xff1…

云计算ACP云服务器ECS实例题库

😘作者简介:一名99年软件运维应届毕业生,正在自学云计算课程。👊宣言:人生就是B(birth)和D(death)之间的C(choise),做好每一个选择。&…

2.你的程序乱码了吗?

学习的动力不止于此&#xff1a; 1. 乱码 #include <QApplication> #include <QLabel> #include <QFont> int main(int argc, char *argv[]) {QApplication a(argc, argv);QLabel lb;lb.setFont(QFont("Sans Serif", 24));lb.setText(" 乱…