分享几个索引创建的小 Tips

news2025/1/11 23:43:43

文章目录

    • 1. 冗余索引
      • 1.1 联合索引左边列
      • 1.2 索引中加入主键
    • 2. 隐藏的索引排序
    • 3. 删除不使用的索引
    • 4. 手动更新索引统计信息
    • 5. 适时优化表

关于 MySQL 中的索引,松哥前面已经和小伙伴们聊了不少了,不过在索引使用的时候,还是有一些需要注意的细节,如果忽略了这些细节,可能会让索引的使用效果大打折扣。

1. 冗余索引

注意我这里使用了冗余索引,没有使用重复索引,因为我觉得在小伙伴们使用索引的过程中,创建重复索引的概率应该还是比较小,同一个字段上创建多个一模一样的索引,应该很少有人会犯这种错误。但是,会有一些容易被大家忽略的冗余索引,我们来捋一捋。

1.1 联合索引左边列

例如我创建了一个联合索引 (A,B,C),按照我们之前跟大家讲的最左匹配原则,当我们使用 A、(A、B)或者 (A、B、C)去查询数据的时候,都会用到这个联合索引,所以我们就没有必要再去单独针对 A 字段创建一个索引,或者针对 A、B 字段创建一个联合索引。

1.2 索引中加入主键

假设我有一张表,该表有如下字段 (ID、A、B、C),其中 ID 是主键,现在又针对 A 和 ID 两个字段创建了联合索引(A、ID)。

根据松哥前面的介绍,小伙伴们知道,在二级索引中,叶子结点上存储的数据就是 ID,所以,这个联合索引中的 ID 字段显然是多余的。

大部分情况下我们都不需要冗余索引,但是也有一些特殊情况可能让我们不得不创建一些冗余索引,这个小伙伴们还是要具体问题具体分析。

另外需要注意一点,针对相同的字段,如果索引类型不同,则不能算是重复索引,例如一个普通索引和一个全文索引,同一个字段上同时有这两个索引,不算重复索引。

2. 隐藏的索引排序

上篇文章松哥刚刚和大家聊了索引排序的问题。

结合上篇文章的内容,小伙伴们思考这样一个问题:假设我有一张表,表中包含如下字段(ID、A、B),其中 ID 是主键,现在我针对 A 字段建立一个索引,如果我有如下查询 SQL:

select ... from table where A=xxx order by ID

由于在 A 这个二级索引中就包含了 ID 字段,所以上面这个查询是可以使用到索引排序的。此时,如果由于其他需求,我们将 A 这个索引扩展成联合索引(A、B)了,那么很明显,再执行上面的查询的时候就用不了索引排序了,只能 filesort 了。这样的问题小伙伴们在创建或者修改索引的时候很容易忽略,所以一定要仔细。

3. 删除不使用的索引

有的索引可能是由于过度考虑创建了,创建成功之后就没用过,这样的索引也应该删除掉。

小伙伴们知道,索引虽然可以提高查询速度,但是却会降低插入和修改速度。

在 MySQL 的元数据库 sys 中有一个名为 schema_unused_indexes 的视图,该视图中就保存了各种创建了但是未使用的索引:

4. 手动更新索引统计信息

当我们想要查看一条 SQL 的执行计划时,这个执行计划中会展示出来这个 SQL 执行过程中大概会扫描多少行数据,如下:

这个预估的扫描行数非常重要,这是 MySQL 优化器在执行 SQL 的时候一个重要的参考指标,如果表没有这个统计信息,或者统计信息不准确,那么就有可能导致优化器做出错误的决定。

当满足如下条件的时候,这个统计信息会自动生成或者更新:

  • 首次打开表。
  • 表大小发生变化。
  • 执行 SHOW TABLE STATUS
  • 执行 SHOW INDEX
  • MySQL 客户端开启自动补全功能
  • 打开 infomation_schema 库中一些相关的表

这些行为都会触发统计信息的自动更新,如果表中数据量比较大,担心以上行为降低表的性能,那么也可以修改 innodb_stats_on_metadata 参数来关闭以上行为。

当然,我们也可以手动执行 analyze table 命令来更新索引的统计信息。

5. 适时优化表

InnoDB 中的索引是一个 B+Tree,这个我们在之前的文章中就和小伙伴们聊过了。B+Tree 通过一个多路平衡查找树将数据组织在一起,然而这个树中的各个结点在存储的时候在物理分布上却并不一定连续,如果是连续的,则在数据操作的时候就会快很多,如果不需连续,数据操作性能必然会有下降,一般来说,存在这样几种不同的碎片形式:

  1. 行碎片:数据行分布在不同的地方,读取数据行的时候涉及到多次随机 IO。
  2. 行间碎片:逻辑上应该是连续的行或者数据页,在磁盘上存储时并不连续。原本全表扫描的时候是顺序 IO,现在变成了随机 IO。
  3. 剩余空间碎片:小伙伴们知道,InnoDB 操作数据表最基本单位是页,一页是 16KB,也就是 InnoDB 从磁盘上读、往磁盘上写,最低单位都是 16KB,有时候这 16KB 中,有效数据很少,其他地方都是剩余空间,就会让 InnoDB 在读写数据的时候造成很大浪费。

对于以上情况,我们可以通过执行 optimize table 来重新整理数据,如果存储引擎不支持 optimize table 命令,那么我们也可以通过执行 alter table <table> engine=xxx 命令来实现数据的重整(命令中的 xxx 就是表原本的引擎)。

当然,optimize table 命令在执行的过程中还有一些细节问题,这个松哥后面再整文章和小伙伴们分享。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/602100.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何发布一个npm包

1、注册账号 https://www.npmjs.com/ 使用邮箱注册即可 a. 邮箱会在本地登录时发送验证码使用 b. 发布包后邮箱会收到通知 2、生成AccessToken &#xff08;1&#xff09;直接本地登录 # 根据提示输入用户名、密码、注册邮箱 npm login# 输入完邮箱会发送验证码&#xff0c…

如何做一个有质量的技术分享

分享信息并不难,大多数人都能做到,就算是不善言谈性格内向的技术人员,通过博客或社交媒体,或是不正式的交流,他们都能或多或少的做到。但是如果你想要做一个有质量有高度的分享,这个就难了。 所谓的有质量和有高度,我心里面的定义有两点: 分享内容的保鲜期是很长的会被…

win11本地安装k8s

1、确保本地已经安装DesktopDocker&#xff1b; 2、使用choco下载安装Kind&#xff0c;正常下载安装报错提示&#xff0c;建议使用管理员权限 使用管理员权限下载安装Kind 也可以从github下载kind到本地进行安装&#xff0c;下载地址 Releases kubernetes-sigs/kind GitHub …

分布式锁Redis基础理论与落地实现与Redisson。

分布式锁Redis基础理论与落地实现 基本概念基于Redis的分布式锁基本用法基于Redis实现分布式锁初级版本改进Redis的分布式锁问题Redis的Lua脚本利用Lua脚本写释放锁业务流程再次改进Redis的分布式锁 总结 Redisson基于setnx实现的分布式锁存在下面的问题Redisson入门Redisson可…

64位系统究竟牛逼在哪里?

想必大家都遇到过这样的问题&#xff1a;安装某个软件的时候&#xff0c;出现提示选择32位版本还是64位版本&#xff1f;我们也可以查看自己的电脑是32位还是64位系统。 Windows Linux 大家可能知道32位和64位和系统有关&#xff0c; 但其实 32 vs 64 可以有多重含义。 一般情…

JVM学习笔记(上)

1、总体路线 2、程序计数器 Program Counter Register 程序计数器&#xff08;寄存器&#xff09; 作用&#xff1a;是记录下一条 jvm 指令的执行地址行号。 特点&#xff1a; 是线程私有的不会存在内存溢出 解释器会解释指令为机器码交给 cpu 执行&#xff0c;程序计数器会…

GCC写个库给你玩,就这?

前言 什么是GCC GCC原名为 GNU C语言编译器 「GCC」(GNU Compiler Collection,GNU编译套件) 是由GNU开发的编程语言编译器。 正文 安装命令 sudo apt-get insatll gcc g注意安装版本要大于4.8.5因为4.8.5以后的版本才支持c11标准 查看版本 gcc -v gcc --version g -v g …

Vue.js 的数据双向绑定实现原理

Vue.js 的数据双向绑定实现原理 Vue.js 是一款流行的前端框架&#xff0c;它采用了数据双向绑定的方式&#xff0c;让前端开发人员更加方便地管理数据和视图。在本文中&#xff0c;我们将深入探讨 Vue.js 的数据双向绑定实现原理&#xff0c;以及相关的代码示例。 数据双向绑定…

1. TensorRT量化的定义及意义

前言 手写AI推出的全新TensorRT模型量化课程&#xff0c;链接&#xff1a;TensorRT下的模型量化。 课程大纲如下&#xff1a; 1. 量化的定义及意义 1.1 什么是量化&#xff1f; 定义 量化(Quantization)是指将高精度浮点数(如float32)表示为低精度整数(如int8)的过程&…

jmeter性能测试步骤实战教程

1. Jmeter是什么&#xff1f; 2. Jmeter安装 2.1 JDK安装 由于Jmeter是基于java开发&#xff0c;首先需要下载安装JDK &#xff08;目前JMeter只支持到Java 8&#xff0c;尚不支持 Java 9&#xff09; 1. 官网下载地址&#xff1a; http://www.oracle.com/technetwork/java/…

Map、Set和哈希表的应用练习(数据结构系列15)

目录 前言&#xff1a; 练习题&#xff1a; 结束语&#xff1a; 前言&#xff1a; 在上一节博客中小编给大家介绍了Map、Set和哈希表的一些简单的知识点&#xff0c;同时也给大家简单的演示了一下如何使用他们里面的一些基础方法&#xff0c;那么接下来让小编带着你们一起来…

当心!经济学家分析:未来三年内做好随时失业的准备

AI人工智能又来抢饭碗了&#xff0c;这次竟然通过了公认难考的会计行业考试&#xff01; 近期&#xff0c;OpenAI的大语言模型最新版GPT-4已经完成美国注册会计师&#xff08;简称CPA&#xff09;考试&#xff0c;四大主要会计考试所有科目的平均得分为85.1。 而在CPA考试中&…

落地页设计的营销心理学(三)

本文是「落地页设计的营销心理学」这个主题系列文章的收官篇&#xff0c;要给大家分享关于用户行动号召、提高用户参与度和整个营销落地页结构的设计。 回顾系列文章&#xff1a; 《落地页设计的营销心理学&#xff08;一&#xff09;》 《落地页设计的营销心理学&#xff08…

C++进阶 —— 线程库(C++11新特性)

十&#xff0c;线程库 thread类的简单介绍 在C11之前涉及多线程问题&#xff0c;都是和平台相关的&#xff0c;如windows和Linux下各有自己的接口&#xff0c;这使代码的可移植性较差&#xff1b;C11中最重要的特性就是对线程进行支持&#xff0c;使得C在并行编程时不需要依赖…

【社区图书馆】《写作脑科学》

文章目录 前言语言和思维写作技巧创造性思维总结 前言 杨滢著的《写作脑科学》是一本关于写作的科学读物&#xff0c;它深入探讨了人类大脑是如何进行创造性思维和表达的。这本书让我对写作有了全新的认识&#xff0c;也为我提供了一些实用的技巧和策略来提高自己的写作能力。…

整理 钢琴教材 约翰·汤普森现代钢琴教程(大汤)

邮箱不能及时回复,现放到网盘里了,文末按需自取 约翰-汤普森钢琴教程1 文件名:(大汤1)约翰汤普森现代钢琴教程 1 超清PDF 文件大小:9.9 MB 下载地址:https://download.csdn.net/download/qq_36040764/85051148 约翰-汤普森钢琴教程2 文件名:(大汤2)约翰汤普森现…

Python3中goto的用法

Python3代码指定跳转可以使用goto这个库&#xff1a; 安装&#xff1a; pip install goto-statement 一般安装的版本是1.2 需要做以下修改才能正常使用&#xff1a; python 使用goto&#xff0c;遇到的问题解决_奶嘴偷走初吻的博客-CSDN博客python goto 出现报错:Attribut…

Python difflib的使用

今天做了一个从list的内容取出一个与指定内容尽可能相似的内容,做完之后抽个几分钟记录下 difflib的作用 比对2个文件的差异. 使用的时候直接 import difflib 即可 get_close_matches 作用 匹配最大相似的内容返回结果 list1 ["abc", "acd", "…

NIO编程

目录 1、什么是NIO编程&#xff1f; 为什么说Java NIO是非阻塞的&#xff1f; 2、Java NIO 通道(Channel)详解 如何获取Channel对象&#xff1f; 3、Java NIO 缓冲区(Buffer)详解 &#xff08;1&#xff09;获取缓冲区对象 &#xff08;2&#xff09;将数据写入Buffer以…

没学过编程,本科学历,Java学到什么程度才能找工作?

好程序员之前写过多篇Java找工作方面的文章&#xff0c;今天说说零Java基础找工作的事情。首先请大家明确如下的要点。 1、在没有真实Java工作项目经验的前提下&#xff0c;靠自学&#xff0c;哪怕到培训班学&#xff0c;一定是无法真正掌握到能干Java项目的地步&#xff0c;原…