sql高级教程-索引

news2025/1/1 21:29:34

文章目录

  • 架构简介
    • 1.连接层
    • 2.服务层
    • 3.引擎层
    • 4.存储层
  • 索引优化
    • 背景
    • 目的
    • 劣势
    • 分类
      • 基本语法
      • 索引结构和适用场景
    • 性能分析
      • MySq| Query Optimizer
      • explain
    • 索引优化
      • 单表优化
      • 两表优化
      • 三表优化
  • 索引失效
    • 原因

架构简介

在这里插入图片描述

1.连接层

最上层是一些客户端和连接服务,包含本地sock通信和大多数基于客户端/服务端工具实现的类似于tcp/ip的通信。主要完成一些类似于连接处理、授权认证、及相关的安全方案。在该层上引入了线程池的概念,为通过认证安全接入的客户端提供线程。同样在该层上可以实现基于SSL的安全链接。服务器也会为安全接入的每个客户端验证它所具有的操作权限。

2.服务层

第二层架构主要完成大多少的核心服务功能,如SQL接口,并完成缓存的查询,SQL的分析和优化及部分内置函数的执行。所有跨存储引擎的功能也在这一层实现,如过程、函数等。在该层,服务器会解析查询并创建相应的内部解析树,并对其完成相应的优化如确定查询表的顺序,是否利用索引等,最后生成相应的执行操作。如果是select语句,服务器还会查询内部的缓存。如果缓存空间足够大,这样在解决大量读操作的环境中能够很好的提升系统的性能。

3.引擎层

存储引擎层,存储引擎真正的负责了MySQL中数据的存储和提取,服务器通过API与存储引擎进行通信。不同的存储引擎具有的功能不同,这样我们可以根据自己的实际需要进行选取。后面介绍MyISAM和InnoDB。
插件式的存储引擎架构将查询处理和其它的系统任务以及数据的存储提取相分离。这种架构可以根据业务的需求和实际需要选择合适的存储引擎。

4.存储层

数据存储层,主要是将数据存储在运行子裸设备的文件系统之上,并完成与存储引擎的交互。

索引优化

背景

性能下降SQL语句运行慢,导致执行时间和等待时间长,可能原因是如下四方面:查询语句写的烂,索引失效(单值,复合),关联查询太多join(设计缺陷或不得已的需求),服务器调优及各个参数设置(缓冲、线程数等)。
SQL机器读取顺序:
在这里插入图片描述

目的

索引是一种数据结构,用于提高数据库查询操作的效率。MySQL使用B树或哈希索引来实现索引功能。(本质上就是某种数据结构)

索引的作用是通过创建一个快速访问的路径,使得数据库可以更快地找到满足特定条件的记录。当我们在数据库表的某个列上创建索引时,数据库系统会按照这个索引的顺序存储数据并建立索引关系。这样,在查询时,数据库就可以直接跳过不符合条件的记录,快速定位到需要的数据。

真实的情况是,3层的b+树可以表示上百万的数据,如果上百万的数据查找只需要三次I0,性能提高将是巨大的,如果没有索引,每个数据项都要发生一次I0,那么总共需要百万次的I0, 显然成本非常非常高。

索引的创建可以根据需求选择单列索引或多列索引。单列索引是基于单个列的值创建的,而多列索引是基于多个列的组合值创建的。在选择创建索引时,需要权衡查询效率和写入性能之间的关系。

需要注意的是,虽然索引可以提高查询性能,但也会增加插入、删除和更新操作的时间。因此,在创建索引时需要考虑到数据库的读写比例,并且避免过度索引导致性能下降。

总而言之,索引是用于加快数据库查询操作的重要工具,可以提高数据库的性能。但在使用索引时需要谨慎权衡索引的创建和使用,以获得最佳的查询性能。

一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储的磁盘上
示例:小顶堆
在这里插入图片描述
在这里插入图片描述

劣势

实际上索引也是- -张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引列也是要占用空间的
虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行INSERT. UPDATE和DELETE。因为更新表时,MySQL不仅 要保存数据,还要保存下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息。
索引只是提高效率的一个因素,如果你的MySQL有大数据量的表,就需要花时间研究建立最优秀的索引。

分类

单值索引:即一个索引只包含单个列,-一个表可以有多个单列索引。
单值索引只能保证索引项的唯一性,而不是列中的值的唯一性。在列中可以有重复的值,但每个值只能对应一个索引项。(一般不超过5个)
唯一索引:索引列的值必须唯一,但允许有空值.
复合索引:一个索引有多列。

其他概念:覆盖索引
理解方式一:就是select的数据列只用从索引中就能够取得,不必读取数据行,MySQL可以利用索引返回select列表中的字段,而不必根据索引再次读取数据文件换句话说查询列要被所建的索引覆盖。
理解方式二:索引是高效找到行的-一个方法,但是- -般数据库也能使用索引找到一个列的数据,因此它不必读取整个行。毕竟索引叶子节点存储了它们索引的数据;当能通过读取索引就可以得到想要的数据,那就不需要读取行了。一个索引包含了(或覆盖了)满足查询结果的数据就叫做覆盖索引。

基本语法

1、创建
	CREATE [UNIQUE ][Cluster] INDEX indexName ON mytable(columnname(length));
	ALTER Table 表名 ADD [UNIQUE ] INDEX [indexName] ON (columnname(length))
	PS1:CLUSTER关键字用于指定一个表的物理存储顺序,也称为聚集(cluster)。
	通过聚集,可以将具有相似数据的行存储在物理上紧密相邻的位置,以提高查询性能。
	在大多数关系型数据库管理系统(RDBMS)中,一个表通常只能建立一个聚集索引(Clustered Index)。
	聚集索引对表中的行进行物理存储上的排序,并决定了数据在磁盘上的存储顺序。
	聚集索引决定了数据在磁盘上的物理排序方式,因此一个表只能根据一个列或列组合进行排序。
	PS2:在索引时还可以排序:Create Unique Index Scno ON SC(Sno ASC,Cno DESC)
2、删除:DROP INDEX [indexName] ON mytable;
3、查看:SHOW INDEX FROM table_ name\G

#案例:
	ALTER TABLE tb_ name ADD PRIMARY KEY (column_ list): 该语句添加一个主键,这意味着索引值必须是唯一的,且不能为NULL.(主键这个约束就是索引)
	ALTER TABLE tb_ name ADD UNIQUE index_ name (column_ list): 这条语句创建索引的值必须是唯一的 (除了NULL外,NULL可能会出现多次)。(唯一键这个约束也是索引)
	ALTER TABLE tb_ name ADD INDEX index_ name (column_ list): 添加普通索引,索引值可出现多次。
	ALTER TABLE tbl _name ADD FULLEXT index_ name (column_ lst):该语 句指定了索引为FLLTEXT,用于全文索引。

索引结构和适用场景

结构:BTree索引,Hash索引,full-text全文索引|,R-Tree索引
场景:
1、主键自动建立唯-一索引
2、频繁作为查询条件的字段应该创建索引
3、查询中与其它表关联的字段,外键关系建立索引
4、表记录过少or频繁更新的字段不适合创建索引,因为每次更新不单单是更新了记录还会更新索引
5、注意,如果某个数据列包含许多重复的内容,为它建立索引就没有太大的实际效果。(查找结果太多)
5、Where条件里用不到的字段不创建索引
6、单键/组合索引的选择问题, (在高并发下倾向创建组合索引)
7、查询中排序的字段,排序字段若通过索引去访问将大提高排序速度
8、查询中统计或者分组字段

性能分析

MySq| Query Optimizer

MysqI专门负责优化SELECT语句的优化器模块,主要功能:通过计算分析系统中收集到的统计信息,为客户端请求的Query提供他认为最优的执行计划(他认为最优的数据检索方式,但不见得是DBA认为是最优的,这部分最耗费时间)

explain

使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或表结构的性能瓶颈。
在这里插入图片描述

语法:
	explain+SQL语句。得到信息如上表。末尾加\G可将横板改为竖版。
	id:
		id相同,执行顺序按tabler由上至下
		id不同,如果是子查询,id序号会递增,id值越大优先级越高,越先被执行
		id相同不同情况同时存在,优先级大的先走,平级顺序执行。
		id为null表示最后读取
	select_type:
		SIMPLE:简单的select查询,查询中不包含子查询或者UNION
		PRIMARY:查询中若包含任何复杂的子部分,最外层查询则被标记为
		SUBQUERY:在SELECT或WHERE列表中包含了子查询
		DERIUED:在FROM列表中包含的子查询被标记为DERIVED(衍生),MySQL会递归执行这些子查询,把结果放在临时表里。
		UNION:若第二个SELECT出现在UNION之后,则被标记为UNION;
若UNION包含在FROM子句的子查询中,外层SELECT将被标记为: DERIVED
		UNI0N RESULT:从UNION表获取结果的SELECT
	table:显示这一行数据是关于哪张表的
	type:
		all:全表扫描,性能最差
		index:Full Index Scan, index与ALL区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。(也就是说虽然all和Ihdex都是读全表,但index是从索引中读取的,而all是从硬盘中读的)
		range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引
一般就是在你的where语句中出现了between、<、>、in等的查询。这种范围扫描索引扫描比全表扫描要好,跟为它只需要开始于索引的某一点, 而结束语另一点,不用扫描全部索引。
		ref:非唯一性索引扫描,返回匹配某个单独值的所有行.本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体
		eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
		const:表示通过索引- .次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快如将主键置于where列表中,MySQL 就能将该查询转换为一一个赏量
		system:表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,这个也可以忽略不计,几乎不可能优化到这个程度。
		NULL
		从最好到最差依次是:system> const>eq ref> ref> range> index> ALL
	possible_key:显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用。
	Key:实际使用的索引。如果为NULL,则没有使用索引。
	查询中若使用了覆盖索引,则该索引仅出现在key列表中。(即possible_key没有key有)
	key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好。key_ len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_ len是 根据表定义计算而得,不是通过表内检索出的。
	ref:显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。
	row:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数。
	extra:包含不适合在其他列中显示但十分重要的额外信息
		Using filesort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序”。
		(出现这个很危险,性能很差,尽快优化)。
		Using temporary:使了用临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询grqup by。
		(出现这个更危险,性能很差,尽快优化)。
		Using index:表示相应的select操作中使用了覆盖索引(Covering Index), 避免访问了表的数据行,效率不错!
		如果同时出现usingwhere,表明索引被用来执行索引键值的查找;
		如果没有同时出现usingwhere,表明索引用来读取数据而非执行查找动作。
		Using where:表示使用了where过滤
		Using join buffer:表示使用了连接缓存
		impossible where:where子句的值总是false,不能用来获取任何元组
		select tables optimized away:在没有GROUPBY子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。
		distinct:优化distinct操作,在找到第--匹配的元组后即停止找同样值的动作>
总结:优化过程就是不断添加适合的索引,将type变成ref以上,extra不出现Using filesort和Using temporary

索引优化

单表优化

SELECT id,author. id FROM article WHERE category_ id = 1 AND comments > 1 ORDER BY views DESC LIMIT 1;
若是将category_ id,comments和views三者结合作为索引,根据Btree索引工作原理,comments>1作为范围无法利用这个索引进行搜索,因此有范围的不能作为索引,此时只能将category_ id,comments两者结合作为索引。
create index idx_ article _CCV on article(category. id ,views);

两表优化

SELECT * FROM class LEFT JOIN book ON class.card王book.card;
左连接LEFT JOIN条件用于确定如何从右表搜索行,左边一定都有,所以右边是我们的关键点,一定需要根据右表属性建立索引。
ALTER TABLE 'book ADD INDEX Y ( card");
同理右连接需要根据左表建立索引

三表优化

SELECT* FROM class LEFT JOIN book ON class.card=book.card LEFT JOIN phone ON book.card = phone.card;
被连接的两个属性建立索引。
ALTER TABLE 'phone' ADD INDEX z( 'card');
ALTER TABLE 'book' ADD INDEX Y ('card' );
尽可能减少Join语句中的NestedL oop的循环总次数;“ 永远用小结果集驱动大的结果集”。
优先优化NestedLoop的内层循环;
保证Join语句中被驱动表上Join条件字段已经被索引;
当无法保证被驱动表的Join条件字段被索引且内存资源充足的前提下,不要太吝惜JoinBuffer的设置; 

索引失效

原因

1、全值匹配
建立索引的属性按顺序都用到了。不会发生失效
2、最佳左前缀法则
    如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始关且不跳过索引中的列。
    eg.若是name,age,pos三个属性建立索引,则select必须包括name属性才能用到此索引。
    若只用到name和age,则只有name属性会用到索引,往后都是直接查找。
    若是and连接mysql底层会自动转换,可以不按顺序
3、不在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描。
4、存储引擎不能使用索引中范围条件右边的列
还是上面的例子,若是age使用判断条件age>25,则后面的pos则不能用到索引。
5、尽量使用覆盖索引(只访问索引的查询(索引列和查询列一致)),减少select *
6、mysql在使用不等于(!=或者<>)的时候无法使用索引会导致全表扫描
7、is null ,is not null也无法使用索引
8、like以通配符开头( %ab…')mysq|索引失效会变成全表扫描的操作
    因此%尽量不要放开头。实在要放必须用覆盖索引解决问题,需要查什么字段建立什么索引
9、字符串不加单引号索引失效口
    要符合规定的写
10、少用or,用它来连接时会索引失效

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1120592.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

shell的for循环与结构化

shell笔记 列表for循环不带列表for循环for循环举例1.例1 所有文件名大写替换为小写2. 例2 读取/etc/passwd文件&#xff0c;依次输出ip段3. 例3 读取/etc/hosts内容for循环&#xff0c;执行ping4. 例4 循环ip列表&#xff0c;输出对应编号5. 例5 批量添加用户 break1. 例1 brea…

python:遗传算法(Genetic Algorithm,GA)求解23个测试函数

一、遗传算法 遗传算法&#xff08;Genetic Algorithm&#xff0c;GA&#xff09;起源于对生物系统所进行的计算机模拟研究&#xff0c;是一种随机全局搜索优化方法&#xff0c;它模拟了自然选择和遗传中发生的复制、交叉(crossover)和变异(mutation)等现象&#xff0c;从任一…

css之Flex弹性布局

文章目录 &#x1f415;前言&#xff1a;&#x1f3e8;定义flex容器 display:flex&#x1f3e8;在flex容器中子组件进行排列&#x1fa82;行排列 flex-direction: row&#x1fa82;将行排列进行翻转排列 flex-direction: row-reverse&#x1f3c5;按列排列 flex-direction: col…

统计二进制中1的个数

写一个函数返回参数二进制中 1 的个数。 比如&#xff1a; 15 0000 1111 4 个 1 我们先引入一个容易理解的例子&#xff0c;怎么得到一个十进制的数各个位置上的数为多少&#xff1f; 这里我们以一个十进制的三位数 123为例&#xff0c;要想得到它的个位&#xff0c;十位&#…

kubernetes-Service

文章目录 1、前言2、基本语法2.1 Service yaml2.2 关键字段2.3 port、nodePort、targetPort、containerPort字段说明 3、Service 类型3.1 ClusterIP3.2 NodePort3.3 LoadBalancer3.4 ExternalName 4、无头服务&#xff08;Headless Services&#xff09;5、访问service参考 1、…

R文件详细介绍、瘦身方案和原理

文章目录 1. 背景2. R文件介绍2.1 R文件概念2.1.1 标识符是怎么与资源联系起来的&#xff1f; 2.2 R文件内容2.3 library module和aar的R文件内容生成规则2.4 是谁生成的R文件&#xff1f;2.5 打包之后的R文件2.6 R文件为啥大&#xff1f;这么多&#xff1f; 3. 为什么R文件可以…

RK356x U-Boot研究所(开发篇)5.1 启动SATA硬盘中的固件

平台U-Boot 版本Linux SDK 版本RK356x2017.09v1.2.3RK356x支持从SATA硬盘中启动固件,只要板卡中有预留这个接口即可。值得注意的是,这个固件不能从maskrom阶段就直接进行加载,需要从别的媒介启动(Flash、eMMC或者TF卡)后跑到U-Boot阶段,在这个U-Boot阶段再去加载SATA硬盘…

黑豹程序员-架构师学习路线图-百科:Java的第二春Spring框架

文章目录 1、 Spring的发展历史2、为什么Spring能霸屏&#xff1f;2.1、容器的设计2.2、通过四个策略2.3、三种方式 3、学习编程设计的典范 1、 Spring的发展历史 正当SUN公司的EJB在全球开始热炒时&#xff0c;正当程序员纷纷转型EJB开发时&#xff0c;正当程序员为跑通EJB程…

昇腾CANN 7.0 黑科技:大模型训练性能优化之道

目前&#xff0c;大模型凭借超强的学习能力&#xff0c;已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力。大模型经过海量数据的预训练&#xff0c;通常具有良好的通用性和泛化性。用户基于“大模型预训练微调”开发范式即可在实际业务场景取…

量子力学期末复习--1

量子力学解题技巧--1 基础知识 薛定谔方程 Ehrenfest 定理 不确定性原理&#xff1a;正则对易关系&#xff1a;自由粒子&#xff1a;对于自由粒子&#xff0c;分离变量解不代表物理上可实现的态。但其含时薛定谔方程的一般解仍旧是分离变量解的线性组合 典型题目 自由粒子…

029-第三代软件开发-加载本地字体库

第三代软件开发-加载本地字体库 文章目录 第三代软件开发-加载本地字体库项目介绍加载本地字体库 关键字&#xff1a; Qt、 Qml、 QFont、 QFontDatabase、 ttf 项目介绍 欢迎来到我们的 QML & C 项目&#xff01;这个项目结合了 QML&#xff08;Qt Meta-Object Langu…

深圳世有伯乐教育科技有限公司——LJ培训

今天来吐槽一波 深圳世有伯乐教育科技有限公司就是一个垃圾的培训机构&#xff0c;不&#xff0c;说是培训机构都是扭曲事实了&#xff0c;因为它根本就没有国家认可的办学许可证。光说没法让人信服&#xff0c;以下是企查查的截图&#xff1a; 世有伯乐的工商信息图片 续上&…

MPC预测控制概述和C++ 中的模型库

系列续篇&#xff1a; C 中的模型预测路径积分 (MPPI) 控制-CSDN博客 一、说明 以下文章描述了应用模型预测控制器的简单控制系统方法。本文讨论了这种类型的控制的基本机制&#xff0c;该机制适用于各种工程领域。 MPC 涉及对未来系统行为的预测&#xff08;由一组方程描述的模…

.net6部署到linux上(CentOS Linux 7)

目录 一、先在linux上配置.net环境 添加 Microsoft 包存储库 安装 SDK 安装运行时 检查 SDK 版本可使用终端查看当前安装的 .NET SDK 版本。 打开终端并运行以下命令。 二、创建.net6 mvc项目 并发布 创建项目 修改默认端口 打包发布到文件夹 运行打包项目查看项目是否…

华为OD机试 - 代表团坐车 - 动态规划(Java 2023 B卷 200分)

目录 专栏导读一、题目描述二、输入描述三、输出描述四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明 华为OD机试 2023B卷题库疯狂收录中&#xff0c;刷题点这里 专栏导读 本专栏收录于《华为OD机试&#xff08;JAVA&#xff09;真题&#xff08;A卷B卷&#…

【vue】vue本地储存、会话存储插件vue-ls的使用:

文章目录 一、安装&#xff1a;二、vue项目中使用&#xff1a;三、API说明&#xff1a; 一、安装&#xff1a; npm install vue-ls -S 或 yarn add vue-ls二、vue项目中使用&#xff1a; //在vue项目中的入口文件main.js中引入import Storage from vue-ls;options {namespac…

DNS和ICMP协议

目录 一、DNS协议 二、ICMP协议 1.ICMP协议 2.ping命令 在讲完了OSI模型每层协议的讲解后&#xff0c;还有一些协议我们需要再讲解一下。 一、DNS协议 DNS是一整套从域名映射到IP地址的系统&#xff0c;也叫做域名解析服务&#xff0c;端口号为53。 我们生活中访问网站都…

微软 Win11 Dev 预览版 Build 23570 发布,修复文件资源管理器卡顿问题

本心、输入输出、结果 文章目录 微软 Win11 Dev 预览版 Build 23570 发布&#xff0c;修复文件资源管理器卡顿问题前言微软 Win11 Dev 预览版 Build 23570 发布&#xff0c;修复文件资源管理器卡顿问题完整的更新日志[Windows 中的 Copilot][开始菜单][任务栏搜索][设置] 已知问…

P1950 长方形

题目&#xff1a; P1950 长方形 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 算法&#xff1a; dp动态规划 代码&#xff1a; #include<iostream> #include<string> typedef unsigned long long ull; const int N 1010; using namespace std;int r, c, i, …

kali安装nodejs、npm失败

更新apt-get再安装&#xff0c;更新时间比较久&#xff0c;看网速&#xff0c;中间有一些确认步骤 22 apt-get update23 apt-get upgrade24 apt-get install nodejs25 node26 npm27 apt-get install npm