专属小彩蛋:前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站(前言 - 床长人工智能教程)
目录
一、索引介绍
二、性能分析
三、查询优化
一、索引介绍
(1)什么是mysql的索引
mysql官方对于索引的定义:索引是帮助mysql高效获取数据的数据结构。mysql在存储数据之外,数据库系统中还维护着满足特定查找算法的的数据结构,这些数据结构以某种引用(指向)表中的结构,这样我们就可以通过数据结构上实现的高级查找算法来快速找到我们想要的数据。而这种数据结构就是索引。
简单理解为“排好序的可以快速查找数据的数据结构”。
(2)索引数据结构
下图就是一种可能的二叉树的索引方式:
二叉树数据结构的弊端:当极端情况下,数据递增插入时,会一直向右插入,形成链表,查询效率会降低。
MYSQL中常用的索引数据结构有BTree索引(myisam普通索引)B+Tree索引(Innodb普通索引),hash索引(memory存储索引)等等。
(3)索引优势
提高数据检索的效率,降低数据库的IO成本。通过索引对数据进行排序,降低数据排序的成本,降低了cpu的消耗。
(4)索引劣势
索引实际上也是一张表,保存了主键和索引的字段,并且指向实体表的记录,所以索引也是需要占用空间的,在索引大大提高查询速度的同时,却会降低表的更新速度,在对表进行数据增删改的同时,mysql不仅要更新数据,还需要保存一下索引文件,每次更新添加了的索引列的字段,都会去调整因为更新带来的减值变化后的索引的信息。
(5)索引使用场景
哪些情况推荐建立索引?
- 主键自动建立唯一索引
- 频繁作为查询条件的字段应该创建索引(where后面的语句)
- 查询中与其他表关联的字段,外键关系建立索引
- 多字段查询下倾向创建组合索引
- 查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
- 查询中统计或者分组字段
哪些情况不推荐建立索引?
- 表记录太少
- 经常增删改的表
- where条件里用不到的字段不建立索引
(6)索引分类
- 主键索引(primary key)
- 唯一索引(unique)
- 单值索引(index)
- 复合索引
二、性能分析
(1)mysql常见瓶颈
sql中对大量数据进行比较,关联,排序,分组时cpu的瓶颈。
实例内存满足不了缓存数据或排序等需要,导致产生大量的物理IO,查询数据时扫描过多数据行,导致查询效率低。
(2)Explain 执行计划
使用Explain关键字可以模拟优化器执行sql查询语句,从而知道mysql是如何处理sql语句的,可以用来分析查询语句或是表的结构的性能瓶颈。其作用:
- 表的读取顺序
- 哪些索引可以使用
- 数据读取操作的操作类型
- 哪些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
Explain 关键字使用起来比较简单: explain + SQL语句
如下所示,我们查看一个多表根据id关联的sql语句执行计划。
(3)Explain 重要字段名
id:select查询的序列号,表示查询中执行select子句或操作表的顺序。
- id相同时,执行顺序由上至下。
- id不同,如果是子查询,id的序号会递增,id值越大优先级越高,则先被执行。
- id相同和不同都存在时,id相同的可以理解为一组,从上往下顺序执行,所有组中,id值越大,优先级越高越先执行。
select_type:询的类型,常见值有:
- SIMPLE: 简单的select查询,查询中不包含子查询或union。
- PRIMARY: 查询中若包含任何复杂的子部分,最外层查询则被标记为Primary。
- DERIVED: 在FROM列表中包含的子查询被标记为DERIVED(衍生),mysql会递归执行这些子查询,把结果放在临时表里。
- SUBQUERY: 在select或where列表中包含了子查询。
table:显示这一行的数据是关于哪张表的。
type:访问类型排序
- System:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现,这个也可以忽略不计。示例:
- Const:表示通过索引一次就找到了,const用于比较primary key或者unique索引,因为只匹配了一行数据,所以很快,如将主键置于where列表中,mysql就能将该查询转换为一个常量。示例:
- eq_ref: 唯一性索引扫描,对于每个索引建,表中只有一条记录与之匹配,常见于主键或者唯一索引扫描, 常用于联表查询,示例:
- ref:非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以它应该属于查找和扫描的混合体。示例:
- range:只检索给定范围的行,使用一个索引来选择行,key列显示使用了哪个索引一般就在你的where语句中出现了between,<,>,in等的查询这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,结束于另一点,不用扫描全部索引。示例:
- index: full index scan,index与all 区别为index类型只遍历索引树,这通常比all快,因为索引文件通常比数据文件小,也就是说虽然all和index都是读全表,但index是从索引中读取的,而all是从硬盘中读取的。示例:由于t1表只有id和content两个字段,并且id,content 都建立了索引,所以直接从索引文件读取数据。
- all: full table scan,将遍历全表来找到匹配的行。
从最好到最差依次为:system> const > eq_ref> ref> range> index> all 。 一般来说, 最好保证查询能达到range级别,最好能达到ref级别以上。
possible_keys: 显示可能应用在这张表中的索引,一个或多个,查询涉及到的字段上如果存在索引,则该索引将会被列出来,但不一定会被查询到实际使用上。
key: 查询中实际使用的索引,如果是null,则没有使用索引。
当 查询条件改为 is not null 时,索引失效,则possible_keys 和 key 就不一致了。
ref :显示索引的哪一列被使用了,哪些列或常量被用于查找索引列上的值。
rows:显示mysql认为它执行查询时必须检查的行数,一般越少越好。
- extra: 一些常见的重要的额外信息。
- Using filesort:mysql 无法利用索引完成的排序操作称为“文件排序”。(代表排序字段没有使用索引,效率较低)
- Using temporary: mysql在对查询结果排序时使用临时表,常见于排序order by 和分组查询 group by。
- Using index:表示索引被用来执行索引键值的查找,避免访问了表的数据行,效率不错(代表查询的字段都是从索引文件获取到的)示例:从索引文件获取
未从索引文件获取
- Using where:表示使用了where过滤。
三、查询优化
(1)索引失效
专属小彩蛋:前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站(前言 - 床长人工智能教程)