MySQL中索引详解

news2024/11/16 22:41:59

目录

一.介绍

 二.索引分类

三.MySQL的索引

介绍

普通索引

唯一索引

 注意

主键索引

组合索引

 全文索引

 空间索引

删除索引

 四.索引的原理

概述

 Hash算法

二叉树

平衡二叉树

BTREE树

 MyISAM引擎使用B+Tree

 六.索引的特点

优点

缺点

创建索引原则


 

一.介绍

索引是通过某种算法,构建出一个数据模型,用于快速找出在某个列中有一特定值的行,不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多,如果表中查询的列有一个索引,MySQL能够快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。

索引类似一本书的目录,比如要查找'student'这个单词,可以先找到s开头的页然后向后查找,这个就类似索引。

 二.索引分类

索引是存储引擎用来快速查找记录的一种数据结构,按照实现的方式类分,主要有Hash索引和B+Tree索引

Hash索引

 B+Tree索引

三.MySQL的索引

介绍

  • 单列索引:一个索引只包含单个列,但一个表中可以有多个单列索引;
  • 普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。

普通索引

格式

 这样的话,当我用name列去查询就会更快

 还有以下两种方法创建索引

-- 方式2:直接创建
create index index_gender on stuent(gender);
-- 方式3:修改表结构
alter table student add index index_gender(gender);

唯一索引

介绍

唯一索引与前面的普通索引类似,不同的就是:索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。它有以下几种创建方式:

 注意

unique是唯一约束,这里是唯一索引,严格来说这两个是不一样的

  1. 概念上不同,约束是为了保证数据的完整性,索引是为了辅助查询;
  2. 创建唯一约束时,会自动的创建唯─索引;
  3. 在理论上,不—样,在实际使用时,基本没有区别。

关于第二条,MySQL中唯一约束是通过唯一索引实现的,为了保证没有重复值,在插入新记录时会再检索一遍,怎样检索快,当然是建索引了,所以,在创建唯—约束的时候就创建了唯一索引。

演示

use world;
drop table test_table ;
create table test_table(
	id int primary key,
	name varchar(20) unique,
	del varchar(20)
);

insert into test_table values(1,'张三','123');
insert into test_table values(2,null,'223');
insert into test_table values(3,null,'333');
insert into test_table values(4,null,'123');


create table test_table2(
	id int primary key,
	name varchar(20),
	del varchar(20),
	unique index index_name(name)
);

insert into test_table2 values(1,'张三','123');
insert into test_table2 values(2,null,'223');
insert into test_table2 values(3,null,'333');
insert into test_table2 values(4,null,'123');

上面两个表,第一个是用唯一约束,第二个是用唯一索引

 可以看到test_table这个表我只用了唯一约束它也会自动给其添加唯一索引,且不论是唯一约束还是唯一索引都可以有多个空值。

主键索引

介绍

每张表一般都会有自己的主键,当我们在创建表时,MySQL会自动在主键列上建立一个索引,这就是主键索引。主键是具有唯一性并且不允许为NULL,所以他是一种特殊的唯一索引。

组合索引

介绍

  • 组合索引也叫复合索引,指的是我们在建立索引的时候使用多个字段,例如同时使用身份证和手机号建立索引,同样的可以建立为普通索引或者是唯一索引。
  • 复合索引的使用复合最左原则。

格式

 操作

组合索引中也有唯一索引,如图:

 全文索引

概述

  • 全文索引的关键字是fulltext
  • 全文索引主要用来查找文本中的关键字,而不是直接与索引中的值相比较,它更像是一个搜索引擎,基于相似度的查询,而不是简单的where语句的参数匹配。
  • 用like + %就可以实现模糊匹配了,为什么还要全文索引? like + %在文本比较少时是合适的,但是对于大量的文本数据检索,是不可想象的。全文索引在大量的数据面前,能比 like+ %快N倍,速度不是一个数量级,但是全文索引可能存在精度问题。

全文索引的版本、存储引擎、数据类型的支持情况:

  • MySQL 5.6以前的版本,只有MylSAM存储引擎支持全文索引;
  • MySQL 5.6及以后的版本,MyISAM和InnoDB存储引擎均支持全文索引;
  • 只有字段的数据类型为char、varchar、text及其系列才可以建全文索引;
  • 在数据量较大时候,现将数据放入一个没有全局索引的表中,然后再用create index创建fultext索引,要比先为一张表建立fulltext然后再将数据写入的速度快很多;
  • 测试或使用全文索引时,要先看一下自己的MysQL版本、存储引擎和数据类型是否支持全文索引。

MySQL中的全文索引,有两个变量,最小搜索长度和最大搜索长度,对于长度小于最小搜索长度和大于最大搜索长度的词语,都不会被索引。通俗点就是说,想对一个词语使用全文索引搜索,那么这个词语的长度必须在以上两个变量的区间内。这两个的默认值可以使用以下命令查看:

 

 操作

数据准备

use world;
create table t_article(
	id int primary key auto_increment,
	title varchar(255),
	content varchar(1000)
	-- fulltext (content)创建全文检索,但不建议这时创建
);

insert into t_article values(null,'There are moments in life','when you miss someone so much that you just want');
insert into t_article values(null,'to pick them from','your dreams and hug them for real! Dream what you');
insert into t_article values(null,'go where you want to','what you want to be,because you have only one');
insert into t_article values(null,'May you have enough happiness',',enough sorrow to keep you human,enough hope to');
insert into t_article values(null,' The happiest of people','the most of everything that comes along their way');
insert into t_article values(null,'who have touched ','The brightest future will always be ');
insert into t_article values(null,'When you were born','Please send this message to those people who ');

创建表的时候就添加全文索引效率会低,不推荐

创建全文索引

 使用全文索引

使用全文索引
和常用的模糊匹配使用like + %不同,全文索引有自己的语法格式,使用match和against 关键字,格式:

 

use world;
create table t_article(
	id int primary key auto_increment,
	title varchar(255),
	content varchar(1000)
	-- fulltext (content)创建全文检索,但不建议这时创建
);

insert into t_article values(null,'There are moments in life','when you miss someone so much that you just want');
insert into t_article values(null,'to pick them from','your dreams and hug them for real! Dream what you');
insert into t_article values(null,'go where you want to','what you want to be,because you have only one');
insert into t_article values(null,'May you have enough happiness',',enough sorrow to keep you human,enough hope to');
insert into t_article values(null,' The happiest of people','the most of everything that comes along their way');
insert into t_article values(null,'who have touched ','The brightest future will always be ');
insert into t_article values(null,'When you were born','Please send this message to those people who ');

-- 修改表结构添加全文索引
alter table t_article add fulltext index index_content(content); -- 这里只用fulltext也可以
-- 直接添加全文索引
create fulltext index index_content on t_article(content);


-- 使用全文索引
select * from t_article where match (content) against('yo');-- 查到是空表,是因为最小长度是3
select * from t_article where match (content) against('you');
select * from t_article where match (content) against('so');-- 查到是空表,是因为最小长度是3


select * from t_article where content like '%you%';-- 跟使用全文索引结果一致,只是输出顺序不一样
select * from t_article where content like '%yo%';-- 跟上句结果一样
select * from t_article where content like '%so%';-- 有结果

 空间索引

介绍

  • MySQL在5.7之后的版本支持了空间索引,而且支持OpenGIs几何数据模型
  • 空间索引是对空间数据类型的字段建立的索引,MYSQL中的空间数据类型有4种,分别是GEOMETRY、POINT、LINESTRING、POLYGON。
  • MYSQL使用SPATIAL关键字进行扩展,使得能够用于创建正规索引类型的语法创建空间索引。
  • 创建空间索引的列,必须将其声明为NOT NULL。
  • 空间索引一般是用的比较少,了解即可。

 操作

类型含义说明
Geometry空间数据任何一种空间类型
Point坐标值
LineString线由一系列点连接而成
Polygon多边形由多条线组成

删除索引

格式

操作

 

 四.索引的原理

概述

  • 一般来说,索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储的磁盘上。
  • 这样的话,索引查找过程中就要产生磁盘/o消耗,相对于内存存取,l/o存取的消耗要高几个数量级,所以评价一个数据结构作为索引的优劣最重要的指标就是在查找过程中磁盘I/o操作次数的渐进复杂度。
  • 换句话说,索引的结构组织要尽量减少查找过程中磁盘l/o的存取次数。

 Hash算法

优点:通过字段的值计算的hash值,定位数据非常快。
缺点:不能进行范围查找,因为散列表中的值是无序的,无法进行大小的比较。

二叉树

特性:分为左子树、右子树和根节点,左子树比根节点值要小,右子树比根节点值要大
缺点:有可能产生不平衡类似于链表的结构。

平衡二叉树

 

 特点:
a、它的左子树和右子树都是平衡二叉树
b、左子树比中间小,右子树比中间值
c、左子树和右子树的深度之差的绝对值不超过1

缺点:
a、插入操作需要旋转
b、支持范围查询,但回旋查询效率较低,比如要查找大于8的,会回旋到父节点7、10。
c、如果存放几百条数据的情况下,树高度越高,查询效率会越慢

BTREE树

目前大部分数据库系统及文件系统都采用B-Tree或其变种B+Tree作为索引结构,Btree结构可以有效的解决之前的相关算法遇到的问题。

 MyISAM引擎使用B+Tree

MylSAM引擎使用B+Tree作为索引结构,叶节点的data域存放的是数据记录的地址。

 六.索引的特点

优点

  1. 大大加快数据的查询速度
  2. 使用分组和排序进行数据查询时,可以显著减少查询时分组和排序的时间
  3. 创建唯一索引,能够保证数据库表中每一行数据的唯一性
  4. 在实现数据的参考完整性方面,可以加速表和表之间的连接

缺点

  1. 创建索引和维护索引需要消耗时间,并且随着数据量的增加,时间也会增加
  2. 索引需要占据磁盘空间
  3. 对数据表中的数据进行增加,修改,删除时,索引也要动态的维护,降低了维护的速度

创建索引原则

  1. 更新频繁的列不应设置索引
  2. 数据量小的表不要使用索引(毕竟总共2页的文档,还要目录吗?)
  3. 重复数据多的字段不应设为索引(比如性别,只有男和女,一般来说:重复的数据超过百分之15就不该建索引)
  4. 首先应该考虑对where和 order by涉及的列上建立索引

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/349396.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[翻译]GPDB中的文件空间与表空间

GPDB中的文件空间与表空间GreenPlum是一个快速、灵活、纯软件的分析数据处理引擎,具有一些工具和特性可以充分利用任意个数硬件或者虚拟环境用来部署集群。这里讨论的一个特性是使用文件空间将数据加载和查询活动与底层的IO卷匹配。一旦在集群中创建了一个物理文件空…

【C++】类与对象(三) 运算符重载 赋值重载 取地址及const取地址操作符重载

前言 本章我们接替前一章继续深入理解类的默认成员函数,赋值重载,取地址重载,及const取地址操作符重载 但是在讲剩下的三个默认成员函数之前,我们要先来了解运算符重载,因为赋值重载,取地址重载&#xff0c…

10分钟学会python对接【OpenAI API篇】

今天学习 OpenAI API,你将能够访问 OpenAI 的强大模型,例如用于自然语言的 GPT-3、用于将自然语言翻译为代码的 Codex 以及用于创建和编辑原始图像的 DALL-E。 首先获取生成 API 密钥 在我们开始使用 OpenAI API 之前,我们需要登录我们的 Op…

Linux 定时任务调度(crontab)整理,太实用了!

crontab命令用于设置周期性被执行的指令。该命令从标准输入设备读取指令,并将其存放于“crontab”文件中,以供之后读取和执行。可以使用crontab定时处理离线任务,比如每天凌晨2点更新数据等,经常用于系统任务调度。服务启动和关闭…

AWS攻略——创建VPC

文章目录创建一个可以外网访问的VPCCIDR主路由表DestinationTarget主网络ACL入站规则出站规则子网创建EC2测试连接创建互联网网关(IGW)编辑路由表参考资料在 《AWS攻略——VPC初识》一文中,我们在AWS默认的VPC下部署了一台可以SSH访问的机器实…

WRAN翻译

基于小波的图像超分辨残差注意力网络 Wavelet-based residual attention network for image super-resolution 代码: https://github.com/xueshengke/WRANSR-keras 摘要: 图像超分辨率技术是图像处理和计算机视觉领域的一项基础技术。近年来&#xff0c…

【流辰信息技术】做好数据管理,赋能行业全速提升产业效能

在经济快速发展的当下,正是各行各业大展拳脚,全力以赴奔赴产能提升的好契机。做好企业,不仅要有一颗发展雄心,而且还要学会运用正确的技术和发展战略,推动企业向前进。流辰信息技术是低代码开发领域里的服务商&#xf…

自动化测试高频面试题(含答案)

Hello,你们的好朋友来了!今天猜猜我给大家带来点啥干货呢?最近很多小伙伴出去面试的时候经常会被问到跟自动化测试相关的面试题。所以,今天特意给大家整理了一些经常被公司问到的自动化测试相关的面试题。停,咱先收藏起…

「团队管理」前端开发者如何规划并构建UCD的中长期前端开发能力与团队

文章目录 前言一、个人规划1.1 技能和知识的提升1.2 用户研究和用户体验1.3 团队协作能力1.4 项目管理和交付能力1.5 技术创新和开发效率二、构建UCD团队2.1 人才招聘和培养2.2 角色定义和分工2.3 团队文化和价值观前言 UCD(用户中心设计)是一种基于用户需求的设计方法论,将…

五千字总结一枚测试妹纸不平凡的2022

大家好,我是美团程序员,一个混过大厂,待过创业公司,爱给开发同学提Bug的测试妹纸一枚。2022年,是工作的第六年,也是具有突破性成长的一年,一直挺喜欢六这个数字,果然不负期望&#x…

C控制语句(if,switch,goto)

一.if 1.if循环语句格式 if(expression1) statement1 else if(expression2) statement2 else if(expression3) statement3 . . . else statement(n) else if 可以使用也可以不是用。 这里我们用一个例子进行讲解 2.if else 注意事项 If else if else之间只允许有一条语句&…

Shell - 随时启动 + 固定时间启动脚本

一.引言 有一个线上任务需要在每 10 min内的 5min 后执行,例如 5:10、15:10 ...、55: 10,正常情况下需要查看 Clock Time,待时间到达 5min 后手动启动,下面实现随时启动脚本,定时在 x5:10 点执行。 二.实现 A.固定 5…

【第0天】SQL快速入门-了解MySQL存储引擎(SQL 小虚竹)

回城传送–》《32天SQL筑基》 文章目录零、前言一、什么是数据库引擎二、MYSQL中有哪些数据库引擎2.1、MyISAM2.2、Memoey2.3、InnoDB三、MyISAM和InnoDB的区别3.1、MYSQL版本支持默认引擎不同MyISAMInnoDB3.2、数据的存储结构不同MyISAMInnoDB3.3、存储空间的消耗不同MyISAMIn…

新闻稿写作指南

当你想要传达一则新闻,写一份新闻稿是非常必要的。新闻稿的目的是让读者了解某个事件或信息,以及提供与之相关的背景信息和重要细节。以下是新闻稿的写作指南,帮助你写出一份清晰、简洁、有价值的新闻稿。1、选择一个有新闻价值的主题你的新闻…

MySQL参数优化之join_buffer_size

1.查看当前值 show variables like %join_buffer_size%mysql默认该设置为128 或 256 或512k,各个版本有所出入 2.作用范围 在mysql中表和表进行join时候,无论是两个表之间还是多个表之间,join的情况大致分为下面几种情况 join key 有索引 …

leaflet 设置一个图层或者多个图层的透明度(075)

第075个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+leaflet中如何设置一个图层或者多个图层的透明度,利用了layer的setOpacity方法。 直接复制下面的 vue+leaflet源代码,操作2分钟即可运行实现效果 文章目录 示例效果配置方式示例源代码(共137行)相关API参考:专…

Windows保护机制GS:原理及SEH异常处理突破

前言 本次文章只用于技术讨论,学习,切勿用于非法用途,用于非法用途与本人无关! 所有环境均为本地环境分析,且在本机进行学习。 GS机制并没有对SEH提供保护,换句话说我们可以通过攻击程序的异常处理达到绕…

【java 高并发编程之JUC】2w字带你JUC从入门到精通

点击查看脑图目录地址,实时更新 1 什么是 JUC 1.1 JUC 简介 在 Java 中,线程部分是一个重点,本篇文章说的 JUC 也是关于线程的。JUC 就是 java.util .concurrent 工具包的简称。这是一个处理线程的工具包,JDK 1.5 开始出现的。 1.2 进程与…

Leetcode_part1

Content [1. Two Sum](https://leetcode.com/problems/two-sum/)Solution 1Solution 2[递归: 17. 电话号码的字母组合](https://leetcode.com/problems/letter-combinations-of-a-phone-number/)Solution 1 暴力Soulution 2 回溯Solution 3 队列[18. 四数之和](https://leetcod…

app截图+识别截图中的文字

在自动化测试的过程中,我们会经常遇到需要进行文字识别的场景,比如 识别验证码、识别截图中的文字、读取截图中的数值 等等,遇到这些情况时我们可以如何处理呢? 本机要有PaddleOCR环境,PaddleOCR可参考我另一篇 Padd…