文章目录
- 索引结构问题
- 聚簇索引与非聚簇索引
- 索引操作
- 创建主键索引
- 唯一索引创建
- 普通索引创建
- 全文索引创建
- 删除索引
- 查询索引
- 索引创建原则
索引结构问题
- InnoDB 在建立索引结构来管理数据的时候,其他数据结构为何不行
链表:线性遍历,在效率上是不合适的
二叉搜索树:从根节点开始向下遍历时可能会遇到很多节点,这也意味着要进行多次的IO;同时还存在退化问题,可能退化成为线性结构,此时效率不高
AVL &&红黑树:虽然是平衡或者近似平衡,但是毕竟是二叉结构,相比较多阶B+,意味着树整体过高,大家都是自顶向下找,层高越低,意味着系统与硬盘更少的IO Page交互。虽然你很秀,但是有更秀的。
Hash:时间效率是O(1)的,理论上是非常合适的,搜索效率确实快;官方的索引实现方式中, MySQL 是支持HASH的,不过 InnoDB 和 MyISAM 并不支持.Hash跟进其算法特征,决定了虽然有时候也很快(O(1)),不过,在面对
范围查找就明显不行
,另外还有其他差别,可以自己了解一下。
- B树:最值得比较的是 InnoDB 为何使用B+树而不用B树作为底层索引
B+树
选择B+树:非叶子节点不存储data,数据全在叶子节点,这样一个节点就可以存储更多的key。可以使得树更矮,所以IO操作次数更少。
叶子节点相连,更便于进行范围查找B树
B树节点,既有数据,又有Page指针,而B+,只有叶子节点有数据,其他目录页,只有键值和Page指针
B+叶子节点,全部相连,而B没有
聚簇索引与非聚簇索引
MyISAM 存储引擎-主键索引
MyISAM 引擎同样使用B+树作为索引结果,叶节点的data域存放的是数据记录的地址。其中, MyISAM 最大的特点是,将索引Page和数据Page分离,也就是叶子节点没有数据,只有对应数据的地址。
相较于 InnoDB 索引, InnoDB 是将索引和数据放在一起的。MyISAM 这种用户数据与索引数据分离的索引方案,叫做
非聚簇索引
InnoDB 这种用户数据与索引数据在一起索引方案,叫做
聚簇索引
- 创建InnoDB的表,聚簇索引
mysql> create table test1(
-> id int primary key,
-> name varchar(20) not null
-> )engine=innodb;
Query OK, 0 rows affected (0.21 sec)
查看对应的文件如下:
- 创建myisam的表,非聚簇索引
mysql> create table test2(
-> id int primary key,
-> name varchar(20) not null
-> )engine=myisam;
Query OK, 0 rows affected (0.02 sec)
当然, MySQL 除了默认会建立主键索引外,我们用户也有可能建立按照其他列信息建立的索引,一般这种索引可以叫做辅助(普通)索引。对于 MyISAM ,建立辅助(普通)索引和主键索引没有差别,无非就是主键不能重复,而非主键可重复。
下图就是基于 MyISAM 的 Col2 建立的索引,和主键索引没有差别
索引的结构就是B+结构
InnoDB 除了主键索引,用户也会建立辅助(普通)索引,我们以上表中的 Col3 建立对应的辅助索引如下图:
可以看到, InnoDB 的非主键索引中叶子节点并没有数据,而只有对应记录的key值。所以通过辅助(普通)索引,找到目标记录,需要两遍索引:首先检索辅助索引获得主键,然后用主键到主索引中检索获得记录。这种过程,就叫做回表查询。
InnoDB 针对这种辅助(普通)索引的场景,不给叶子节点也附上数据,是原因就是太浪费空间了。
索引操作
创建主键索引
第一种方式:直接指明主键
-- 在创建表的时候,直接在字段名后指定 primary key
create table user1(id int primary key, name varchar(30));
这种在创建表时直接使用,无需多说
第二种方式:与第一种方式类似
-- 在创建表的最后,指定某列或某几列为主键索引
create table user2(id int, name varchar(30), primary key(id));
第三种方式:添加主键
create table user3(id int,name varchar(30));
-- 创建表以后添加主键
alter table user3 add primary key(id);
举个例子,现在表test1是没有主键索引的,我们用alter table 表名 add primary key(id)添加主键索引,结果如下:
查看索引:我们可以清楚地看到Key_name:PRIMARY
主键索引的特点
:
一个表中,最多有一个主键索引,当然可以使符合主键
主键索引的效率高(主键不可重复)
创建主键索引的列,它的值不能为null,且不能重复
主键索引的列基本上是int
唯一索引创建
第一种方式:创建表时直接在某列后直接指明unique的唯一属性
-- 在表定义时,在某列后直接指定unique唯一属性。
create table user4(id int primary key, name varchar(30) unique);
第二种方式:与第一种方式其实是类似的
-- 创建表时,在表的后面指定某列或某几列为unique
create table user5(id int primary key, name varchar(30), unique(name));
前面这两种都是在创建表的时候直接使用的。
第三种方式:表创建完毕之后添加唯一索引
这一种是表创建完毕之后,还想进行添加唯一索引的做法,如下:
create table user6(id int primary key, name varchar(30));
alter table user6 add unique(name);
举个例子:如为表test1添加唯一索引,alter table test1 add unique(name):
普通索引创建
第一种方式:在表的定义最后指定某列为索引
create table user8(id int primary key,
name varchar(20),
email varchar(30),
index(name)
);
第二种方式:创建一张表,后指定某列为普通索引
alter table test1 add index(name);
第三种方式:-- 创建一个索引名为 myindex 的索引 :
create index myindex on test1(name);
索引不需要了自然可以删除:如alter table test1 drop index myindex;
全文索引创建
当对文章字段或有大量文字的字段进行检索时,想找到某一列当中的某些字段时,不仅仅只是一条记录,会使用到全文索引。
MySQL提供全文索引机制,但是有要求,要求表的存储引擎必须是MyISAM,而且默认的全文索引支持英文,不支持中文。如果对中文进行全文检索,可以使用sphinx的中文版(coreseek)
- 准备工作
创建一张引擎为MyISAM的表articles,其中指定了title和body为全文索引,如下所示:
CREATE TABLE articles (
id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
title VARCHAR(200),
body TEXT,
FULLTEXT (title,body)
)engine=MyISAM;
同时插入一些数据:
INSERT INTO articles (title,body) VALUES
('MySQL Tutorial','DBMS stands for DataBase ...'),
('How To Use MySQL Well','After you went through a ...'),
('Optimizing MySQL','In this tutorial we will show ...'),
('1001 MySQL Tricks','1. Never run mysqld as root. 2. ...'),
('MySQL vs. YourSQL','In the following database comparison ...'),
('MySQL Security','When configured properly, MySQL ...');
- 查询有没有database数据
如果使用如下查询方式,虽然查询出数据,但是没有使用到全文索引:
select * from articles where body like '%database%';
可以用explain工具看一下,是否使用到索引:
explain select * from articles where body like '%database%'\G
- 使用全文索引
select * from articles where match(title,body) against('database');
删除索引
第一种方法-删除主键索引:
alter table 表名 drop primary key;
举个例子:
第二种方法-其他索引的删除: alter table 表名 drop index 索引名; 索引名就是show keysfrom 表名中的 Key_name 字段
比如下面中删除表test1中的唯一索引name:alter table test1 drop index name;
第三种方法方法: drop index 索引名 on 表名
举个例子:对表articles的索引title进行删除
drop index title on articles;
查询索引
第一种方法: show keys from 表名
第二种方法: show index from 表名; 这个比较常用把:
第三种方法(信息比较简略): desc 表名;
索引创建原则
比较频繁作为查询条件的字段应该创建索引
唯一性太差的字段不适合单独创建索引,即使频繁作为查询条件
更新非常频繁的字段不适合作创建索引
不会出现在where子句中的字段不该创建索引