一、全文索引
全文索引的目的是 通过关键字的匹配进行查询过滤,基于相似度的查询,而不是精确查询。
全文索引利用分词技术分析出文字中某关键字的频率和重要性,并按照一定的算法智能的筛选出我们想要的结果。
全文索引一般用于字符串中某关键字的查询,比如char、varchar、text
,也支持自然语言全文索引和布尔全文索引。
二、使用全文索引
1、创建worker表,并创建全文索引
CREATE TABLE `worker` (
`id` int NOT NULL,
`name` varchar(50) NOT NULL,
`age` int NOT NULL,
`address` varchar(100) NOT NULL,
PRIMARY KEY (`id`),
FULLTEXT INDEX `idx_fulltext`(`address`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
添加全文索引
alter table city add fulltext idx_fulltext(city)
删除全文索引
drop index idx_fulltext on city
2、插入10条记录
INSERT INTO worker (id, name, age, address) VALUES(1, '哪吒编程1', 18, '辽宁省大连市沙河口区中山路572号星海广场');
INSERT INTO worker (id, name, age, address) VALUES(2, '哪吒编程2', 19, '辽宁省大连市甘井子区高能街1号');
INSERT INTO worker (id, name, age, address) VALUES(3, '哪吒编程3', 20, '辽宁省大连市甘井子区燕邻街大连理工大学');
INSERT INTO worker (id, name, age, address) VALUES(4, '哪吒编程4', 21, '辽宁省大连市中山区五五路35号');
INSERT INTO worker (id, name, age, address) VALUES(5, '哪吒编程5', 22, '北京市东城区长安街');
INSERT INTO worker (id, name, age, address) VALUES(6, '哪吒编程6', 23, '上海市浦东新区世纪大道1号');
INSERT INTO worker (id, name, age, address) VALUES(7, '哪吒编程7', 24, '上海浦东陆家嘴,');
INSERT INTO worker (id, name, age, address) VALUES(8, '哪吒编程8', 25, '上海市浦东新区世纪大道105号');
INSERT INTO worker (id, name, age, address) VALUES(9, '哪吒编程9', 26, '广东省深圳市罗湖区建设路1003号');
INSERT INTO worker (id, name, age, address) VALUES(10, '哪吒编程10', 27, '广东省深圳市南山区中山路12号');
3、使用全文索引
select * from worker where match(address) against('广东省深圳市')
查看执行计划
- 如果您的表格中没有足够的数据(例如1行),则全文搜索将无效;
- MySQL InnoDB 最短索引字符串默认为4,也就是只有达到4个字符才会生效;
三、自然语言的全文索引
自然语言的搜索引擎将计算每一个文档对象和查询的相关度。
相关度是基于匹配的关键词个数、在文档中出现的次数。出现次数越少的关键字,匹配时的相关度就越高,相反,非常常见的单词将不会搜索这类词语。
函数match() 将返回关键词匹配的相关度,是一个浮点数字。在一个查询中使用两次 match() 函数不会有额外的消耗,MySQL 会自动识别并只进行一次搜索。不过你将 match() 函数放到 order by 子句中, MySQL 将会使用文件排序。
在match()中指定的列必须和全文索引中指定的列完全相同,否则就无法使用全文索引。
四、布尔全文索引
在布尔全文搜索中,用户可以在查询中自定义某个被搜索的词语的相关性。
当编写一个布尔搜索查询时,可以通过一些前缀修饰符来定制查询。
+
行记录中必须包含此关键字;-
行记录中必须不包含此关键字;>
提高该词的相关性,查询的结果靠前<
降低该词的相关性,查询的结果靠后*
星号 通配符,只能接在词后面
select * from worker where match(address) AGAINST('上海市*' in boolean mode);
MySQL进阶实战系列文章
MySQL进阶实战1,数据类型与三范式
MySQL进阶实战2,那些年学过的事务
MySQL进阶实战3,mysql索引详解,上篇
MySQL进阶实战4,那些年学过的索引,下篇
MySQL进阶实战5,为什么查询速度会慢
MySQL进阶实战6,缓存表、视图、计数器表
MySQL进阶实战7,查询的执行过程
MySQL进阶实战8,分区表详解
MySQL进阶实战9,InnoDB和MyISAM的数据分布对比
SQL性能优化的21个小技巧
mysql索引详解
MySql基础知识总结(SQL优化篇)
哪吒精品系列文章
Java学习路线总结,搬砖工逆袭Java架构师
10万字208道Java经典面试题总结(附答案)
Java基础教程系列