什么是正排索引?
如下图,有一张商品表(tb_goods):
对于mysql数据库来说,肯定会给“id”创建主键索引,然后根据“id”来查询对应的商品信息,而这种情况就被称为“正排索引”
现在有一个需求:
查询商品中包含“手机”关键字的商品信息
1、给“title”字段创建普通索引,提高查询效率
主键索引:全表只能有一个
唯一索引:全表可以有多个,但是此字段必须具有唯一性
普通索引:仅仅提高查询效率
2、编写sql语句
select id,title,price from tb_goods where title like '%手机%';
这里注意,“%”放在关键字前会引发索引失效,但是此需求必须要在字段前后加上“%”
3、根据第二步编写的sql去tb_goods表查询
此过程会“全表扫描”,如果表的数据很多,效率就会很低很低
因此就产生了“倒排索引”,来提高查询效率
4、把数据存入结果集
Elasticsearch倒排索引
Elasticsearch就是采用倒排索引来查询数据,它会将商品表(tb_goods)转化成一张包含“term”字段和“document id”字段的一张表。
文档(document):每条数据就是一个文档
词条(term):文档按照语义分成的词语
现在有一个需求:
基于Elasticsearch搜索“华为手机”
1、分词
将“华为手机”进行分词,得到:“华为”、“手机”两个词条(term)
2、去词条列表查询文档id
如上图,得到每个词条所在的文档id:华为:2,3 手机:1,2
具体如下图:
以上就是Elasticsearch的倒排索引,根据分词后的词条,得到对应的文档id
3、根据文档id查询文档
得到id为1,2,3的文档
4、存入结果集