ElasticSearch-倒排索引

news2026/2/14 11:16:54

文章目录

一、mysql数据库存在的问题
- 1.1 模糊查询索引失效
- 1.2 不能分词查询
二、倒排索引

一、mysql数据库存在的问题

在这里插入图片描述

1.1 模糊查询索引失效

假设要查询上图中title中包含"手机"的信息，那么sql语句是这样的

SELECT * FROM goods WHERE title LIKE '%手机%';

如果使用模糊查询，左边有通配符，不会走索引，会全表扫描，性能低

1.2 不能分词查询

假设上表查询title检索内容为"我要买一部华为手机",无论sql语句怎么模糊匹配都只会查询到包含这整条句子的title，显然数据库中是不存在的。
关系型数据库提供的查询，功能太弱
所以需要用到ES的倒排索引，以关键词为索引库，而关键词又是对原有数据内容拆分出来的，比如"我要买一部华为手机"中华为和手机关键词拆分出来作为索引查询就会灵活很多。

二、倒排索引

就像使用新华字典查找汉字，先找到汉字的偏旁部首，再根据偏旁部首对应的目录（索引）找到目标汉字。

正排索引：是以文档对象的唯一 ID 作为索引，以文档内容作为记录的结构。
倒排索引：Inverted index，指的是将文档内容中的单词作为索引，将包含该词的文档 ID 作为记录的结构。

ES倒排索引样例：

假设文档0(编号0)： we like java java java
假设文档1(编号1)： we like lucene lucene lucene

建立倒排索引的流程
1.首先对所有数据的内容进行拆分（分词），拆分成唯一的一个个词语（词条Term）。
2.然后建立词条和每条数据的对应关系（词条在文档出现的位置下标，出现频率）

（Term 词条）	(Doc ID，Freq 频率)	（Pos 位置）
we	(0,1) (1,1)	(0,0)(1,0)
like	(0,1) (1,1)	(0,1)(1,1)
java	(0,3)	(2,3,4)
lucene	(1,3)	(2,3,4)

假设文档2(编号1)：java java java we like

（Term 词条）	(Doc ID，Freq 频率)	（Pos 位置）
we	(0,1) (1,1)	(0,0)(1,3)
like	(0,1) (1,1)	(0,1)(1,4)
java	(0,3) (1,3)	(0,2,3,4) (1,0,1,2)
lucene	(1,3)	(2,3,4)

假设只有1个文档有，Pos位置第一位就不需要标识是几号文档，假设是有多个文档有，Pos位置的第一位默认就是文档编号

倒排索引：将每条数据中的内容进行分词，形成词条。然后记录词条和数据的唯一标识（id）的对应关系，形成的产物。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/129364.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

功能更新 | 身份认证增强安全配置

功能更新 | 身份认证增强安全配置

在开始本文前，先给大家出个解谜题，密码在下一段文字里，由 9 个字组成，开动你的脑筋吧，我们在本文结尾会揭晓答案： 2022 年马上就要结束了，机遇与挑战并存的一年。昨天，北京郊区一些地…

阅读更多...

企业电子招标采购系统源码及功能清单

企业电子招标采购系统源码及功能清单

一、立项管理 1、招标立项申请功能点：招标类项目立项申请入口，用户可以保存为草稿，提交。 2、非招标立项申请功能点：非招标立项申请入口、用户可以保存为草稿、提交。 3、采购立项列表功能点：对草稿进行编…

阅读更多...

从卖货到广告，跨境电商解锁变现新模式

从卖货到广告，跨境电商解锁变现新模式

一、经济全球化背景下，跨境电商作为外贸发展的新模式，可谓势头正盛。而 2022 年，在汇率波动、欧美通胀等不可抗逆因素的影响下，跨境电商大环境也面临着诸多挑战。对于消费者而言，全球通货膨胀持续走高，物价…

阅读更多...

List、List＜Object＞、List＜?＞

List、List＜Object＞、List＜?＞

List、List、List<?>ListList<Object>List<?>demoList 1、声明的List集合对其所指向的集合对象（就是赋值的集合对象）的限制:无泛型限制，并且无视指向的集合对象的泛型，直接当成List处理（泛型擦除…

阅读更多...

软件测试难吗？应该怎样学习？

软件测试难吗？应该怎样学习？

软件测试是一份不错的职业，现在也有许多小伙伴想要学习软件测试技术，成为一名软件测试员。但是零经验的小白又担心不知道软件测试好不好学，应该如何学习软件测试能力，需要做哪些培训呢。下面就给大家推荐一些学习经验与技巧&#…

阅读更多...

【JavaEE】JVM（八股文！）

【JavaEE】JVM（八股文！）

努力经营当下，直至未来明朗！ 文章目录【JVM内存划分】【JVM类加载】【JVM垃圾回收机制GC】一）GC是啥二）GC回收哪部分内存三）具体怎么回收四）怎么找垃圾（判定某个对象是否是垃圾）五&a…

阅读更多...

圆和椭圆外投影

圆和椭圆外投影

1 圆外一点在缩放到圆上圆方程: x2y222x^2y^2 2^2 x2y222 直线方程: ykxy kx ykx 圆外一点: A(3,3)A(3,3)A(3,3) 求点B. 方法1-解方程圆外一点A(3,3)A(3,3)A(3,3),那么:直线k1k1k1,直线方程:yxyxyx 方程联立: x2x24x^2 x^2 4 \\ x2x24 x2y2x \sqrt{2} \\ y \sqrt…

阅读更多...

点云 3D 分割 - SqueezeSeg（ICRA 2018）

点云 3D 分割 - SqueezeSeg（ICRA 2018）

点云 3D 分割 - SqueezeSeg（ICRA 2018）摘要1. 引言2. 相关工作A. 三维激光雷达点云的语义分割B. 用于3D点云的CNNC. 图像的语义分割D. 通过模拟收集数据3. 方法描述A. 点云变换B. 网络结构C. 条件随机场D. 数据收集4. 实验A. 评估指标B. 实验设置C. 实验…

阅读更多...

2022电商行业重磅年度报告：八大年度关键词盘点

2022电商行业重磅年度报告：八大年度关键词盘点

2022年终于过去，当网易云音乐推出“年度报告”霸屏朋友圈，它在试图唤起那些可能被遗忘的情绪和小心思。这一年，有人悲观，有人积极，有人凭实力搭上了顺风车，也有人放弃了抵抗。这一年，作为电商人…

阅读更多...

Mybatis学习笔记 | 动力节点老杜

Mybatis学习笔记 | 动力节点老杜

目录一、MyBatis概述历史 MyBatis特点 ORM概述二、Mybatis入门 1、SqlSessionFactory和SqlSession 2、核心配置文件的加载 3、mybatis事务管理机制 4、第一个mybatis程序 5、mybatis继承日志三、mybatis增删改查 1、增加通过Map传值通过实体类传值 2、删除…

阅读更多...

【uniapp】如何实现拖动文件直接上传

【uniapp】如何实现拖动文件直接上传

做uniapp项目发布H5有个后台管理，用户说上传文件的体验需要改进，那个弹出选择文件对话框然后去填文件路径选择文件上传，感觉操作太麻烦，于是就有了这么一个需求，需要实现拖动文件直接上传的，这样效率和体验…

阅读更多...

九、动态组件与插槽

九、动态组件与插槽

一、动态组件 1.1、什么是动态组件动态组件指的是动态切换组件的显示与隐藏。 1.2、如何实现动态组件渲染 vue提供了一个内置的<component>组件，专门用来实现动态组件的渲染。示例代码如下： data() {// 1. 当前要渲染的组件名称return {comN…

阅读更多...

学习笔记：混沌工程

学习笔记：混沌工程

个人理解： 混沌工程，chaos engineering，找出系统中的脆弱环节的方法学混沌工程是软件测试和质量保证的一种方法，在黑客入侵之前或系统故障之前使用它来识别漏洞，由于混沌工程测试而做出的改变增加了人们对系统的信心。…

阅读更多...

SpringBoot @SessionScope注解和Session的用法解释

SpringBoot @SessionScope注解和Session的用法解释

参考资料 JSESSIONID是什么SessionScope 解决了不同session下如何生成不同服务实例目录一. 前期准备二. 被SessionScope作用的类三. 使用被SessionScope作用类的Service四. 效果4.1 用Edge浏览器进入页面4.2 然后用Edge浏览器进入页面4.3 若将CacheHolder类上的SessionScope注…

阅读更多...

nginx部署next项目访问日志去重小技巧，next项目资源不计入日志，网站日志统计去除资源请求

nginx部署next项目访问日志去重小技巧，next项目资源不计入日志，网站日志统计去除资源请求

next项目访问日志去重小技巧需求提出具体解决方案配置代码需求提出之前在跟SEO做网站日志分析的时候受到了一部分资源请求数据的影响，统计出来的ip访问次数远远大于实际值，从日志中或者网站控制台看到每个页面都会发送十几个请求，而这些请求…

阅读更多...

Qt中使用QWebEngine加载百度离线地图，在特定地点加载个圣诞树

Qt中使用QWebEngine加载百度离线地图，在特定地点加载个圣诞树

一、前言 2022年圣诞节到来啦，很高兴这次我们又能一起度过~ 遇上圣诞节，正好最近研究了QT中加载百度离线地图，用百度地图API加载个圣诞树（主要我想要那个圣诞节特制勋章）。二、创意名在百度离线地图加载个圣诞树。…

阅读更多...

演化博弈、复制动态方程与仿真

演化博弈、复制动态方程与仿真

本文只整理和总结一下我的理解，文末列出了可供参考的更详细完整的资料。建议先看参考资料[1]（博弈论公开课）的博弈论课程，可以直接从第11讲开始看。参考链接[2]是关于演化博弈非常经典的一本书。参考链接[5]涵盖内容比较…

阅读更多...

CSDN文章质量检测系统

CSDN文章质量检测系统

想知道你的文章在CSDN中质量如何吗？ 你想知道你的CSDN文章到底写得怎么样吗？ 你想要获得一个你的系统的CSDN文章评分吗？ CSDN质量分数帮你解决这个问题，网址如下： https://www.csdn.net/qc 界面在如下，如果…

阅读更多...

XGBoost模型的python实现

XGBoost模型的python实现

文章目录函数介绍实例二分类问题多分类问题作者：李雪茸函数介绍实现 XGBoost 分类算法使用的是 xgboost 库的 XGBClassifier，具体参数如下： 1、max_depth：给定树的深度，默认为3 2、learning_rate：每一步…

阅读更多...

SpringBoot整合TKMyBatis实现增删改查

SpringBoot整合TKMyBatis实现增删改查

文章目录什么是TKMybatis？SpringBoot整合TKMybatis实体类注解TKMapper接口如何使用基本增删改操作批量查询和删除批量添加自定义查询条件ExampleExample 条件设置Example 使用什么是TKMybatis？ TKMybatis 是基于Mybatis 框架开发的一个工具，…

阅读更多...

推荐文章

最新文章