分布式搜索——ElasticSeach简介

news2024/9/23 21:20:00

一般都用数据库存储数据,然后对数据库进行查询获取数据,但是当数据量很大时,查询效率就会很慢(具体下面会讲到),所以这种情况下就会使用到ElasticSeach

ElasticSeach的基本介绍

ElasticSeach是一 款非常强大的开源搜索引擎技术 ,可以帮助我们从海量数据中快速找到需要的内容 

在日常生活中,有很多会用到ElasticSeach的场景,比如网购时在输入框输入关键字搜索出来的商品、百度问的问题、订外卖时搜吃的……类似这种在海量数据中搜索查询指定数据的场景,都会用到ElasticSeach

elasticsearch 结合 åkibana 、 Logstash 、 Beats,组件,统称为 elastic stack (ELK) ,其实就是elasticsearch的技术栈。被广泛应用在日志数据分析 、 实时监控等领域

还有其他的搜索引擎技术,不过elasticsearch目前应该是最好用的

正向索引和倒排索引

正向索引

倒排索引 

 ElasticSeach中的一些基本概念

文档

索引和映射

数据库和ElasticSeach对比

利用DSL语句操作ES

 在kibana上通过发送请求进行增删改查操作,关于安装请自行百度,或者参考:elasticsearch和kibana的安装

kibana客户端如下图

索引库的增删改查操作

ES中的索引库,指的就是索引,对应为数据库中表的概念。我们要向数据表中存储数据,首先应该创建表,在创建表时会对表做一些约束,如表中各字段的类型、是否不为空等等。相应的,我们要把文档(前面说过文档类似于表中的一行数据)存储到索引库中,就要先创建索引,同样在创建索引时会对索引做一些约束。

创建好一个带有指定约束的索引A后,这些约束就会在创建文档并把文档存入索引A时起作用,这个过程就叫mapping映射。还是以数据表举例,一个用户表有姓名和年龄两个字段,类型分别为字符串和整形,那么往这个用户表存一条用户数据时,就会校验这条用户数据是否符合用户表的约束,符合的话就是用户数据和用户表的约束是一一映射的(希望我能解释清楚映射的意思,因为我自己一开始不太懂这个概念)。文档和索引的处理过程和用户数据用户表的处理过程很像

mapping映射

创建索引库

删除、查看索引库

修改索引库

文档增删改查操作

新增文档

查看、删除文档

修改文档

利用RestClient操作ES

RestClient简介

操作索引库

具体操作看视频吧,因为是案例不好做笔记,视频里是基于Java语言的操作

 restclient操作ES

操作文档

一样,看视频: 操作文档

elasticsearch查询文档

用DSL查询

query查询分类

查询所有 

精确查询 

 gte表示大于等于,lte表示小于等于,gt表示大于,lt表示小于

 地理查询

方法一,适合地图找房之类的需求 

方法二,适合我的附近这种需求,其中我的就是中心点的位置,附近就是看设置的距离值 

复合查询

function_score 在原始查询结果的基础上,人为干预搜索结果的排名,即决定哪些文档比较靠前,哪些比较靠后

视频 function_score

 

 布尔查询

视频  布尔查询

搜索结果处理

排序

 例子1

例子2:

 

分页

分页默认只能查前10000条数据:具体看视频:分页查询上限

高亮

具体的视频:高亮的用法

对应的RestClient操作参考视频,视频是Java版本的:视频教程

数据聚合

聚合的分类

DSL实现聚合

桶聚合

metrics聚合

自动补全

自动补全就是当我们在搜索引擎或者购物网站的搜索框中输入一个词时,出现的提示,一般通过分词器实现

拼音分词器

自定义分词器

 

 

 实现自动补全

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1678186.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RSC6218A LLC谐振电源案例分享-REASUNOS(瑞森半导体)

一、前言 RSC6218A是一款可以满足4项标准的优秀产品:①2024年8月1日要实施的《建筑照明设计标准》GBT0034-2024;②2024年07月01日起实施的《电磁兼容限值 第1部分:谐波电流发射限值(设备每相输入电流≤16A)》GB17625.…

在PyQt5中实现点击按钮打开新窗口功能—窗口的跳转功能实现

百度搜索“pyqt5中如何点击按钮打开新的窗口”,自动生成以下参考代码。 在PyQt5中,要实现点击按钮打开新窗口,你需要定义一个新的窗口类,并在按钮的点击信号(clicked)处理函数中创建并显示这个新窗口。以下…

继承的奥秘:面向对象编程中的血脉传承与智慧抉择

1. 概述 在面向对象编程(OOP)中,继承是构建复杂软件系统的基石之一。它允许我们定义一个类(称为父类或基类)作为其他类(称为子类或派生类)的基础,子类能够自动获得父类的属性和方法…

jQuery EasyUI textbox 值取不到问题

用textbox 存值点击修改的时候有些字段是不能更改的所以将textbox 的disabled属性设为true后 像这里的textbox disabled属性设为true是灰的 点击保存时这两个值没传 我们可以在提交保存前先将disabled属性先设为false,保存后又设为true

【PDF技巧】PDF如何解密?

PDF文件设置了加密,需要密码才能够打开文件或者编辑文件,那么如何解密PDF密码?今天我们来一起学习一下。 首先是在已知密码的情况下,PDF文件中的打开密码或者是限制编辑,想要解密PDF密码,我们只需要在PDF编…

关于easypoi使用@ExcelCollection一对多导致合并失效问题

导致无法合并的原因是序号中使用了自增的操作 将自增改为手动赋值就能正常合并了

微服务- protobuf 安装

这里写自定义目录标题 1:下载链接2 :下载对应的包3:解压到目录4:设置环境变量5: 查看版本 1:下载链接 https://github.com/protocolbuffers/protobuf/releases 2 :下载对应的包 3:解压到目录 4&…

LeetCode474:一和零

题目描述 给你一个二进制字符串数组 strs 和两个整数 m 和 n 。 请你找出并返回 strs 的最大子集的长度,该子集中 最多 有 m 个 0 和 n 个 1 。 如果 x 的所有元素也是 y 的元素,集合 x 是集合 y 的 子集 。 代码 /*抽象为两个维度的背包问题 dp[i][j…

如何快速将视频做成二维码?扫描二维码播放视频的制作方法

视频二维码的用途越来越多,比如常见的有产品展示、企业宣传、教程说明、个人展示等都可以生成二维码,通过扫码在手机或者其他设备上预览内容,从而提升其他人获取视频的速度,实现内容的快速分享。 对于有制作视频二维码需求的小伙…

AI 一键生成高清短视频,视频 UP 主们卷起来...

现在短视频越来越火,据统计,2023年全球短视频用户数量已达 10 亿,预计到2027年将突破 24 亿。对于产品展示和用户营销来说,短视频已经成为重要阵地,不管你喜不喜欢它,你都得面对它,学会使用它。…

Java为什么会成为现在主流的编程语言

Java为什么会成为现在的主流语言 前言一、Java语言概述Java是什么为什么大多数人会选择从事Java为什么从事Java的工作者数量从年递减 二、Java语言的特点简单性面向对象分布式(微服务)健壮性安全性体系结构中立可移植性解释型高性能多线程动态性 三、Jav…

CF 944 (Div. 4) A~G

文章目录 A My First Sorting Problem(模拟)B Different String(模拟、字符串)C Clock and Strings(模拟)D Binary Cut (贪心)E Find the Car(二分查找、数学)F Circle Perimeter&am…

无独立显卡如何安装Pytorch

以前我是直接在colab中使用pytorch,非常方便,今天折腾了一上午,终于搞定了pytorh的安装和环境设置,分享下我的安装流程,遇到的问题和解决方案。 1. 用pip安装Pytorch 打开cmd窗口(按win R)&a…

Linux 第三十一章

🐶博主主页:ᰔᩚ. 一怀明月ꦿ ❤️‍🔥专栏系列:线性代数,C初学者入门训练,题解C,C的使用文章,「初学」C,linux 🔥座右铭:“不要等到什么都没有了…

立创EDA绘制电路原理图

1、下载立创EDA并安装注册,这里我用的是标准版 2、在账号名右键,新建工程 3、以单片机时钟电路为例 4、首先绘制原理图 (1)放置元器件,以AT89C52为例,在元件库中查找单片机,找到后确认封装&…

机器人工具箱学习(三)

一、动力学方程 机器人的动力学公式描述如下: 式中, τ \boldsymbol{\tau} τ表示关节驱动力矩矢量; q , q ˙ , q \boldsymbol{q} ,\; \dot{\boldsymbol { q }} ,\; \ddot{\boldsymbol { q }} q,q˙​,q​分别为广义的关节位置、速度和加速…

JavaScript对象的声明

JS声明对象的语法 1 通过new Object()直接创建对象2 通过 { }形式创建对象 1 通过new Object()直接创建对象 代码 var person new Object(); // 给对象添加属性并赋值 person.name"张小明"; person.age10; person.foods["苹果","橘子","香…

吞吐量 和 延时的关系

关于吞吐量/吞吐率、延时,你可以通过 Jmeter中的”聚合报告“和”用表格查看报告“来获取。 Throughput 越大,Latency 越差:因为请求过多,系统繁忙导致响应速度降低。Latency 的值越小说明能支持的 Throughput 越高:L…

pdfMake,xlsx-js-style,elementTable表格导出大量数据的pdf和xslx表格

使用渲染dom传递给xlsx或将dom转canvas在传给jspdf数据量大都会造成页面负载过大 所以导pdf和xlsx都使用数据传递给pdfMake,xlsx-js-style,pdf涉及分页与合并单元格 一.pdf npm并引入pdfMake和其字体包(记录时使用版本0.2.10 import pdfMake from &qu…

仅1年!荣登中科院1区经济类SSCI宝座!影响因子3连涨,创刊时间不长但口碑飙升!

【SciencePub学术】今天小编给大家带来了一本经济学领域的高分优刊解读,创刊时间不长,但影响因子3连涨现已高达8.5,JCR1区,中科院1区,领域相符的学者可考虑! Oeconomia Copernicana 1 期刊概况 【期刊简介…