ElasticSearch学习笔记(四)分页、高亮、RestClient查询文档

news2024/9/20 22:25:41

文章目录

  • 前言
  • 7 搜索结果处理
    • 7.2 分页
      • 7.2.1 基本使用
      • 7.2.2 深度分页
      • 7.2.3 小结
    • 7.3 高亮
      • 7.3.1 高亮原理
      • 7.3.2 实现高亮
  • 8 RestClient查询文档
    • 8.1 match_all查询
    • 8.2 match查询与multi_match查询
    • 8.3 精确查询
    • 8.4 布尔查询
    • 8.5 排序、分页、高亮
  • 9 项目实战
    • 9.1 酒店搜索和分页
    • 9.2 酒店列表过滤

前言

ElasticSearch学习笔记(一)倒排索引、ES和Kibana安装、索引操作
ElasticSearch学习笔记(二)文档操作、RestHighLevelClient的使用
ElasticSearch学习笔记(三)RestClient操作文档、DSL查询文档、搜索结果排序

7 搜索结果处理

7.2 分页

7.2.1 基本使用

ES默认情况下只返回top10的数据:

而如果要查询更多数据,就需要修改分页参数:

  • from:从第几个文档开始
  • size:总共查询几个文档

例如:

7.2.2 深度分页

如果要查询第990-1000个文档,则查询条件应该是:

GET /hotel/_search
{
    "query": {
        "match": {
            "city": "上海"
        }
    },
    "from": 990,
    "size": 10
}

要注意的是,在ES内部进行分页时,不会直接定位到第990个文档,而是先把第0-1000个文档都查出来,在截取其中的第990-1000个文档:

查询top1000,如果ES是单点模式,这并无太大影响,但在ES集群中的影响是很大的。

假设ES集群有5个节点,要查询top1000的数据,并不是每个节点查询出top200就可以了。这是因为节点A的top200,在另一个节点可能排到200名以外了。

因此要想获取整个集群的top1000,必须先查询出每个节点的top1000,汇总结果后重新排名,重新截取top1000。

如果查询分页深度更深,例如查询9900~10000的数据,就要先查询出每个节点的top10000,汇总后再进行截取。

因此,当查询分页深度较大时,汇总数据过多,对内存和CPU会产生非常大的压力,所以ES禁止from+size超过10000的请求。

针对深度分页,ES官方提供了两种解决方案:

  • search after:分页时需要排序,原理是从上一次的排序值开始,查询下一页数据。官方推荐使用的方式。
  • scroll:原理将排序后的文档id形成快照,保存在内存。官方已经不推荐使用。

7.2.3 小结

实现方案优点缺点使用场景
form + size支持随机翻页会有深度分页问题,默认查询上限(from + size)是10000百度、京东、谷歌、淘宝这样的随机翻页搜索
search after没有查询上限(单次查询的size不超过10000)只能向后逐页查询,不支持随机翻页没有随机翻页需求的搜索,例如手机向下滚动翻页
scroll没有查询上限(单次查询的size不超过10000)会有额外内存消耗,并且搜索结果是非实时的海量数据的获取和迁移。从ES7.1开始不推荐使用

7.3 高亮

7.3.1 高亮原理

由上图可知,在百度进行搜索时,关键字会变成红色,这就是一种高亮显示。而实现高亮显示的原理是:

  • 1)给文档中的所有关键字都添加一个标签,例如<em>标签;
  • 2)页面给<em>标签编写CSS样式。

7.3.2 实现高亮

下面是实现高亮的一个例子:

其中一些需要注意的点是:

  • 高亮是对关键字高亮,因此搜索条件必须包含关键字,而不能是范围这样的查询;
  • 默认情况下,搜索字段必须与要高亮的字段一致,例如上面的例子中搜索字段和高亮字段都是name;
  • 如果要对非搜索字段高亮,则需要添加一个属性:require_field_match=false。例如上例中,如果高亮字段加一个city字段,没加这个属性时不会高亮:

而加上该属性后,city字段也高亮:

8 RestClient查询文档

8.1 match_all查询

match_all查询是匹配所有文档的一种查询。在没有指定查询方式时,它也是ES默认的查询。

例如下面的例子,会将所有文档查询出来:

使用RestClient客户端实现match_all查询的代码如下:

@Test
public void testMatchAll() throws IOException {
    // 1.准备Request
    SearchRequest request = new SearchRequest("hotel");
    // 2.组织DSL参数
    request.source().query(QueryBuilders.matchAllQuery());
    // 3.发送请求
    SearchResponse response = client.search(request, RequestOptions.DEFAULT);
    // 4.解析响应结果
    SearchHits searchHits = response.getHits();
    // 4.1 查询总条数
    long total = searchHits.getTotalHits().value;
    System.out.println("查询总条数=" + total);
    // 4.2 查询结果数组
    SearchHit[] searchHitList = searchHits.getHits();
    for (SearchHit searchHit : searchHitList) {
        String sourceStr = searchHit.getSourceAsString();
        System.out.println(sourceStr);
    }
}

以上代码中关键的API有两个:

  • request.source():该方法返回一个SearchSourceBuilder对象,该对象中包含了查询、排序、分页、高亮等所有功能

  • QueryBuilders:其中包含matchtermfunction_scorebool等各种查询

执行以上单元测试,输出结果如下:

查询总条数=203
{"address":"中山路","brand":"白天鹅","business":"太古汇","city":"广州","id":1,"location":"45, 45","name":"白天鹅","pic":"a.png","price":888,"score":5,"starName":"五星"}
{"address":"静安交通路40号","brand":"7天酒店","business":"四川北路商业区","city":"上海","id":36934,"location":"31.251433, 121.47522","name":"7天连锁酒店(上海宝山路地铁站店)","pic":"https://m.tuniucdn.com/fb2/t1/G1/M00/3E/40/Cii9EVkyLrKIXo1vAAHgrxo_pUcAALcKQLD688AAeDH564_w200_h200_c1_t0.jpg","price":336,"score":37,"starName":"二钻"}
......

8.2 match查询与multi_match查询

match查询是根据某个字段进行查询。 例如:

使用RestClient客户端实现match查询的代码和上面的match_all查询基本一致,在组织DSL参数是略有查差异:

// 其余代码和match_all查询的代码一致

// 2.组织DSL参数
request.source().query(QueryBuilders.matchQuery("city", "上海"));

multi_match查询则是可以在多个字段上执行相同的match查询。 例如:

8.3 精确查询

精确查询主要包括:

  • term:词条精确匹配,这些精确值可以是数字、时间、布尔或者字符串等。
  • range:数字或时间的范围查询,包括gt大于、gte大于等于、lt小于、lte小于等于。

8.4 布尔查询

布尔查询就是用mustmust_notfilter等方式组合其他的matchtermrange等查询。

8.5 排序、分页、高亮

前面提到过,request.source()方法返回一个SearchSourceBuilder对象,该对象中包含了排序、分页、高亮等所有功能。

高亮的代码相比前面会差异大一点。在组织DSL语句时,除了查询条件,还需要添加高亮条件,同样是与query同级;在结果解析时,除了要解析_source文档数据,还要解析高亮结果。

9 项目实战

下面通过一个项目来实战演练ES的知识,主要实现四个功能:

  • 酒店搜索和分页
  • 酒店结果过滤
  • 我周边的酒店
  • 酒店竞价排名

本实战的重点在于Service层的逻辑实现,即根据需求组织DSL语句去查询ES获得想要的数据,因此对于SpringBoot项目的搭建过程、以及对应的HotelController类-IHotelService接口-HotelServiceImpl实现类-HotelMapper接口的实现就省略了。最终搭建的项目框架如下:

但有一个地方需要注意,就是要把RestHighLevelClient注册到Spring中作为一个Bean。在启动类cn.hsgx.hotel.HotelDemoApplication中声明这个Bean:

// cn.hsgx.hotel.HotelDemoApplication

@MapperScan("cn.hsgx.hotel.mapper")
@SpringBootApplication
public class HotelDemoApplication {

    public static void main(String[] args) {
        SpringApplication.run(HotelDemoApplication.class, args);
    }

    @Bean
    public RestHighLevelClient restHighLevelClient(){
        return new RestHighLevelClient(RestClient.builder(
                HttpHost.create("http://192.168.245.130:9200")
        ));
    }
}

9.1 酒店搜索和分页

需求:根据关键字搜索酒店列表,并可以进行分页。

  • 1)创建两个实体类

请求参数实体

// cn.hsgx.hotel.pojo.RequestParams

@Data
public class RequestParams {
    // 搜索关键字
    private String key;
    // 页码
    private Integer page;
    // 每页大小
    private Integer size;
    // 排序
    private String sortBy;
}

返回参数实体

// cn.hsgx.hotel.pojo.PageResult

@Data
public class PageResult {
    // 总条数
    private Long total;
    // 当前页的数据
    private List<HotelDoc> hotels;

    public PageResult() {
    }

    public PageResult(Long total, List<HotelDoc> hotels) {
        this.total = total;
        this.hotels = hotels;
    }
}
  • 2)在HotelServiceImpl实现类中,创建listHotels()方法实现该功能
// cn.hsgx.hotel.service.impl.HotelServiceImpl

@Override
public PageResult listHotels(RequestParams params) {
    try {
        // 1.准备Request
        SearchRequest request = new SearchRequest("hotel");
        // 2.准备请求参数
        // 2.1.关键字
        String key = params.getKey();
        if (StringUtils.isNotBlank(key)) {
            // 不为空,根据关键字查询
            request.source().query(QueryBuilders.matchQuery("all", key));
        } else {
            // 为空,查询所有
            request.source().query(QueryBuilders.matchAllQuery());
        }
        // 2.2.分页
        int page = params.getPage();
        int size = params.getSize();
        request.source().from((page - 1) * size).size(size);
        // 3.发送请求
        SearchResponse response = restHighLevelClient.search(request, RequestOptions.DEFAULT);
        // 4.解析响应
        return handleResponse(response);
    } catch (IOException e) {
        throw new RuntimeException("搜索数据失败", e);
    }
}

private PageResult handleResponse(SearchResponse response) {
    SearchHits searchHits = response.getHits();
    // 4.1.总条数
    long total = searchHits.getTotalHits().value;
    // 4.2.获取文档数组
    SearchHit[] hits = searchHits.getHits();
    // 4.3.遍历
    List<HotelDoc> hotels = new ArrayList<>(hits.length);
    for (SearchHit hit : hits) {
        // 4.4.获取source
        String json = hit.getSourceAsString();
        // 4.5.反序列化,非高亮的
        HotelDoc hotelDoc = JSON.parseObject(json, HotelDoc.class);
        // 4.6.放入集合
        hotels.add(hotelDoc);
    }
    return new PageResult(total, hotels);
}
  • 3)功能测试

9.2 酒店列表过滤

需求:根据城市、星级、品牌、价格等对就酒店查询结果进行过滤。

  • 1)修改请求参数RequestParams类,新增相关查询参数
// cn.hsgx.hotel.pojo.RequestParams

@Data
public class RequestParams {
    // 搜索关键字
    private String key;
    // 页码
    private Integer page;
    // 每页大小
    private Integer size;
    // 排序
    private String sortBy;
    // 城市
    private String city;
    // 星级
    private String starName;
    // 品牌
    private String brand;
    // 价格
    private Integer minPrice;
    private Integer maxPrice;
}
  • 2)修改HotelServiceImpl类的listHotels()方法的业务逻辑

在之前的业务逻辑中,只有一个根据关键字搜索的match查询,现在要添加条件过滤,包括:

  • 城市过滤:keyword类型,用term查询
  • 星级过滤:keyword类型,用term查询
  • 品牌过滤:keyword类型,用term查询
  • 价格过滤:数值类型,用range查询

而多个查询条件组合,则需要是boolean查询来组合:

  • 关键字搜索放到must中,参与算分
  • 其它过滤条件放到filter中,不参与算分

为了代码逻辑更加清晰,可以将查询条件的处理单独封装成一个方法handleQueryParams()

// cn.hsgx.hotel.service.impl.HotelServiceImpl

@Override
public PageResult listHotels(RequestParams params) {
    try {
        // 1.准备Request
        SearchRequest request = new SearchRequest("hotel");
        // 2.准备请求参数
        // 2.1.处理查询条件
        handleQueryParams(params, request);
        // 2.2.分页
        int page = params.getPage();
        int size = params.getSize();
        request.source().from((page - 1) * size).size(size);
        // 3.发送请求
        SearchResponse response = restHighLevelClient.search(request, RequestOptions.DEFAULT);
        // 4.解析响应
        return handleResponse(response);
    } catch (IOException e) {
        throw new RuntimeException("搜索数据失败", e);
    }
}

private void handleQueryParams(RequestParams params, SearchRequest request) {
    // 1.准备boolean查询
    BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
    // 1.1.关键字搜索,match查询,放到must中
    String key = params.getKey();
    if (StringUtils.isNotBlank(key)) {
        // 不为空,根据关键字查询
        boolQuery.must(QueryBuilders.matchQuery("all", key));
    } else {
        // 为空,查询所有
        boolQuery.must(QueryBuilders.matchAllQuery());
    }
    // 1.2.城市
    String city = params.getCity();
    if (StringUtils.isNotBlank(city)) {
        boolQuery.filter(QueryBuilders.termQuery("city", city));
    }
    // 1.3.星级
    String starName = params.getStarName();
    if (StringUtils.isNotBlank(starName)) {
        boolQuery.filter(QueryBuilders.termQuery("starName", starName));
    }
    // 1.4.品牌
    String brand = params.getBrand();
    if (StringUtils.isNotBlank(brand)) {
        boolQuery.filter(QueryBuilders.termQuery("brand", brand));
    }
    // 1.5.价格范围
    Integer minPrice = params.getMinPrice();
    Integer maxPrice = params.getMaxPrice();
    if (minPrice != null && maxPrice != null) {
        maxPrice = maxPrice == 0 ? Integer.MAX_VALUE : maxPrice;
        boolQuery.filter(QueryBuilders.rangeQuery("price").gte(minPrice).lte(maxPrice));
    }
    // 2.设置查询条件
    request.source().query(boolQuery);
}
  • 3)功能测试

筛选出北京的酒店:

筛选出北京、五钻的酒店:

筛选出北京、五钻的万豪酒店:

筛选出北京、五钻的、且价格在100-300的万豪酒店:

本节完,更多内容请查阅分类专栏:微服务学习笔记

感兴趣的读者还可以查阅我的另外几个专栏:

  • SpringBoot源码解读与原理分析
  • MyBatis3源码深度解析
  • Redis从入门到精通
  • MyBatisPlus详解
  • SpringCloud学习笔记

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2085584.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux 软件包管理器yum 自动化构建工具-make/makefile

Linux 工具 linux 软件包管理器 yum 把一些常用的软件提前编译好&#xff0c;做成软件包放在一个服务器上&#xff0c;通过包管理器可以很方便的获取到在这个编译好的软件包。直接进行安装。 软件包和软件包管理器就相当于 App 和应用商店这样的关系。 Linux 安装软件 源代码…

【QT】学习笔记:导出资源中静态文件

在 Qt C 中&#xff0c;可以通过将文件添加到资源文件中&#xff0c;并在程序运行时将其导出到磁盘上的指定目录。以下是具体的步骤和代码示例&#xff1a; 1. 将文件添加到资源文件中 首先&#xff0c;需要将文件添加到 Qt 的资源系统中。假设你已经创建了一个资源文件&…

力扣经典题目之->对称二叉树(镜像二叉树)

一&#xff1a;题目 本题只需在此题上稍作修改即可&#xff1a;力扣经典题目之-&#xff1e;相同的树&#xff08;递归判断两颗二叉树是否相同&#xff09;-CSDN博客 二&#xff1a;代码 解释&#xff1a; 1&#xff1a;对称二叉树本质就是左右子树的对比&#xff0c;但不是…

Golang使用Quic-Go开源库实现Quic客户端和服务端

Quic-Go介绍 Quic-Go是Go语言Quic协议&#xff08;RFC 9000、RFC 9001、RFC 9002&#xff09;的实现。它支持HTTP/3&#xff08;RFC 9114&#xff09;&#xff0c;包括QPACK&#xff08;RFC 9204&#xff09;和HTTP数据报&#xff08;RFC 9297&#xff09;。 Github地址 htt…

谷歌发布 3 款 Gemini 新模型;字节开源 FLUX Dev Hyper SD Lora,8 步生图丨 RTE 开发者日报

开发者朋友们大家好&#xff1a; 这里是 「RTE 开发者日报」 &#xff0c;每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE&#xff08;Real-Time Engagement&#xff09; 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文…

源代码防泄露迎来信创时代:信创沙箱

在当今数字化时代&#xff0c;信息安全已成为企业生存与发展的基石&#xff0c;尤其是在信息技术应用创新&#xff08;信创&#xff09;环境下&#xff0c;数据保护更是被提升至前所未有的高度。SDC沙盒防泄密系统以其独特的技术架构和卓越的安全性能&#xff0c;在信创环境中构…

文心快码,码随心动,效率快人一步!

&#x1f381;&#x1f449;点击进入文心快码 Baidu Comate 官网&#xff0c;体验智能编码之旅&#xff0c;还有超多福利&#xff01;&#x1f381; 想象一下&#xff0c;你正在为一段复杂的代码逻辑而苦恼&#xff0c;文心快码却能轻松帮你续写代码&#xff0c;解决你的烦恼。…

addroutes和next()导致的页面无法跳转问题,如登录之后无法跳转到首页,无法重定向,使用next(to)

版本 vue router 3 问题说明 登录成功后&#xff0c;想重定向到/index&#xff0c;执行router.push之后进入beforeEach&#xff1b; 由于第一次访问&#xff0c;判断用户信息为空&#xff0c;需要异步拉取用户的权限等信息&#xff0c; 获得响应后&#xff0c;使用addRoutes批…

【C#】汉诺塔C#代码实现(递归)

1. 思路 假设总共需要移动n个盘子&#xff1a; 将A柱上的n-1个盘子借助C柱移向B柱将A柱上仅剩的最后一个盘子移向C柱将B柱上的n-1个盘子借助A柱移向C柱 2.代码 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threa…

护眼台灯是不是智商税?全面测评松下、书客、飞利浦护眼台灯!

在当今数字化时代&#xff0c;长时间面对电子屏幕已成为日常生活的一部分&#xff0c;这对我们的视力健康构成了挑战。特别是在学习和工作的场景中&#xff0c;一款优质的护眼台灯不仅能够提供舒适的照明环境&#xff0c;还能有效减轻眼睛疲劳&#xff0c;保护视力。然而&#…

如何优雅的使用责任链模式?

如何优雅的使用责任链模式&#xff1f; 在业务开发中&#xff0c;总是会由于需要处理复杂的业务逻辑&#xff0c;从而造成开发者的代码冗余或者模块之间耦合度过高&#xff0c;那么当面对这种情况时&#xff0c;如何实现请求处理的灵活性和可维护性&#xff0c;责任链模式就可以…

短视频流量|基于SprinBoot+vue的短视频流量数据分析系统(源码+数据库+文档)

短视频流量数据分析系统 基于SprinBootvue的短视频流量数据分析系统 一、前言 二、系统设计 三、系统功能设计 5.1 系统功能模块 5.2 管理员功能模块实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&#xff1a; 博主介绍…

免费批量Excel文件合并、拆分工具

软件介绍 下载地址&#xff1a;https://pan.quark.cn/s/ae860a4e2ccb 1.多个XLS或XLSX格式EXCEL文件合并&#xff0c;合并后可使用数据透视表进行相关操作。 2.自动合并多个EXCEL文件的第一个工作表&#xff0c;并汇总成一张表&#xff0c;可根据所有列标题需要指定需要的列。 …

【基础篇】行锁功过:怎么减少行锁对性能的影响?

定义 **MySQL 的行锁是在引擎层由各个引擎自己实现的。**但并不是所有的引擎都支持行锁&#xff0c;比如 MyISAM 引擎就不支持行锁。不支持行锁意味着并发控制只能使用表锁&#xff0c;对于这种引擎的表&#xff0c;同一张表上任何时刻只能有一个更新在执行&#xff0c;这就会…

一文详解JNPF低代码平台在不同行业的应用分析

随着信息技术的飞速发展&#xff0c;企业对于快速开发和部署业务应用的需求日益增长。低代码平台作为加速企业数字化转型的利器&#xff0c;正受到越来越多的关注。JNPF作为一款先进的低代码开发平台&#xff0c;凭借其强大的功能和灵活性&#xff0c;在不同行业中得到了广泛的…

Jenkins安装使用详解,jenkins实现企业级CICD流程

文章目录 一、资料1、官方文档 二、环境准备1、安装jdk172、安装maven3、安装git4、安装gitlab5、准备我们的springboot项目6、安装jenkins7、安装docker8、安装k8s&#xff08;可选&#xff0c;部署节点&#xff09;9、安装Harbor10、准备带有jdk环境的基础镜像 三、jenkins实…

禁止文件外发 | 如何禁止员工外发文件?严守企业机密,禁止员工外发敏感文件!

近期&#xff0c;我们注意到一些敏感项目资料有外泄的风险&#xff0c;这对公司的核心竞争力构成了严重威胁&#xff01; 我们必须立即采取行动&#xff0c;严守企业机密&#xff0c;确保每一份文件都安全无虞。 从今天起&#xff0c;我们要全面升级信息安全措施&#xff0c;…

Java基础(5)- Java代码笔记2

目录 一、键盘录入_Scanner 1.输入&#xff1a;导包 -> 创建对象 -> 调用方法 2.next和nextLine区别 二、Random随机数 1.生成随机数 2.在指定范围内随机生成一个数 三、Switch语句 四、一维数组 1.数组定义 2.获取数组长度 3.遍历数组 3.输出数组 4.数组常见…

[Backbone]CAS-ViT: Convolutional Additive Self-attention Vision Transformers

1. BaseInfo TitleCAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile ApplicationsAdresshttps://arxiv.org/pdf/2408.03703Journal/Time202408Author清华Codehttps://github.com/Tianfang-Zhang/CAS-ViTRead20240829TableVisonTrans…

【健康问答】揭秘五大‘天然降压果‘,高血压患者常吃,血压稳稳降!-曹启富医生

曹医生&#xff0c;听说有些水果对高血压患者有特别的益处&#xff0c;能帮助降低血压&#xff0c;是真的吗&#xff1f; 曹医生说&#xff1a;确实如此。在日常饮食中&#xff0c;合理摄入一些富含特定营养素的水果&#xff0c;对于辅助控制高血压有着积极的作用。今天&#…