Elasticsearch中【文档查询】DSL语句以及对应的Java实现

news2024/10/6 14:38:40

目录

全文检索查询

精准查询

布尔查询 

排序、分页查询

高亮

地理查询

复合查询


 

Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。常见的查询类型包括:

  • 查询所有:查询出所有数据,一般测试用。例如:match_all

  • 全文检索(full text)查询:利用分词器对用户输入内容分词,然后去倒排索引库中匹配。例如:

    • match_query 

    • multi_match_query

  • 精确查询:根据精确词条值查找数据,一般是查找keyword、数值、日期、boolean等类型字段。例如:

    • ids

    • range

    • term

  • 地理(geo)查询:根据经纬度查询。例如:

    • geo_distance

    • geo_bounding_box

  • 复合(compound)查询:复合查询可以将上述各种查询条件组合起来,合并查询条件。例如:

    • bool

    • function_score

全文检索查询

单字段查询DSL:

GET /indexName/_search
{
  "query": {
    "match": {
      "字段名": "查询内容"
    }
  }
}

例子:

多字段查询DSL:(搜索字段越多,对查询性能影响越大 ,所以建议在创建索引时使用copy_to字段约束,将需要参与搜索的字段复制到all字段中)

        例如创建索引时,"name"字段设置了"copy_to"参数,将其值复制到"all"字段中。这意味着当你在Elasticsearch中索引一个文档时,文档的"name"字段的值会被同时复制到"all"字段中。这样一来,如果你想要在文档的所有字段中进行全文本搜索,只需要搜索"all"单个字段即可,而不需要分别搜索每个字段。

         这样对all进行单字段查询,性能也有很大提高。

GET /indexName/_search
{
  "query": {
    "multi_match": {
      "query": "搜索内容",
      "fields": ["字段名1", " 字段名2"]
    }
  }
}

Java实现全文查询:

依赖引入可查看我另一张博文第三部分:

        //1.准备Request
        SearchRequest request = new SearchRequest("hotel");
        //2.准备DSL
        request.source()
                .query(QueryBuilders.matchAllQuery());
        //3.发生请求
        SearchResponse response = client.search(request, RequestOptions.DEFAULT);

 对SearchResponse返回结果进行处理:

        //获取最外层的hits
        SearchHits hits = response.getHits();

        //获取总条数
        TotalHits totalHits = hits.getTotalHits();

        //获取里层的hits
        SearchHit[] searchHits = hits.getHits();

        //遍历每条数据
        for (SearchHit hit : searchHits) {
            //获取文档 _id
            String docId = hit.getId();

            //获取每条数据的_source部分(json数据),获取后做下一步处理
            String sourceAsString = hit.getSourceAsString();
        }

返回数据格式

各种查询主要不同的 是query()中构建的是何种查询,例如这里是match_all查询

构建match查询

QueryBuilders.matchQuery("name","酒店")

精准查询

DSL语句:

GET /jungle_study/_search
{
  "query": {
    "term": {
      "city": {
        "value": "北京"
      }
    }
  }
}

构建精确查询

QueryBuilders.termQuery("city","北京")

布尔查询 

复合查询的一种

bool查询中的逻辑关系:

  • must:必须匹配的条件,可以理解为“

  • should:选择性匹配的条件,可以理解为“

  • must_not:必须不匹配的条件,不参与打分

  • filter:必须匹配的条件,不参与打分

DSL:(查询name字段有酒店,并且价格范围在100-500之间的数据)

GET /jungle_study/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "city": "北京"
          }
        },
        {
          "range": {
            "price": {
              "gte": 100,
              "lte": 500
            }
          }
        }
      ]
    }
  }
}

gte : >=  大于或等于

lte  : <=  小于或等于

gt   : >    大于

lt    : <    小于

构建布尔查询

QueryBuilders.boolQuery();
//添加查询条件
boolQuery.must(QueryBuilders.termQuery("city","上海")); //精确查询,添加city精确匹配条件
boolQuery.filter(QueryBuilders.rangeQuery("price").gte(100).lte(500)); //范围查询 ,添加条件价格在100-250之间

排序、分页查询

DSL:(排序和分页与query同级)

from :从哪条数据开始查

size :查询条数

sort :根据price(价格)倒叙排列查询结果

对应Java代码

    // 页码,每页大小
    int page = 1, size = 5;

    // 准备Request
    SearchRequest request = new SearchRequest("jungle_study");
    // 准备DSL
    request.source().query(QueryBuilders.matchAllQuery());

    // 排序 sort
    request.source().sort("price", SortOrder.ASC);
    // 分页 计算from 和 size
    request.source().from((page - 1) * size).size(size);

从DSL可以看出query和sort、from、size是同级,所以也是request.source()去点

高亮

根据搜索关键词对结果做高亮,就是在关键词中添加   <em></em> html标签

 DSL:(也是与query同级)

对查询内容 “酒店” 做高亮,高亮结果是与原数据  _source  同级的  highlight

当我们是使用  all  字段(对所有做过copy_to约束的字段)去做搜索时,需要配置require_field_match属性为false,表示不与查询字段  all  做匹配

 Java代码:

//用request.source()去点,进行配置高亮
request.source().highlighter(new HighlightBuilder().field("name").requireFieldMatch(false));

获取高亮结果:

            // 根据字段名获取高亮结果
            HighlightField highlightField = highlightFields.get("name");

            //不为空时才做下一步处理,
            if (highlightField != null) { 
                // 获取高亮值
                String name = highlightField.getFragments()[0].string();
                //可以覆盖原来的值
            }

地理查询

矩形范围查询DSL:

top_left : 左上坐标点    

bottom_right  :右下坐标点

范围查询

查询一个坐标点的五公里范围内的数据

#根据中心点做范围查询
GET /jungle_study/_search
{
  "query": {
    "geo_distance": {
      "distance": "5km", 
      "location": "31.21,121.5" 
    }
  }
}

"121.5" 是经度(longitude)

"31.21" 是纬度(latitude)

Java中实现:

构建矩形范围查询条件

GeoBoundingBoxQueryBuilder location = QueryBuilders.geoBoundingBoxQuery("location");
//左上坐标点
GeoPoint geoPoint = location.topLeft();
geoPoint.resetLat(31.21);
geoPoint.resetLon(121.5);
//右下坐标点
GeoPoint bottomRight = location.bottomRight();
bottomRight.resetLat(31.21);
bottomRight.resetLon(121.5);


 构建距离范围查询条件

QueryBuilders.geoDistanceQuery("location").distance("5km");

复合查询

常见的有两种 布尔查询 算分函数查询

查询结果中有  _score  代表与搜索词条的关联度打分,结果按照分值降序排列,分越高则排在最前

 ES中使用BM25算法进行词条和文档的相关度做打分。

DSL:

GET /jungle_study/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "term": { "user.id": "kimchy" }
      },
      "boost": 1.2
    }
  }
}

 有关复合查询的官方文档地址:Constant score query | Elasticsearch Guide [7.16] | Elastic

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1634197.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言:项目实践(贪吃蛇)

前言&#xff1a; 相信大家都玩过贪吃蛇这款游戏吧&#xff0c;贪吃蛇是久负盛名的游戏&#xff0c;它也和俄罗斯方块&#xff0c;扫雷等游戏位列经典游戏的行列&#xff0c;那贪吃蛇到底是怎么实现的呢&#xff1f; 今天&#xff0c;我就用C语言带着大家一起来实现一下这款游戏…

Springboot+Vue项目-基于Java+MySQL的校园疫情防控系统(附源码+演示视频+LW)

大家好&#xff01;我是程序猿老A&#xff0c;感谢您阅读本文&#xff0c;欢迎一键三连哦。 &#x1f49e;当前专栏&#xff1a;Java毕业设计 精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; &#x1f380; Python毕业设计 &…

达梦(DM) SQL聚集函数及日期运算操作

达梦DM SQL聚集函数及日期运算操作 聚集函数MAX、MIN、SUM、AVG、COUNT使用分析函数 sum (…) over (order by…) 可以生成累计和更改累计和的值计算出现次数最多的值 日期运算加减日、月、年加减时、分、秒日期间隔之时、分、秒日期间隔之日、月、年求两个日期间的工作天数确定…

《C语言深度解剖》(10):数组指针、指针数组和数组指针数组

&#x1f921;博客主页&#xff1a;醉竺 &#x1f970;本文专栏&#xff1a;《C语言深度解剖》《精通C指针》 &#x1f63b;欢迎关注&#xff1a;感谢大家的点赞评论关注&#xff0c;祝您学有所成&#xff01; ✨✨&#x1f49c;&#x1f49b;想要学习更多C语言深度解剖点击专栏…

抄表自动化的实现与优势

1.界定与简述 抄表自动化是一种当代关键技术&#xff0c;致力于取代传统的手动式抄表方法&#xff0c;通过远程数据数据采集解决&#xff0c;完成电力工程、水、气等公用事业电力仪表的全自动载入。这一系统利用先进的感应器、物联网技术(IoT)设备及数据数据分析工具&#xff…

2024年第十五届蓝桥杯江苏省赛回顾

呜呜呜~~~ 我在考完了后感觉自己直接炸了&#xff1a;好多学到的算法都没有用上&#xff0c;几乎所有的题目都是暴力的。。。 最后十几分钟对于一道dp算法终于有思路了&#xff0c;但是。。匆匆忙忙之间就是没有调试出来。&#xff08;还是交了一道暴力[旋风狗头]直接哭死~~&…

【七十三】【算法分析与设计】516. 最长回文子序列,二叉树,329. 矩阵中的最长递增路径,记忆化递归填表

516. 最长回文子序列 给你一个字符串 s &#xff0c;找出其中最长的回文子序列&#xff0c;并返回该序列的长度。 子序列定义为&#xff1a;不改变剩余字符顺序的情况下&#xff0c;删除某些字符或者不删除任何字符形成的一个序列。 示例 1&#xff1a; 输入&#xff1a;s &qu…

JAVA系列 小白入门参考资料 类和对象(3)

温馨提示&#xff1a; 此篇文章需要前两篇文章作为基础。 JAVA系列 小白入门参考资料 类和对象&#xff08;1&#xff09;​​​​​​​ JAVA系列 小白入门参考资料 类和对象&#xff08;2&#xff09; 目录 1. 封装 引入封装 访问修饰符 封装的具体实现 get方法和…

55.基于SpringBoot + Vue实现的前后端分离-旅游管理系统(项目 + 论文)

项目介绍 本站是一个B/S模式系统&#xff0c;采用SpringBoot Vue框架&#xff0c;MYSQL数据库设计开发&#xff0c;充分保证系统的稳定性。系统具有界面清晰、操作简单&#xff0c;功能齐全的特点&#xff0c;使得基于SpringBoot Vue技术的旅游管理系统设计与实现管理工作系统…

ElasticSearch面试题2

Mapping属性详细介绍/常见的字段数据类型&#xff1a; 映射(mapping)︰mapping是对索引库中文档的约束信息&#xff08;例如字段名、数据类型&#xff09;&#xff0c;类似表的结构约束&#xff1b;每个索引库都应该有自己的映射 数据库一定要先创建表才能去添加数据…

【Java】图书管理系统 介绍与实现

欢迎浏览高耳机的博客 希望我们彼此都有更好的收获 感谢三连支持&#xff01; 1.介绍 图书馆作为知识的殿堂和学术的中心&#xff0c;其管理系统不仅是图书馆管理的必备工具&#xff0c;更是为用户提供优质、高效服务的重要保障&#xff0c;促进了知识的传播和学术的发展。随着…

SpringSecurity + Oauth2 + jwt实现单点登录

文章目录 前言一、springsecurity oauth2 redis方式的缺点二、oauth2认证的4种模式的选择三、认证服务器的编写 第一步、创建WebSecurity配置类第二步、创建jwt仓库配置类第三步、创建UserDetailsService类第四步、创建认证服务器配置类 四、测试认证服务器的功能 1.创建Login…

【简单讲解下FastStone Capture】

&#x1f3a5;博主&#xff1a;程序员不想YY啊 &#x1f4ab;CSDN优质创作者&#xff0c;CSDN实力新星&#xff0c;CSDN博客专家 &#x1f917;点赞&#x1f388;收藏⭐再看&#x1f4ab;养成习惯 ✨希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出…

React的数据Mock实现

在前后端分类的开发模式下&#xff0c;前端可以在没有实际后端接口的支持下先进行接口数据的模拟&#xff0c;进行正常的业务功能开发 1. 常见的Mock方式 2. json-server实现Mock 实现步骤&#xff1a; 项目中安装json-server npm i -D json-server准备一个json文件 {"…

Jammy@Jetson Orin Nano - Tensorflow GPU版本安装

JammyJetson Orin Nano - Tensorflow GPU版本安装 1. 源由2. 问题3. 分析3.1 当前版本Tensorflow 2.16.13.2 GPU版本二进制安装3.3 GPU版本源代码安装3.3.1 问题1 ERROR: no such target //tensorflow/tools/pip_package:wheel3.3.2 问题2 fatal error: cstddef file not found…

数据结构(八)----树

目录 一.树的逻辑结构 1.双亲表示法(顺序存储) 2.孩子表示法&#xff08;顺序链式存储&#xff09; 3.孩子兄弟表示法&#xff08;链式存储&#xff09; 二.树的遍历 1.先根遍历 2.后根遍历 3.层次遍历 三.森林的遍历 1.森林的先序遍历 2.森林的中序遍历 四.哈夫曼…

Flutter创建自定义的软键盘

参考代码&#xff1a; Flutter - Create Custom Keyboard Examples 本文贴出的代码实现了一个输入十六进制数据的键盘&#xff1a; &#xff08;1&#xff09;支持长按退格键连续删除字符&#xff1b; &#xff08;2&#xff09;可通过退格键删除选中的文字&#xff1b; &…

《HelloGitHub》第 97 期

兴趣是最好的老师&#xff0c;HelloGitHub 让你对编程感兴趣&#xff01; 简介 HelloGitHub 分享 GitHub 上有趣、入门级的开源项目。 github.com/521xueweihan/HelloGitHub 这里有实战项目、入门教程、黑科技、开源书籍、大厂开源项目等&#xff0c;涵盖多种编程语言 Python、…

护航智慧交通安全 | 聚铭精彩亮相2024交通科技创新及信创产品推广交流会

4月26日&#xff0c;石家庄希尔顿酒店内&#xff0c;河北省智能交通协会盛大举办2024年度交通科技创新及信创产品推广交流会。聚铭网络受邀参与&#xff0c;携旗下安全产品及解决方案精彩亮相&#xff0c;为智慧交通安全保驾护航。 为深化高速公路创新驱动发展战略&#xff0…

CUDA架构介绍与设计模式解析

文章目录 **CUDA**架构介绍与设计模式解析**1** CUDA 介绍CUDA发展历程CUDA主要特性CUDA系统架构CUDA应用场景编程语言支持CUDA计算过程线程层次存储层次 **2** CUDA 系统架构分层架构并行计算模式生产-消费者模式工作池模式异步编程模式 **3** CUDA 中的设计模式工厂模式策略模…