ElasticSearch核心之DSL查询语句实战

news2024/12/25 18:05:27

在这里插入图片描述

什么是DSL?

Elasticsearch提供丰富且灵活的查询语言叫做DSL查询(Query DSL),它允许你构建更加复杂、强大的查询。 DSL(Domain Specific Language特定领域语言)以JSON请求体的形式出现。目前常用的框架查询方法什么的底层都是构建DSL语句实现的,所以你必须掌握DSL。
例如:

GET book/_search
{
  "query": {
    "match": {
      "name": "活着"
    }
  }
}

准备测试数据

请参考我的另一篇文章:https://blog.csdn.net/IndexMan/article/details/140611813
#精确查询
也就是term查询不会分析查询条件,只有当词条和查询字符串完全匹配时才匹配,也就是精确查找,比如数字,日期,布尔值或 not_analyzed 的字符串(未经分析的文本数据类型):
GET /article_doc/_doc/1815982664109314052

  • 请求
{
  "query": {
    "term": {
      "category": "技术"
    }
  }
}
  • 响应
{
  "_index": "article_doc",
  "_type": "_doc",
  "_id": "1815982664109314052",
  "_version": 1,
  "_seq_no": 4,
  "_primary_term": 1,
  "found": true,
  "_source": {
    "author": "华为",
    "category": "技术",
    "content": "就在昨天,华为正式官宣自研编程语言 「仓颉」 正式诞生!!!\r\n\r\n华为,作为全球领先的信息与通信技术(ICT)解决方案提供商,以“仓颉”编程语言的诞生,再次引领了技术革新的潮流,为智能时代的软件开发定义了新的艺术。",
    "createTime": "2024-07-24 13:29:41",
    "id": "1815982664109314052",
    "readCount": 1,
    "title": "华为自研编程语言“仓颉”正式发布"
  }
}

terms查询:terms 跟 term 有点类似,但 terms 允许指定多个匹配条件。 如果某个字段指定了多个值,那么文档需要一起去 做匹配:

{
  "query": {
    "terms": {
      "category": [ "技术","管理"]
    }
  }
}

全文查询

顾名思义,全文查询会分析查询条件,先将查询条件进行分词,然后查询,求并集。

区别于term,match的区别是:match是经过analyer分词器分词的,也就是说,文档首先被分析器给处理了。根据不同的分析器,分析的结果也稍显不同,然后再根据分词结果进行匹配。term则不经过分词,它是直接去倒排索引中查找了精确的值了。

match 查询的主要用法:

  • match_all:查询所有,无条件;太简单不再演示!
  • match:返回所有匹配到的数据
  • match_phrase:短语查询,在match的基础上进一步查询词组,可以指定slop分词间隔。
{
  "query": {
    "match_phrase": {
      "content": {
        "query": "中国"
      }
    }
  }
}
  • match_phrase_prefix:前缀查询,根据短语中最后一个词组做前缀匹配,可以应用于搜索提示,但注意和max_expanions搭配。
  • multi_match:多字段查询,使用相当的灵活,可以完成match_phrase和match_phrase_prefix的工作。

post /article_doc/_search

  • 请求
{
  "query": {
    "match": {
      "content": "技术"
    }
  }
}
  • 响应
{
  "took": 11,
  "timed_out": false,
  "_shards": {
    "total": 1,
    "successful": 1,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": {
      "value": 1,
      "relation": "eq"
    },
    "max_score": 3.3864474,
    "hits": [
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664109314052",
        "_score": 3.3864474,
        "_source": {
          "author": "华为",
          "category": "技术",
          "content": "就在昨天,华为正式官宣自研编程语言 「仓颉」 正式诞生!!!\r\n\r\n华为,作为全球领先的信息与通信技术(ICT)解决方案提供商,以“仓颉”编程语言的诞生,再次引领了技术革新的潮流,为智能时代的软件开发定义了新的艺术。",
          "createTime": "2024-07-24 13:29:41",
          "id": "1815982664109314052",
          "readCount": 1,
          "title": "华为自研编程语言“仓颉”正式发布"
        }
      }
    ]
  }
}
  • 多字段查询
{
  "query": {
    "multi_match": {
      "query": "中国",
      "fields": ["title","content"]
    }
  }
}

排序查询

例如,按照文章阅读数降序排序:

{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "readCount": {
        "order": "desc"
      }
    }
  ]
}

范围查询

range 过滤允许我们按照指定范围查找一批数据,范围操作符包含:

  • gt:大于,相当于关系型数据库中的 >
  • gte:大于等于,相当于关系型数据库中的 >=
  • lt:小于,相当于关系型数据库中的 <
  • lte:小于等于,相当于关系型数据库中的 <=

例如,查询文章阅读数大于5的文章列表:

{
  "query": {
    "range": {
      "readCount": {
        "gt": 5
      }
    }
  }
}

分页查询

{
  "query": {
    "match_all": {}
  },
  "from": 0,
  "size": 5
}

高亮查询

{
  "query": {
    "match": {
      "content": "智能"
    }
  },
  "highlight": {
    "fields": {
      "content": {
        "pre_tags": "<b class='key' style='color:red'>",
        "post_tags": "</b>"
      }
    }
  }
}
{
  "took": 32,
  "timed_out": false,
  "_shards": {
    "total": 1,
    "successful": 1,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": {
      "value": 3,
      "relation": "eq"
    },
    "max_score": 1.2924489,
    "hits": [
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664109314052",
        "_score": 1.2924489,
        "_source": {
          "author": "华为",
          "category": "技术",
          "content": "就在昨天,华为正式官宣自研编程语言 「仓颉」 正式诞生!!!\r\n\r\n华为,作为全球领先的信息与通信技术(ICT)解决方案提供商,以“仓颉”编程语言的诞生,再次引领了技术革新的潮流,为智能时代的软件开发定义了新的艺术。",
          "createTime": "2024-07-24 13:29:41",
          "id": "1815982664109314052",
          "readCount": 1,
          "title": "华为自研编程语言“仓颉”正式发布"
        },
        "highlight": {
          "content": [
            "华为,作为全球领先的信息与通信技术(ICT)解决方案提供商,以“仓颉”编程语言的诞生,再次引领了技术革新的潮流,为<b class='key' style='color:red'>智能</b>时代的软件开发定义了新的艺术。"
          ]
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664180617221",
        "_score": 0.9935417,
        "_source": {
          "author": "狸花猫",
          "category": "人工智能",
          "content": "在信息时代,Web 页面成为我们与世界交互的重要窗口。如今,AI 程序的出现,为 Web 页面带来了新的变革。通过在 Web 页面上实现图片识别,我们即将迈入一个更加智能与便捷的时代。它将赋予网页全新的能力,使其能够理解图片的内容,为用户带来前所未有的体验。让我们一同踏上这充满无限可能的探索之旅。\n\n作者:睡着学\n链接:https://juejin.cn/post/7359084330121789452\n来源:稀土掘金\n著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。",
          "createTime": "2024-07-24 13:29:41",
          "id": "1815982664180617221",
          "readCount": 3,
          "title": "AI 赋能007 jack  Web 页面,图像识别超越想象"
        },
        "highlight": {
          "content": [
            "通过在 Web 页面上实现图片识别,我们即将迈入一个更加<b class='key' style='color:red'>智能</b>与便捷的时代。它将赋予网页全新的能力,使其能够理解图片的内容,为用户带来前所未有的体验。让我们一同踏上这充满无限可能的探索之旅。"
          ]
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664180617220",
        "_score": 0.85687244,
        "_source": {
          "author": "kimi",
          "category": "人工智能",
          "content": "今年,随着各大GLM模型的开源和算力的提升,尤其是最近比较火热的月之暗面的Kimi 模型,AI应用场景中的各种智能体如雨后春笋般涌现。许多同学们纷纷表达了加入AI应用的学习和测试的愿望,然而各大模型提供商所提供的API的免费tokens在数量和其他方面都存在着不同的限制,这给我们这些白嫖党带来了一定的不便。今天,在GitHub上,我发现了这个名为kimi-free-api的项目,它为我们学习和测试使用GLM模型提供了极大的便利。\n\n作者:修己xj\n链接:https://juejin.cn/post/7357546247848427558\n来源:稀土掘金\n著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。",
          "createTime": "2024-07-22 13:29:41",
          "id": "1815982664180617220",
          "readCount": 10,
          "title": "免费使用Kimi的API接口,kimi-free-api真香"
        },
        "highlight": {
          "content": [
            "今年,随着各大GLM模型的开源和算力的提升,尤其是最近比较火热的月之暗面的Kimi 模型,AI应用场景中的各种<b class='key' style='color:red'>智能</b>体如雨后春笋般涌现。"
          ]
        }
      }
    ]
  }
}

布尔查询

bool 查询可以用来合并多个条件查询结果的布尔逻辑,它包含以下操作符:

  • must:多个查询条件必须完全匹配,相当于关系型数据库中的 且 and
  • should:至少有一个查询条件匹配,相当于关系型数据库中的 或 or
  • must_not: 多个查询条件的相反匹配,相当于关系型数据库中的 非 not
  • filter:过滤满足条件的数据。

range:条件筛选范围,上面讲过了

{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": "智能"
          }
        },
        {
          "match": {
            "content": "智能"
          }
        }
      ]
    }
  }
}

聚合查询

我们平时在使用Elasticsearch时,更多会用到聚合操作,它类似SQL中的group by操作。ES的聚合查询一定是先查出结果,然后对结果使用聚合函数做处理,常用的操作有:avg:求平均、max:最大值、min:最小值、sum:求和等。

在ES中聚合分为指标聚合和分桶聚合:

  • 指标聚合:指标聚合对一个数据集求最大、最小、和、平均值等
{
  "query": {
    "match_all": {}
  },
  "aggs": {
    "avg_read": {
      "avg": {
        "field": "readCount"
      }
    }
  },
  "_source": [
    "id",
    "readCount"
  ]
}
  • 响应
{
  "took": 5,
  "timed_out": false,
  "_shards": {
    "total": 1,
    "successful": 1,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": {
      "value": 10,
      "relation": "eq"
    },
    "max_score": 1,
    "hits": [
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982662364483586",
        "_score": 1,
        "_source": {
          "id": "1815982662364483586",
          "readCount": 0
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664109314049",
        "_score": 1,
        "_source": {
          "id": "1815982664109314049",
          "readCount": 1
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664109314050",
        "_score": 1,
        "_source": {
          "id": "1815982664109314050",
          "readCount": 2
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664109314052",
        "_score": 1,
        "_source": {
          "id": "1815982664109314052",
          "readCount": 1
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664109314053",
        "_score": 1,
        "_source": {
          "id": "1815982664109314053",
          "readCount": 5
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664180617218",
        "_score": 1,
        "_source": {
          "id": "1815982664180617218",
          "readCount": 6
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664180617219",
        "_score": 1,
        "_source": {
          "id": "1815982664180617219",
          "readCount": 0
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664180617220",
        "_score": 1,
        "_source": {
          "id": "1815982664180617220",
          "readCount": 10
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664109314051",
        "_score": 1,
        "_source": {
          "id": "1815982664109314051",
          "readCount": 3
        }
      },
      {
        "_index": "article_doc",
        "_type": "_doc",
        "_id": "1815982664180617221",
        "_score": 1,
        "_source": {
          "id": "1815982664180617221",
          "readCount": 3
        }
      }
    ]
  },
  "aggregations": {
    "avg_read": {
      "value": 3.1
    }
  }
}
  • 分桶聚合:除了有聚合函数外,还可以对查询出的数据进行分组group by,再在组上进行游标聚合。
{
  "size": 0,
  "query": {
    "match_all": {}
  },
  "aggs": {
    "age_group": {
      "terms": {
        "field": "category"
      }
    }
  }
}
  • 响应:
{
  "took": 208,
  "timed_out": false,
  "_shards": {
    "total": 1,
    "successful": 1,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": {
      "value": 10,
      "relation": "eq"
    },
    "max_score": null,
    "hits": []
  },
  "aggregations": {
    "age_group": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 0,
      "buckets": [
        {
          "key": "人工智能",
          "doc_count": 3
        },
        {
          "key": "技术",
          "doc_count": 2
        },
        {
          "key": "经济",
          "doc_count": 2
        },
        {
          "key": "生活",
          "doc_count": 1
        },
        {
          "key": "管理",
          "doc_count": 1
        },
        {
          "key": "面试",
          "doc_count": 1
        }
      ]
    }
  }
}

总结

以上就是DSL的核心用法,用到了再看也不迟,单纯记忆很快就会忘记没啥用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1951484.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux 网络子系统

__netif_receive_skb_core 是 Linux 内核网络子系统中一个非常重要的函数&#xff0c;它负责将网络设备驱动层接收到的数据包传递到上层协议栈进行处理。以下是对该函数的一些关键点的详细解析&#xff1a; 一、函数作用 __netif_receive_skb_core 函数是处理接收到的网络数据…

HAL STM32 SPI/ABZ/PWM方式读取MT6816磁编码器数据

HAL STM32 SPI/ABZ/PWM方式读取MT6816磁编码器数据 &#x1f4da;MT6816相关资料&#xff08;来自商家的相关资料&#xff09;&#xff1a; 资料&#xff1a;https://pan.baidu.com/s/1CAbdLBRi2dmL4D7cFve1XA?pwd8888 提取码&#xff1a;8888&#x1f4cd;驱动代码编写&…

C++的auto关键字

一、auto关键字介绍 因为C是静态类型语言&#xff0c;即会在编译阶段进行类型检查。我们知道对象的类型决定一个对象所能参与的操作&#xff0c;因此如果类型检查过程中发现试图执行对象类型不支持的操作&#xff0c;编译器将会报错。 这要求我们在声明变量时必须指出变量的类…

php、mantis、showDoc部署

下载软件安装包:Mantis Bug Tracker 下载vs包&#xff1a;https://www.microsoft.com/en-us/download/details.aspx?id48145,解决“因为计算机中丢失msvcr110.dll”下载apache服务器:Apache VS17 binaries and modules download下载php:PHP For Windows: Binaries and source…

Kylin 入门教程

Apache Kylin 是一个开源的分布式数据仓库和 OLAP(在线分析处理)引擎,旨在提供亚秒级查询响应时间,即使在处理超大规模数据集时也是如此。Kylin 可以有效地将原始数据预计算为多维数据立方体(Cube),并利用这些预计算结果来提供快速查询。本文将带你从基础知识到操作实践…

【React】详解“最新”和“最热”切换与排序

文章目录 一、基本概念和初始化二、切换与排序功能的实现1. 函数定义和参数2. 设置活动 Tab3. 定义新列表变量4. 根据排序类型处理列表4.1 按时间降序排序4.2 按点赞数降序排序 5. 更新评论列表 三、渲染导航 Tab 和评论列表1. map 方法2. key 属性3. className 动态赋值4. onC…

五大设备制造商的 200 多种机型的安全启动功能完全失效

2012 年&#xff0c;一个由硬件和软件制造商组成的行业联盟采用了安全启动技术&#xff0c;以防范长期存在的安全威胁。这种威胁是恶意软件的幽灵&#xff0c;它可以感染 BIOS&#xff0c;即每次计算机启动时加载操作系统的固件。从那里&#xff0c;它可以保持不受检测和删除&a…

jenkins参数化构建在UI中定义脚本中使用

先看配置&#xff1a; 流水线脚本&#xff1a; pipeline {agent {//label "${server}"label "${28}"}stages {stage(Hello) {steps {echo "--------------------------"// 只有这个可以输出变量echo "${character_argument}"echo &q…

Pytorch使用教学5-视图view与reshape的区别

有同学后台留言问为什么view有时可对张量进行形变操作&#xff0c;有时就会报错&#xff1f;另外它和reshape功能好像一致&#xff0c;有什么区别呢&#xff1f;本文就带你了解PyTorch中视图的概念。 在PyTorch中对张量进行形变操作时&#xff0c;很多同学也会使用view方法&am…

kettle从入门到精通 第八十课 ETL之kettle kettle中的json对象字段写入postgresql中的json字段

场景&#xff1a;源数据库表为mysql的其中有json字段&#xff0c;通过kettle 查询出来 插入到目标数据库 postgresql中&#xff0c;对应的表中也有json字段。。但是报错&#xff0c;提示kettle查询出来是varchar的的字段&#xff0c;无法插入到目标数据库中。 1、创建测试表。 …

【VSCode实战】Golang无法跳转问题竟是如此简单

上一讲【VSCode实战】Go插件依赖无法安装 – 经云的清净小站 (skycreator.top)&#xff0c;开头说到了在VSCode中Golang无法跳转的问题&#xff0c;但文章的最后也没给出解决方案&#xff0c;只解决了安装Go插件的依赖问题。 解决了插件依赖问题&#xff0c;无法跳转的问题也离…

echo,tail ,飘号和重定向符

1. 输出指定内容 echo 语法; echo 输出的内容 较多内容使用 “ 双引号 ”&#xff0c; 相当于 printf &#xff1b; 2. 飘号 飘号&#xff0c;也就是我们通常所说的反引号&#xff0c;被飘号包括的内容会当作命令执行&#xff0c;常配合 echo 使用&#xff0c;输出结果为…

【python】python图书管理系统_普通用户+管理员菜单(源码+论文)【独一无二】

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化【获取源码商业合作】 &#x1f449;荣__誉&#x1f448;&#xff1a;阿里云博客专家博主、5…

Docker安装 OpenResty详细教程

OpenResty 是一个基于 Nginx 的高性能 Web 平台&#xff0c;它集成了 Lua 脚本语言&#xff0c;使得开发者可以在 Nginx 服务器上轻松地进行动态 Web 应用开发。OpenResty 的核心目标是通过将 Nginx 的高性能与 Lua 的灵活性结合起来&#xff0c;提供一个强大且高效的 Web 开发…

IO多路复用——select

仅一个线程、进程处理并发 IO多路转接&#xff08;复用&#xff09;之select 跨平台适用linux&#xff0c;windows 底层&#xff1a;线性表 IO多路转接&#xff08;复用&#xff09;之poll 适用linux 底层&#xff1a;线性表 IO多路转接&#xff08;复用&#xff09;之epo…

微信小程序支付流程

前端需要做的事情&#xff1a; 生成平台订单&#xff1a;前端调用接口&#xff0c;向后端传递购买的商品信息、收货人信息&#xff0c;&#xff08;后端生成平台订单&#xff0c;返回订单编号&#xff09;获取预付单信息&#xff1a;将订单编号发送给后端后&#xff0c;&#x…

2024最新Selenium面试题(附带答案),建议收藏备用

一.你在TestNG中使用了哪些注解&#xff1f; TestBeforeSuiteAfterSuiteBeforeTestAfterTestBeforeClassAfterClassBeforeMethodAfterMethod 二.如何从Excel中读取数据&#xff1f; FileInputStream fs new FileInputStream(“excel文件路径”); Workbook wb WorkbookFact…

Web前端知识视频教程分享(五) Bootstrap

资料下载地址&#xff1a; https://545c.com/f/45573183-1336822373-45bb4f?p7526 (访问密码: 7526)

WordPress原创插件:自定义文章标题颜色

插件设置截图 文章编辑时&#xff0c;右边会出现一个标题颜色设置&#xff0c;可以设置为任何颜色 更新记录&#xff1a;从输入颜色css代码&#xff0c;改为颜色选择器&#xff0c;更方便&#xff01; 插件免费下载 https://download.csdn.net/download/huayula/89585192…