【ElasticSearch】DSL查询语法

news2024/10/5 15:25:00

文章目录

  • 1、DSL查询分类
  • 2、DSL基本语法
  • 3、全文检索查询
  • 4、精确查询
  • 5、地理查询
  • 6、复合查询--相关性打分算法
  • 7、复合查询之Function Score Query
  • 8、复合查询之BooleanQuery

1、DSL查询分类

Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。官方文档:

https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl.html

其中,常见的查询类型有:

  • 查询所有:查询出所有数据,一般测试用。例如:
match_all
  • 全文检索(full text)查询:利用分词器对用户输入内容分词,然后去倒排索引库中匹配。例如:
match_query
multi_match_query
  • 精确查询:根据精确词条值查找数据,一般是查找keyword、数值、日期、boolean等类型字段。例如:
ids
range
term
  • 地理(geo)查询:根据经纬度查询。例如:
geo_distance
geo_bounding_box
  • 复合(compound)查询:复合查询可以将上述各种查询条件组合起来,合并查询条件。例如:
bool
function_score

2、DSL基本语法

GET /indexName/_search
{
  "query": {
    "查询类型": {
      "查询条件": "条件值"
    }
  }
}

举例,查询类型为match_all,那查询条件就为空了:

在这里插入图片描述
示例:

在这里插入图片描述

3、全文检索查询

全文检索查询,会对用户输入内容分词,常用于搜索框搜索

在这里插入图片描述

全文检索第一种:match查询

会对用户输入内容分词,然后去倒排索引库检索,语法:

GET /indexName/_search
{
  "query": {
    "match": {
      "FIELD": "TEXT"
    }
  }
}

注意这里的字段只有一个,但实际场景如:输入虹桥,预期返回business、name、brand等字段包含虹桥的数据,如此就得用上一节的copy_to:all里的all字段:

GET /indexName/_search
{
  "query": {
    "match": {
      "all": "虹桥"
    }
  }
}

在这里插入图片描述
若再加词语,分词的原因,则返回结果更多,且同时有如家和虹桥两个词语的结果会排到最前面:

GET /indexName/_search
{
  "query": {
    "match": {
      "all": "虹桥如家"
    }
  }
}

在这里插入图片描述

全文检索第二种:multi_match查询

与match查询类似,只不过允许同时查询多个字段,语法:

GET /indexName/_search
{
  "query": {
    "multi_match": {
      "query": "TEXT",
      "fields": ["FIELD1", " FIELD12"]
    }
  }
}

此时就不用借助copy_to和定义的all字段了:

GET /hotel/_search
{
  "query": {
    "multi_match": {
      "query": "虹桥如家",
      "fields": ["brand", "name","business"]
    }
  }
}

在这里插入图片描述

二者结果一样,但从性能考虑,推荐match+copy_to,因为参与搜索的字段越多,性能越低。


小结:
在这里插入图片描述

4、精确查询

精确查询一般是查找keyword、数值、日期、boolean等类型字段。所以不会对搜索条件分词。常用的两种:

  • term:根据词条精确值查询
  • range:根据值的范围查询

在这里插入图片描述

term查询:

// term查询
GET /indexName/_search
{
  "query": {
    "term": {
      "FIELD": {
        "value": "VALUE"
      }
    }
  }
}

举例:

// term查询
GET /hotel/_search
{
  "query": {
    "term": {
      "city": {
        "value": "上海"
      }
    }
  }
}

在这里插入图片描述

精确匹配,必须一模一样:

在这里插入图片描述

range查询:

// range查询
GET /indexName/_search
{
  "query": {
    "range": {
      "FIELD": {
        "gte": 10,
        "lte": 20
      }
    }
  }
}

举例:

// range查询
GET /hotel/_search
{
  "query": {
    "range": {
      "price": {
        "gte": 100,
        "lte": 300
      }
    }
  }
}

在这里插入图片描述

gt: 大于
gte: 大于等于
lt: 小于
lte: 小于等于

小结:

在这里插入图片描述

5、地理查询

根据经纬度查询。常见的使用场景包括:

  • 携程:搜索我附近的酒店
  • 滴滴:搜索我附近的出租车
  • 微信:搜索我附近的人

在这里插入图片描述

geo_bounding_box:

查询geo_point值落在某个矩形范围的所有文档

// geo_bounding_box查询
GET /indexName/_search
{
  "query": {
    "geo_bounding_box": {
      "FIELD": {
        "top_left": {
          "lat": 31.1,
          "lon": 121.5
        },
        "bottom_right": {
          "lat": 30.9,
          "lon": 121.7
        }
      }
    }
  }
}

如下图,蓝色地标为一个个酒店,落在矩形之内的即是符合要求的:

在这里插入图片描述

geo_distance:

查询到指定中心点小于某个距离值的所有文档

// geo_distance 查询
GET /indexName/_search
{
  "query": {
    "geo_distance": {
      "distance": "15km",
      "FIELD": "31.21,121.5"
    }
  }
}
// "31.21,121.5"是我的位置坐标
//FIELD则写酒店位置字段,即location
//以上即查出以我为中心,附近15KM内的酒店

在这里插入图片描述

示例:

GET /hotel/_search
{
  "query": {
    "geo_distance": {
      "distance": "5km",
      "location": "31.21,121.5"
    }
  }
}

在这里插入图片描述

6、复合查询–相关性打分算法

复合(compound)查询就是将上面这几种简单查询组合起来,实现更复杂的搜索逻辑。

相关性打分算法

在这里插入图片描述

在这里插入图片描述
三个文档里都有如家,大家都加一定得分,那这个词意义不大,即它相应的权重应该低一点,因此,TF-IDF算法:

在这里插入图片描述
TF-IDF算法受词频影响太大,
在这里插入图片描述

因此elasticsearch5.0后,相关性打分算法采用BM25算法:

在这里插入图片描述

小结:
在这里插入图片描述

当然可以人为控制文档相关性算分,从而控制文档排名(fuction score:算分函数查询),例如百度竞价,谁出价高谁就在搜索第一位。

在这里插入图片描述

7、复合查询之Function Score Query

使用 function score query,可以修改文档的相关性算分(query score),根据新得到的算分排序。

在这里插入图片描述

关键点:

  • 过滤条件:哪些文档需要算分加权
  • 算分函数:与query score运算后得到新的算分
  • 加权模式:算分函数的结果和query score如何运算,相乘、相加、替代、求和、取平均…
案例:给"如家"这个品牌的酒店排名靠前一些

比如搜外滩附近的酒店,先不给任何品牌人工加分,看下结果:

在这里插入图片描述
接下来过滤品牌为如家的,并给对应的文档加分,算分函数用weight,加权模式为默认的相乘:

GET /hotel/_search
{
  "query": {
    "function_score": {
      "query": {// ... },
      "functions": [ // 算分函数
        {
          "filter": { // 满足的条件,品牌必须是如家
            "term": {
              "brand": "如家"
            }
          },
          "weight": 2 // 算分权重为2
        }
      ],
      "boost_mode": "sum"
    }
  }
}

在这里插入图片描述

可以看到外滩如家由3.8变成了38,一跃成为第一。

小结:

在这里插入图片描述

8、复合查询之BooleanQuery

布尔查询是一个或多个查询子句的组合(和Function Score Query不一样,不是用来修改算分的)。子查询的组合方式有:

  • must:必须匹配must[ ]里的每个子查询,类似“与”
  • should:选择性匹配子查询,类似“或”
  • must_not:必须不匹配,不参与算分,类似“非”,常用于”不高于"、"不低于"场景
  • filter:必须匹配,不参与算分

适用场景如:

在这里插入图片描述

对于不参与算分的查询,就放到must_not或者filter,减少不必要的算分,以提高查询性能。

GET /hotel/_search
{
  "query": {
    "bool": {   //类型为bool
      "must": [
        {"term": {"city": "上海" }}
      ],
      "should": [
        {"term": {"brand": "皇冠假日" }},
        {"term": {"brand": "华美达" }}  //这两个品牌都可以
      ],
      "must_not": [
        { "range": { "price": { "lte": 500 } }} //小于等于500取反,即大于500
      ],
      "filter": [
        { "range": {"score": { "gte": 45 } }}   //用户评分必须大于45分
      ]
    }
  }
}

需求:搜索名字包含“如家”,价格不高于400,在坐标31.21,121.5周围10km范围内的酒店。

GET /hotel/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {"name": "如家"}
        }
      ],
      "must_not": [
        {
          "range": { "price": {"gt": 400}}
        }
      ],
      "filter": [
        {
          "geo_distance": {
            "distance": "10km", "location": {"lat": 31.21, "lon": 121.5}
          }
        }
      ]
    }
  }
}

运行:

在这里插入图片描述
将filter中的查询搬到must:

在这里插入图片描述


小结:
在这里插入图片描述

到此,可以使用DSL,来从海量数据中检索出我需要的数据了!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/725712.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【ARM Coresight 系列文章 2 - ARM Coresight 介绍】

文章目录 1.1 ARM Coresight 介绍1.1.1 ARM Coresight 发展历史 1.2 ARM Coresight 框架介绍1.1.1 Trace 通路1.1.3 Debug 通路1.1.4 Trigger 通路 1.1 ARM Coresight 介绍 ARM Coresight是ARM公司提供的一种调试和跟踪技术,用于ARM处理器的调试和性能分析。它通过…

Java中规模软件开发实训——简单的文本编辑器(代码注释详解)

✨博主:命运之光 🌸专栏:Python星辰秘典 🐳专栏:web开发(html css js) ❤️专栏:Java经典程序设计 ☀️博主的其他文章:点击进入博主的主页 前言:在现代社会中…

k8s如何伸缩应用程序和执行滚动更新

一、伸缩应用程序 我们创建了一个 Deployment (opens new window),然后通过 服务 (opens new window)提供访问 Pod 的方式。我们发布的 Deployment 只创建了一个 Pod 来运行我们的应用程序。当流量增加时,我们需要对应用程序进行伸缩操作以满足系统性能…

第五章:L2JMobius学习 – 快速部署L2JMobius汉化版

L2JMobius是一套开源的 LineageII 的服务器端代码,使用Java语言编写。在前面的章节中,我们安装了mariadb10数据库以及jdk17运行环境,这两个是必须的。紧接着,我们又安装了eclipse开发工具,然后创建了“L2J_Mobius”Jav…

按键输入实验(stm32)

目录 按键的相关代码key.ckey.h LED的相关代码BEEP的相关代码beep.cbeep.h main.c代码的相关说明相关硬件说明实验结果 说明:以下内容参考正点原子资料 按键的相关代码 key.c void KEY_Init(void) //IO初始化 { GPIO_InitTypeDef GPIO_InitStructure;RCC_APB2Peri…

ModaHub魔搭社区:可视化的AI原生云向量数据库 Milvus 2.2.9 :JSON、PartitionKey、Dynamic Schema

目录 新特性 功能增强 其他优化 问题修复 亮点颇多、精彩程度堪比大版本的 Milvus 2.2.9 来啦! 随着 LLM 的持续火爆,众多应用开发者将目光投向了向量数据库领域,而作为开源向量数据库的领先者,Milvus 也充分吸收了大量来自社…

ROS:话题名称设置

目录 一、 前言二、rosrun设置话题重映射三、launch文件设置话题重映射四、编码设置话题名称4.1C4.1.1全局名称4.1.2相对名称4.1.3私有名称 4.2Python 实现4.2.1全局名称4.2.2相对名称4.2.3私有名称 一、 前言 在ROS中节点名称可能出现重名的情况,同理话题名称也可…

[攻防世界] [RE] [APK] app2

解题思路 导入jadx查看manifest.xml 查看主函数并未发现有价值的东西&#xff0c;于是查看manifest.xml中主函数下一个<activity> 截取FileDataActivity代码 package com.tencent.testvuln;import android.os.Bundle; import android.widget.TextView; import com.tence…

2022年真题 - 15 - 磁盘管理(vdo磁盘)

磁盘管理 - vdo磁盘 题目配置验证配置题目 StorageSrv - 磁盘管理 在 storagesrv 上新加一块 10G 磁盘;创建 vdo 磁盘,并开启 vdo 磁盘的重删和压缩;名字为 vdodisk,大小为150G,文件系统为 ext4;并设置开机自动挂载。挂载到 /vdodata。配置 新加一块 10G 磁盘; 安装…

驱动 作业 day4

编写LED灯的驱动&#xff0c;创建三个设备文件&#xff0c;每个设备文件和一个LED灯绑定&#xff0c;当操作这个设备文件时只能控制设备文件对应的这盏灯。 此时没有安装led2 和led3的驱动所以会打开设备文件失败 装完以后就可以正常控制了 以下是设备现象 head.h ubuntuu…

docker 的整体架构及各模块组件 《深入docker底层原理》

1.Docker 整体架构 Docker 是一个 C/S 模式的架构&#xff0c;后端是一个松耦合架构&#xff0c;模块各司其职。 1、用户是使用 Docker Client 与 Docker Daemon 建立通信&#xff0c;并发送请求给后者。 2、Docker Daemon 作为 Docker 架构中的主体部分&#xff0c;首先提供…

Windows如何设置自动关闭未响应的程序?Windows设置自动关闭未响应的程序方法,带图详解

Windows系统程序经常出现程序未响应现象&#xff0c;如何通过注册表使其自动关闭呢 1、首先快捷键winR唤出【运行】 输入regedit 2、确定后就打开了注册表编辑器&#xff0c;定位到【HKEY_CURREnT_UsER\Control panel\desktop】项下 3、在右侧找【AutoEndTasks】数值数据&#…

yolo.h5文件问题的解决 - 吴恩达深度学习:目标检测之YOLO算法

1.下载下载yad2k: git clone https://github.com/allanzelener/yad2k.git 这里面顺便有yad2k.py文件 2.下载yolov2.cfg https://github.com/pjreddie/darknet/tree/master/cfg 3.下载yolov2.weights http://pjreddie.com/media/files/yolo.weights 需要这三个文件 自己去githup…

易模为真人3D手办制作带来了创新

3d打印技术是一项近年来迅速发展的先进制造技术&#xff0c;逐渐在各个领域展现出无限的潜力。其中&#xff0c;3d打印真人手办成为了一个备受关注的领域。在市面上&#xff0c;我们常常可以看到一些热门动漫角色或明星的真人3d手办&#xff0c;逼真的细节和完美的再现度让人们…

iOS上架报错:无法添加以供审核

无法提交以供审核 要开始审核流程 必须提供以下项目 您必须为要添加的 app 提供版权信息。 您在提交 app 审核时遇到的问题是因为需要提供版权信息&#xff0c;而您的 app 缺少相关的版权信息。以下是解决此问题的步骤&#xff1a; 确认您是否拥有 app 的版权&#xff1a;在提…

mac苹果电脑,怎么把mkv转换mp4格式

mac苹果电脑&#xff0c;怎么把mkv转换mp4格式&#xff1f;如果你是一名mac苹果电脑的用户&#xff0c;在电脑上下载到mkv格式的视频后会发现它使用起来非常的麻烦&#xff0c;甚至不能直接打开播放。mkv其实也是一种时间比较久远的视频文件格式&#xff0c;但是不知道是什么原…

eNSP-OSPF组播拓展

OSPF组播拓展 文章目录 OSPF组播拓展一、拓扑结构二、基础配置三、测试验证 启动 OSPF 协议后 &#xff0c; OSPF 将向本地所有运行 OSPF 协议的接口以组播224.0.0.5的形式发送hello报 文 &#xff1b; hello 报文中将携带本地 RID 值 &#xff0c; 以及本地已知的邻居的RID值&…

nginx反向代理 404 问题

发现我们设置了反向代理没有起作用&#xff0c;最后发现原来是伪静态惹得祸 解决nginx添加反向代理代码不生效-与原rewrite伪静态规则冲突了 以thinkphp官方给的伪静态为例 if (!-e $request_filename){rewrite ^(.*)$ /index.php?s$1 last; break;}仔细研究发现发现问…

Android OpenGL ES 学习(十三) -离屏渲染FBO(截图)RBO, OES转 FBO

Android OpenGL ES 学习(一) – 基本概念 Android OpenGL ES 学习(二) – 图形渲染管线和GLSL Android OpenGL ES 学习(三) – 绘制平面图形 Android OpenGL ES 学习(四) – 正交投屏 Android OpenGL ES 学习(五) – 渐变色 Android OpenGL ES 学习(六) – 使用 VBO、VAO 和 EB…

威胁和漏洞管理增强远程 IT 安全性

威胁和漏洞管理是保护组织设备和数据的主动方法。它可以帮助管理员识别漏洞并检查安全设置是否薄弱。通过使用此方法&#xff0c;可以在任何弱点成为安全漏洞之前对其进行修复。 对远程威胁和漏洞管理工具的需求 随着越来越多的员工远程工作&#xff0c;网络攻击的可能性也在…