Elasticsearch:DSL Query

news2024/11/16 12:40:22

Query DSL的分类

Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。常见的查询类型包括:

  • 查询所有:查询出所有的数据,一般测试用,例如:match_all,但有分页限制,一次20条左右
  • 全文检索(full text)查询:利用分词器对用户输入内容分词,然后去倒排索引库中匹配。常见的有两种
    • match_query
    • multi_match_query
  • 精确查询:根据精确词条值查找数据,一般查找keyword、数值、日期、boolean等类型字段。(不需要分词,整体做倒排索引)
    • ids (按照id查询)
    • range (按照数值范围查询)
    • term (按照数据的值查询)
  • 地理(geo)查询:根据经纬度查询,例如:
    • geo_distance
    • geo_bounding_box
  • 复合(compound)查询:符合查询可以将上述各种查询条件组合起来,合并查询条件
    • bool
    • function_score

DSL Query基本语法
查询的基本语法如下:

GET /indexName/_search
{
  "query":{
    "查询类型":{
      "查询条件":"条件值"
    }
  }
}

查询所有

GET /indexName/_search
{
  "query":{
    "match_all":{
    }
  }
}

全文检索查询

全文检索查询会对用户输入内容分词,常用于搜索框搜索

  • match查询:全文检索查询的一种,会对用户输入内容分词,然后去倒排索引库检索。
    语法
GET /indexName/_search
{
  "query":{
    "match":{
      "字段":"搜索的内容"
    }
  }
}

实例

GET /es_test/_search
{
  "query":{
    "match":{
      "name.lastName":"张"
    }
  }
}

结果

{
  "took" : 5,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 0.2876821,
    "hits" : [
      {
        "_index" : "es_test",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.2876821,
        "_source" : {
          "info" : "测试es",
          "email" : "xxx@163.com",
          "name" : {
            "firstName" : "三",
            "lastName" : "张"
          },
          "age" : 16
        }
      }
    ]
  }
}

查询所有

GET /es_test/_search
{
  "query":{
    "match":{
      "all":"张"
    }
  }
}
  • multi_match:与match查询类似,允许同时查询多个字段,即从对应的字段中查询匹配的内容。参与查询字段越多,查询性能越差,建议使用copy_to将多个要查的字段copy到一个字段。
    语法
GET /indexName/_search
{
  "query":{
    "mutil_match":{
      "query":"要查询的内容",
      "fields":["字段1","字段2"]
    }
  }
}

精确查询

精确查询一般是查找keyword、数值、日期、boolean等类型字段。所以不会对搜索条件分词。
常见的有:

  • term:根据词条精确值查询
    语法
GET /indexName/_search
{
  "query":{
    "term":{
      "FIELD":{
        "value":"VALUE"
      }
    }
  }
}

例子

GET /es_test/_search
{
  "query":{
    "term":{
      "age":{
        "value":"16"
      }
    }
  }
}
  • range:根据值的范围查询
    语法
GET /indexName/_search
{
  "query":{
    "range":{
      "FIELD":{
        "gte":10,
        "lte":20
      }
    }
  }
}

例子

GET /es_test/_search
{
  "query":{
    "range":{
      "age":{
        "gte":10,
        "lte": 20
      }
    }
  }
}

地理查询

根据经纬度查询,常见的使用场景:查询附近的酒店,查询附近的出租车,搜索附近的人

  • geo_bounding_box:查询geo_point值落在某个矩形范围的所有文档
GET /indexName/_search
{
  "query": {
    "geo_bounding_box":{
      "FIELD1":{
        "top_left":{
          "lat":31.1,
          "lon":121.5
        }
      },
      "FIELD2":{
        "bottom_right":{
          "lat":30.9,
          "lon":121.7
        }
      }
    }
  }
}
  • geo_distance:查询到指定中心点小于某个距离值的所有文档
GET /indexName/_search
{
  "query": {
    "geo_distance":{
      "distance":"15km",
      "FIELD":"31.21,121.5"
    }
  }
}

复合查询

复合(compound)查询,可以将其他简单查询组合起来,实现更复杂的搜索逻辑,例如:

  • function score:算分函数查询,可以控制文档相关性算分,控制文档排名。例如百度竞价

相关性打分算法
当我们利用match查询时,文档结果会根据与搜索词条的关联度打分(_score),返回结果时按照分值降序排列。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
使用function score query,可以修改文档的相关性算分(query score),根据新得到的算分排序。

GET /indexName/_search
{
  "query": {
    "function_score": {
      "query": {"match": {"all": "外滩"} // 原始查询条件,搜索文档并根据相关性打分(query score)
    },
    "functions": [
        {
          "filter": {"term":{"id": "1"}}, //过滤条件,符合条件的文档才会被重新算分
          "weight":10 //算分函数,算分函数的结果称为function score,将来会与query score运算,得到新分数,常见的算分函数有:weight:给一个常量值,作为函数结果(function score);field_value_factor:用文档中的某个字段值作为函数结果;random_score:随机生成一个值,作为函数结果;script_score:自定义计算公式,公式结果作为函数结果
        }
      ]
    },
    "boost_mode":"multiply"//加权模式,定义function score与query score的运算方式,包括:multiply:两者相乘,默认就是这个;replace:用function score替换query score;其他:sum,avg,max,min
  }
}
  • 布尔查询,是一个或多个查询子句的组合。子查询的组合方式有:
  • must:必须匹配每个子查询,类似"与"
  • should:选择性匹配子查询,类似"或"
  • must_not:必须不匹配,不参与算分,类似"非"
  • filter:必须匹配,不参与算分
GET /indexName/_search
{
  "query": {
    "bool": {
      "must": [
        {"term": {"city": "上海"}}
      ],
      "should": [
       {"term": {"brand": "皇冠假日"}},
       {"term": {"brand": "华美达"}}
      ], 
      "must_not": [
        {"range": {"price": {"lte": 500}}}
      ],
      "filter": [
        {"range": {"score": {"gte": 45}}}
      ]
    }
  }
}

Reference
黑马程序员

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/676943.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

知乎网友问题:Android 悬浮窗怎么让窗口响应事件的同时,也能让背后挡住的地方收到事件?---腾讯课堂千里马亲自解答

问题:Android 悬浮窗怎么让窗口响应事件的同时,也能让背后挡住的地方收到事件? 点击悬浮窗,自己能收到事件,背后挡住的区域也要能收到,怎么实现,return. false 无效 原生android机制不支持原因…

【C++入门第五期】类和对象(中)

这里写目录标题 类的6个默认成员函数构造函数特征 析构函数概念特性 拷贝构造特征拷贝构造如何自定义 运算符重载赋值运算符重载赋值运算符重载前置和后置重载 取地址及const取地址操作符重载 类的6个默认成员函数 如果一个类中什么成员都没有,简称为空类。 class…

基于深度学习的高精度抽烟行为检测识别系统(PyTorch+Pyside6+YOLOv5模型)

摘要:基于深度学习的高精度抽烟行为检测识别系统可用于日常生活中或野外来检测与定位抽烟行为目标,利用深度学习算法可实现图片、视频、摄像头等方式的抽烟行为目标检测识别,另外支持结果可视化与图片或视频检测结果的导出。本系统采用YOLOv5…

【五子棋实战】第6章 调用接口进行联调

【五子棋实战】第6章 调用接口进行联调 Ajax调用接口 调用五子棋接口 点击优化 尾声 更多待开发的功能 Ajax调用接口 引入Jquery&#xff0c;使用JQ封装的ajax&#xff0c;demo如下&#xff1a; <script src"jquery-3.5.0.min.js"></script> <…

无显示器玩转树莓派桌面版

title: 无显示器玩转树莓派桌面版 zhaoolee在Github开启了长篇连载《树莓派不吃灰》https://github.com/zhaoolee/pi 目前已经更新到18篇&#xff0c;主要是给树莓派刷Ubuntu当做家庭服务器用。 恰好手头还有一块闲置的树莓派4B &#xff0c;我打算深度玩一下树莓派桌面版&…

CODESYS电子齿轮同步MC_GearIn指令编程应用

MC_GearIn属于比例随动控制,有关比例随动控制详细介绍请参看下面文章: 运动控制比例随动系统_RXXW_Dor的博客-CSDN博客PLC如何测量采集编码器的位置数据,不清楚的可以参看我的另一篇博文:三菱FX3U PLC高速计数器应用(附代码)_RXXW_Dor的博客-CSDN博客本文主要以三菱FX3U…

第十一章 EfficientNetv1网络详解

系列文章目录 第一章 AlexNet网络详解 第二章 VGG网络详解 第三章 GoogLeNet网络详解 第四章 ResNet网络详解 第五章 ResNeXt网络详解 第六章 MobileNetv1网络详解 第七章 MobileNetv2网络详解 第八章 MobileNetv3网络详解 第九章 ShuffleNetv1网络详解 第十章…

ffmpeg 音视频处理神器

1 FFmpeg是什么 ffmpeg是一套用来记录、转换数字音频、视频&#xff0c;并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它包含了非常先进的音频/视频编解码库libavcodec&#xff0c;提供了录制、转换以及流化音视频的完整解决方案。 许多FFmpeg的开发人员都来自MPla…

AWS Lambda 介绍

计算服务的演进 EC2------Container-------Lambda 虚拟机---容器--------------serverless无服务器架构 什么是AWS Lambda&#xff1f; AWS lambda的核心是事件驱动&#xff0c;驱动可能来自&#xff0c;Alexa,SNS&#xff0c;DynamoDB&#xff0c;S3&#xff0c;Kinesis等&…

什么是队列?Python中如何使用队列(62)

小朋友们好&#xff0c;大朋友们好&#xff01; 我是猫妹&#xff0c;一名爱上Python编程的小学生。 和猫妹学Python&#xff0c;一起趣味学编程。 今日主题 什么是队列&#xff1f; 队列有哪些接口(api)&#xff1f; 在Python中如何表示队列&#xff1f; 什么是队列 队…

HDFS的工作原理是怎么样的?是如何实现HA模式?

原文链接&#xff1a;http://www.ibearzmblog.com/#/technology/info?id714dcb3957e29185493239b269a9ef65 前言 HDFS是能够提供一个分布式文件存储的系统&#xff0c;在大型数据文件的存储中&#xff0c;能够提供高吞吐量的数据访问&#xff0c;那么它是如何实现数据文件的…

电机调速执行

一、建立思维导图&#xff0c;将功能分析近而转换成技术要点&#xff0c;逐步实现。 二、编码器 1、机械编码器 &#xff08;1&#xff09;机械编码器是什么&#xff0c;张啥样&#xff1f; 如下图&#xff0c;这个就是我们生活应用中常见的机械编码器&#xff0c;我们又叫旋…

【C++】模板初阶——函数模板和类模板

&#x1f680; 作者简介&#xff1a;一名在后端领域学习&#xff0c;并渴望能够学有所成的追梦人。 &#x1f681; 个人主页&#xff1a;不 良 &#x1f525; 系列专栏&#xff1a;&#x1f6f8;C &#x1f6f9;Linux &#x1f4d5; 学习格言&#xff1a;博观而约取&#xff0…

鲍威尔一句话,BTC冲破30000!币圈涨跌不再依赖美联储降息?

仅仅一夜&#xff0c;全球最大的加密货币比特币价格突破30000美元关键阻力位&#xff0c;最高突破至30800美元&#xff0c;创2023年4月以来的最高价。而美联储主席鲍威尔的证词&#xff0c;竟是这波行情的最大催化剂。 鲍威尔周三出席众议院金融服务委员会接受质询&#xff0c;…

为什么独立站做不好?80%的人都走过这5个弯路

最近接触了不少卖家&#xff0c;发现不少独立站因为犯下一些常见的错误&#xff0c;导致最终失败&#xff0c;但是这些都是完全可以避免的。 那些新手卖家常见的问题就是许多人对独立站运营没有基本概念&#xff0c;同时并没有把脑袋中的零散的技巧串起来。要知道独立站运营是…

青大数据结构【2018】【单选、简答】

关键字: 计算机数据结构、存储方式、递归设计、矩阵压缩存储、二叉树形态、哈希冲突、希尔排序 一、单选 二、简答 对于线性表的存储,当采用顺序存储时,插入和删除元素平均需要移动半个表长,而链式存储结构只需要修改相应的指针就可以了。 递归设计要注意递归函数式的内…

【Java系列】深入解析Stream API

序言 你只管努力&#xff0c;其他交给时间&#xff0c;时间会证明一切。 文章标记颜色说明&#xff1a; 黄色&#xff1a;重要标题红色&#xff1a;用来标记结论绿色&#xff1a;用来标记论点蓝色&#xff1a;用来标记论点 希望这篇文章能让你不仅有一定的收获&#xff0c;而且…

看完这篇 教你玩转渗透测试靶机vulnhub—Emplre: Lupinone

Vulnhub靶机Emplre: Lupinone渗透测试详解 Vulnhub靶机介绍&#xff1a;Vulnhub靶机下载&#xff1a;Vulnhub靶机安装&#xff1a;Vulnhub靶机漏洞详解&#xff1a;①&#xff1a;信息收集&#xff1a;②&#xff1a;SSH私钥爆破登入&#xff1a;③&#xff1a;pip提权&#xf…

[晕事]今天做了件晕事14,查单词charp

从内核模块的代码里看到一个单词charp&#xff0c;去尝试查单词&#xff0c;发现了一个 Charp impact value 【机】 夏比冲击值 这个直接是音译&#xff0c;肯定不是想要的&#xff0c; 后来使用bing搜索引擎&#xff0c;里面有一个链接&#xff1a; 这个网页真是很有迷惑性&am…