解码 Elasticsearch 查询 DSL:利用 Elasticsearch 中的 has_child 和 has_parent 查询进行父子文档搜索

news2024/11/16 5:50:06

今天,让我们深入研究 has_child 查询和 has_parent 查询,这将帮助我们将 2 个不同的文档组合到一个索引中,从而使我们能够将它们与关系关联起来。 这样做会对我们搜索相关文档时有很大帮助。 在使用 has_child 及 has_parent 这种关系时,我们必须使用 join 数据类型。更多有关 join 数据类型的介绍,请参考文章 “Elasticsearch: Join 数据类型”。在实际的使用时,我们必须注意的一点是: join 不能跨索引,Elasticsearch 的重点在于速度,而传统 join 的运行速度太慢。 因此,子文档和父文档都必须位于相同的索引和相同的分片中。

了解亲子关系

Elasticsearch 中的父子关系涉及将一个索引中的文档作为父项与另一索引中的文档相关联。 这种关系对于数据组织需要分层结构、需要分层搜索的场景非常重要。 has_child 和 has_parent 查询为我们提供了在这些关系中轻松准确地导航和搜索的选项。

has_child 查询

has_child 查询允许我们根据关联子文档的内容搜索父文档。 当我们想根据孩子的属性对父母进行过滤或评分时,此查询主要有用。

句法

{
  "query": {
    "has_child": {
      "type": "child_type",
      "query": {
        "match": {
          "field": "value"
        }
      }
    }
  }
}

让我们考虑一下,我们的 “fruits” 索引中有父子关系,其中每个 fruit 文档都是父文档,这些水果的 nutritional_info 信息存储为子文档。 has_child 查询可用于查找具有特定营养价值的水果。

{
  "query": {
    "has_child": {
      "type": "nutritional_info",
      "query": {
        "range": {
          "vitamin_c": {
            "gte": 20
          }
        }
      }
    }
  }
}
{
  "query": {
    "has_child": {
      "type": "nutritional_info",
      "query": {
        "range": {
          "vitamin_c": {
            "gte": 20
          }
        }
      }
    }
  }
}

在此示例中,我们正在搜索具有子文档(营养信息)的水果,其中维生素 C 含量大于或等于 20。

{
  "query": {
    "has_parent": {
      "parent_type": "parent_type",
      "query": {
        "term": {
          "field": "value"
        }
      }
    }
  }
}

在与我们上面使用的具有父子关系的 “Fruits” 索引相同的示例中,我们假设每个水果文档都是父文档,并且营养信息存储为子文档。 has_child 查询可用于查找具有特定营养价值的水果。 这是一个例子:

{
  "query": {
    "has_child": {
      "type": "nutritional_info",
      "query": {
        "range": {
          "vitamin_c": {
            "gte": 20
          }
        }
      }
    }
  }
}

在此示例中,我们正在搜索具有子文档(营养信息)的水果,其中维生素 C 含量大于或等于 20。

所以基本上 has_child 和 has_parent 查询只是彼此的关系。

实时用例:

分层数据建模

让我们考虑一个场景,我们正在对组织结构或产品类别等分层数据进行建模。 has_child 和 has_parent 查询使我们能够检索层次结构各个级别的相关信息,从而促进高效的数据导航。

内容过滤

在内容管理系统中,我们可能有代表文章的父文档和代表评论的子文档。 利用 has_child 查询,我们可以根据评论中的特定条件过滤文章,并为客户提供精致的搜索体验。

虽然 has_child 和 has_parent 查询为相关文档搜索提供了强大的选项,但我们应该始终小心常见问题,例如索引之间的映射不一致、较大层次结构的查询性能问题等。

为了最大限度地提高 has_child 和 has_parent 查询的有效性,我们应该确保始终遵循以下最佳实践。

  1. 索引设置:索引设置应配置为支持有效的父子关系。 根据用例适当调整 “index.mapping.single_type” 等设置。
  2. 查询优化:应使用缓存和过滤等查询优化技术来增强搜索性能。

因此,如果这是用于理解 has_child 和 has_parent 查询的入门知识,Elastic 的官方文档可以帮助我们更多地了解有关相同内容的更多详细信息。

更多阅读:Elasticsearch:在 Elasticsearch 中的 join 数据类型父子关系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1368851.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机网络 —— 物理层

物理层 2.1 物理层的基本概念 物理层考虑的是怎样才能在连接各种计算机的传输媒体上传输数据比特流。 物理层为数据链路层屏蔽了各种传输媒体的差异,使数据链路层只需要考虑如何完成本层的协议和服务,而不必考虑网络具体的传输媒体是什么 2.2 物理层下…

Maven 工程 java -jar 时提示 xxx-SNAPSHOT.jar 中没有主清单属性

Maven 工程 java -jar 时提示 xxx-SNAPSHOT.jar 中没有主清单属性 将skip属性注释掉或者改为false 如果为true,则工程找不到主启动类

git安装教程 Windows 附安装包链接

Git是一款分布式源代码管理工具(版本控制工具) 。 git的作用 当你需要做一个大工程的时候,文件的管理无疑是非常庞大的工作,因为你需要不断的修改更新文件内容,同时可能还要保留旧版本保证可以复原,这样就需要备份多个版本的文件…

在wsl中安装miniconda

下载安装包 打卡miniconda的官网https://docs.conda.io/projects/miniconda/en/latest/,下载下来安装包,或者直接在乌班图中运行命令wget https://repo.anaconda.com/miniconda/Miniconda3-py38_23.5.2-0-Linux-x86_64.sh,等待下载完毕 安装 到下载目录下执行命令…

【WinRAR】右键压缩文件功能没了怎么办?

我们安装了WinRAR之后想要压缩文件,但是右键点击文件之后发现并没有WinRAR压缩选项,这应该如何设置才能出现右键带有压缩选项呢?方法如下: 首先打开WinRAR,在上面功能中点击选项 – 设置 然后我们在设置界面中切换到集…

C++学习笔记(二十九):c++ 创建与使用库

c自己创建库并使用库。当项目较大时,创建库有助于帮助代码模块化,同时提高代码重用。同时使用库允许程序中混合使用编程语言。首先创建一个空项目名为Game,接着在visiualstudio的解决方案上右击->添加->新建项目,添加一个空…

TS 36.213 V12.0.0-PUSCH相关过程(1)-传输PUSCH的UE过程

​本文的内容主要涉及TS 36.213,版本是C00,也就是V12.0.0。

全新链动2+1模式,提升用户粘性度,增加产品复购率!

在互联网电商行业中,消费增值模式已经成为一种强大的营销工具。通过将消费者所消费的金额转化为积分,再利用平台的销售业绩作为托底,使得积分的价值不断增长,从而增加了消费者的忠诚度和黏性。然而,在实际操作中&#…

MySQL批量插入技巧

关于MySQL批量插入的一些问题 MySQL一直是我们互联网行业比较常用的数据,当我们使用半ORM框架进行MySQL大批量插入操作时,你是否考虑过这些问题: 进行大数据量插入时,是否需要进行分批次插入,一次插入多少合适?有什么…

npm run dev,vite 配置 ip 访问

启动项目通过本地 ip 的方式访问 方式一.通过修改 package.json "scripts": {"dev": "vite --host 0.0.0.0",}, 方式二.通过修改 vite.config.ts export default defineConfig({plugins: [vue(), vueJsx()],server: { // 配置 host 与 port 方…

使用串口 DMA 模式接收不定长数据

一、简介 曾经遇到客户有一个需求,需要用串口 DMA 的方式接收不定长度的数据,DMA 有个缺点就是在每次传输前需要设定好传输的字节长度,这种方式显然对于接收不定长度的数据来说没有那么灵活。但 DMA 也有着显著的优点,如可直接访…

AI模型部署基础知识(一):模型权重与参数精度

一般情况来说,我们通过收集数据,训练深度学习模型,通过反向传播求导更新模型的参数,得到一个契合数据和任务的模型。这一阶段,通常使用python&pytorch进行模型的训练得到pth等类型文件。AI模型部署就是将在python环…

华为mux vlan+DHCP+单臂路由用法配置案例

最终效果: vlan 2模拟局域网服务器,手动配置地址,也能上公网 vlan 3、4用dhcp分配地址 vlan 4的用户之间不能互通,但可以和其它vlan通,也能上公网 vlan 3的用户不受任何限制可以和任何vlan通,也能上公网 交…

C# Onnx yolov8 竹签计数、一次性筷子计数

目录 效果 模型信息 项目 代码 数据集 下载 C# Onnx yolov8 竹签计数、一次性筷子计数 效果 模型信息 Model Properties ------------------------- date:2024-01-03T08:55:22.768617 author:Ultralytics task:detect license&#x…

信息论与编码期末复习——计算题+基础汇总(二)

个人名片: 🦁作者简介:一名喜欢分享和记录学习的在校大学生 🐯个人主页:妄北y 🐧个人QQ:2061314755 🐻个人邮箱:2061314755qq.com 🦉个人WeChat:V…

卷积神经网络|猫狗分类系列--导入kaggle猫狗数据集

解决任何真实问题的重要一步是获取数据,Kaggle提供了大量不同数据科学问题的竞赛。 我们将从 https://www.kaggle.com/competitions/dogs-vs-cats/data 下载猫狗数据集,并对其进行一定的操作,以正确的导入到我们的计算机,为接下…

基于SpringBoot的员工健康管理系统

文章目录 项目介绍主要功能截图:部分代码展示设计总结项目获取方式 🍅 作者主页:超级无敌暴龙战士塔塔开 🍅 简介:Java领域优质创作者🏆、 简历模板、学习资料、面试题库【关注我,都给你】 &…

python实现目录和文件管理

目录 一:模块介绍: 二:目录创建 三:目录删除 四:目录复制 五:目录移动 六:文件创建 七:文件删除 八:文件读取 一:模块介绍: Python的os和…

Java零基础教学文档第一篇:JavaSE(3)

接上期后续 本期继续分享尚未结束的JavaSE章节 JavaSE属于初入门阶段,内容很多~ 但很基础, 大家需保持耐心,慢慢的学~ 争取你们学习的速度! 跟上我更新的速度哦~ 今日新篇章 流程控制语句 【主要内容】 if单选结构 if双选结构…

Java多线程编程中的异常处理策略

第1章:引言 大家好,我是小黑,咱们今天聊聊异常处理。想必大家在写代码的时候都遇到过各种各样的异常吧?有时候,一个小小的异常如果处理不当,就可能导致整个程序崩溃。特别是在多线程环境下,异常…