elasticsearch 使用Painless脚本

news2024/12/15 4:52:55

文章目录

      • 1. 创建索引
      • 2. 插入模拟数据
      • Painless 脚本的基本特点:
      • Painless 脚本的常见用途
      • 1. 脚本查询和过滤
        • 示例:基于脚本的查询
      • 2. 脚本字段
        • 示例:脚本字段
      • 3. 聚合中的脚本
        • 示例:脚本聚合
      • 4. 文档更新中的脚本
        • 示例:文档更新
      • 5. 排序中的脚本
        • 示例:脚本排序
      • Painless 脚本的常见用法和注意事项
        • 1. **访问字段**
        • 2. **参数传递**
        • 3. **条件判断**
        • 4. **限制**
        • 5. **调试脚本**
      • 总结

1. 创建索引

首先,我们可以创建一个包含适当字段的 products 索引,并定义字段的映射(mapping)。例如,我们可以使用 text 类型来存储产品名称,keyword 类型来存储分类,floatdouble 类型来存储价格、评分和折扣。

PUT /products
{
  "mappings": {
    "properties": {
      "product_name": {
        "type": "text"
      },
      "price": {
        "type": "float"
      },
      "category": {
        "type": "keyword"
      },
      "rating": {
        "type": "float"
      },
      "discount": {
        "type": "float"
      },
      "availability": {
        "type": "boolean"
      },
      "stock": {
        "type": "integer"
      },
      "release_date": {
        "type": "date"
      }
    }
  }
}

2. 插入模拟数据

接下来,我们插入一些模拟产品数据到 products 索引。以下是一些数据样本:

POST /products/_doc/1
{
  "product_name": "Apple iPhone 15",
  "price": 999.99,
  "category": "Smartphones",
  "rating": 4.5,
  "discount": 0.1,
  "availability": true,
  "stock": 50,
  "release_date": "2023-09-01"
}

POST /products/_doc/2
{
  "product_name": "Samsung Galaxy S24",
  "price": 899.99,
  "category": "Smartphones",
  "rating": 4.3,
  "discount": 0.05,
  "availability": true,
  "stock": 30,
  "release_date": "2023-10-10"
}

POST /products/_doc/3
{
  "product_name": "Dell XPS 13",
  "price": 1199.99,
  "category": "Laptops",
  "rating": 4.8,
  "discount": 0.15,
  "availability": true,
  "stock": 20,
  "release_date": "2023-08-20"
}

POST /products/_doc/4
{
  "product_name": "Sony WH-1000XM5",
  "price": 349.99,
  "category": "Headphones",
  "rating": 4.7,
  "discount": 0.2,
  "availability": false,
  "stock": 0,
  "release_date": "2023-06-15"
}

POST /products/_doc/5
{
  "product_name": "Apple MacBook Air",
  "price": 999.00,
  "category": "Laptops",
  "rating": 4.6,
  "discount": 0.1,
  "availability": true,
  "stock": 15,
  "release_date": "2023-11-01"
}

POST /products/_doc/6
{
  "product_name": "Fitbit Charge 5",
  "price": 149.99,
  "category": "Wearables",
  "rating": 4.4,
  "discount": 0.05,
  "availability": true,
  "stock": 80,
  "release_date": "2023-07-10"
}

在 Elasticsearch 中,Painless 是一种用于查询和聚合操作的内置脚本语言。它被设计为高效、安全、且易于使用的脚本语言,用于在 Elasticsearch 中执行动态计算。Painless 可以在许多不同的场景中使用,比如在 查询过滤器聚合文档更新排序脚本字段 等操作中动态计算值。

Painless 脚本的基本特点:

  • 高效:Painless 脚本会经过优化,执行速度较快。
  • 安全:Painless 会在执行过程中检查潜在的安全问题,防止执行恶意代码。
  • 易用:语法简洁,类似于 Java,但也有一些简化和限制。

Painless 脚本的常见用途

  1. 脚本查询和过滤
  2. 脚本字段
  3. 聚合中的脚本
  4. 文档更新
  5. 排序

1. 脚本查询和过滤

你可以使用 Painless 脚本来动态计算查询条件。例如,假设你要查询文档中的字段 price 是否大于某个动态值:

示例:基于脚本的查询
POST /products/_search
{
  "query": {
    "script_score": {
      "query": {
        "match_all": {}
      },
      "script": {
        "source": "doc['price'].value > params.threshold ? 1 : 0",
        "params": {
          "threshold": 1000
        }
      }
    }
  }
}

在这个查询中,script_score 根据 price 字段的值与 threshold 参数进行比较,只有当 price > 1000 时,文档才会匹配查询。
在这里插入图片描述

2. 脚本字段

Painless 脚本可以用于计算查询结果中的 脚本字段,允许你在查询结果中添加基于其他字段计算的动态值。

示例:脚本字段

假设每个文档都有 pricetax 字段,你想在查询结果中计算每个文档的总价(price + tax)。

POST /products/_search
{
  "query": {
    "match_all": {}
  },
  "script_fields": {
    "total_price": {
      "script": {
        "lang": "painless",
        "source": "doc['price'].value + doc['discount'].value"
      }
    }
  }
}

这将为每个文档添加一个名为 total_price 的字段,字段值是 price + discount 的和。

在这里插入图片描述

3. 聚合中的脚本

Painless 脚本还可以用在聚合操作中,用于对字段值进行动态计算。例如,基于某个条件计算总和或平均值。

示例:脚本聚合

假设你想计算所有产品的 price 字段的加权平均值,其中权重来自于另一个字段 rating

POST /products/_search
{
  "size": 0,
  "aggs": {
    "weighted_avg_price": {
      "avg": {
        "script": {
          "lang": "painless",
          "source": "doc['price'].value * doc['rating'].value"
        }
      }
    }
  }
}

在这个例子中,weighted_avg_price 聚合会计算 price * rating 的平均值。
在这里插入图片描述

4. 文档更新中的脚本

Painless 脚本可以用来动态更新文档中的字段。这在批量更新或修改文档时非常有用,特别是当更新的内容需要基于现有字段的值进行计算时。

示例:文档更新

假设你有一个文档中存储了 pricediscount 字段,现在你想要根据 discount 更新 price

POST /products/_update/1
{
  "script": {
    "lang": "painless",
    "source": "ctx._source.price = ctx._source.price - (ctx._source.price * ctx._source.discount)"
  }
}

在这个例子中,price 字段会根据 discount 字段的值进行折扣更新。
在这里插入图片描述

5. 排序中的脚本

你可以使用 Painless 脚本对搜索结果进行动态排序。例如,假设你要根据一个计算出来的值进行排序,而这个值是由多个字段计算得出的。

示例:脚本排序

假设你有 ratingprice 字段,你想按照 rating 除以 price 的结果对文档进行排序:

POST /products/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "_script": {
        "type": "number",
        "script": {
          "lang": "painless",
          "source": "doc['rating'].value / doc['price'].value"
        },
        "order": "desc"
      }
    }
  ],
  "script_fields": {
    "rating_to_price_ratio": {
      "script": {
        "lang": "painless",
        "source": "doc['rating'].value / doc['price'].value"
      }
    }
  }
}

在这个例子中,文档将按照 rating / price 的值进行降序排序。

在这里插入图片描述


Painless 脚本的常见用法和注意事项

1. 访问字段

在 Painless 中,你可以使用 doc['field_name'].value 来访问字段的值。如果字段是多值字段,你可以使用 doc['field_name'].values 来获取所有的值。

  • 对于文本字段:doc['text_field'].value 返回的是字段的一个值(如果该字段为多值字段,Painless 默认取第一个值)。
  • 对于数字字段:可以像上面的示例那样直接访问数字字段。
2. 参数传递

你可以通过 params 来传递外部参数到脚本中,这样就能在脚本中动态使用这些值。

{
  "query": {
    "range": {
      "price": {
        "gte": "{{params.min_price}}"
      }
    }
  },
  "params": {
    "min_price": 100
  }
}

在这里,params.min_price 是传递给脚本的参数。

3. 条件判断

Painless 支持基本的条件判断,比如 if 语句。可以用来执行基于条件的计算。

{
  "script": {
    "lang": "painless",
    "source": """
      if (doc['discount'].size() != 0) {
        return doc['price'].value - (doc['price'].value * doc['discount'].value);
      } else {
        return doc['price'].value;
      }
    """
  }
}

这个脚本判断如果 discount 字段存在,就对 price 进行折扣计算,否则返回原价。

4. 限制
  • 性能:虽然 Painless 被设计成高效的,但大量的动态计算会对性能产生一定的影响。尽量避免在查询或聚合中使用过于复杂的脚本,尤其是在大规模数据集上。
  • 沙盒环境:Painless 是运行在沙盒环境中的,意味着它的功能被严格限制,无法进行一些危险的操作,如文件操作、网络请求等。
5. 调试脚本

Painless 脚本支持调试输出,可以在开发时利用 _explain 或者调试日志来查看脚本的执行情况。

总结

Painless 是 Elasticsearch 中强大且高效的脚本语言,广泛应用于查询、更新、聚合、排序等多种操作。通过使用 Painless 脚本,开发者可以对 Elasticsearch 的行为进行细粒度的控制和动态计算,从而实现更灵活的功能。

在实际应用中,合理使用 Painless 脚本能够帮助解决复杂的数据计算需求,但也需要注意性能和安全性,避免过度使用脚本影响集群性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2259731.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PHP搭建环境

一、安装apache 1、获取Apache安装软件 2、双击安装即可:指定对应的路径:E:server/apache 3、选择安装模式:使用自定义模式 4、选择安装位置 二、Apache的目录结构说明 三、Httpd.exe的详细应用 1、服务器进程:运行之后才能够工作

spring cloud contract http实例

微服务很多时,服务之前相互调用,接口参数的一致性要变得很难维护。 spring cloud contract 提供了测试接口一致性的方法。 一 项目配置 plugins {id "groovy"id "org.springframework.cloud.contract" version "4.0.5"i…

【GIS教程】使用GDAL-Python将tif转为COG并在ArcGIS Js前端加载-附完整代码

目录 一、数据格式 二、COG特点 三、使用GDAL生成COG格式的数据 四、使用ArcGIS Maps SDK for JavaScript加载COG格式数据 一、数据格式 COG(Cloud optimized GeoTIFF)是一种GeoTiff格式的数据。托管在 HTTP 文件服务器上,可以代替geose…

python数据分析之爬虫基础:解析

目录 1、xpath 1.1、xpath的安装以及lxml的安装 1.2、xpath的基本使用 1.3、xpath基本语法 2、JsonPath 2.1、jsonpath的安装 2.2、jsonpath的使用 2.3、jsonpath的基础语法 3、BeautifulSoup 3.1、bs4安装及创建 3.2、beautifulsoup的使用 3.3、beautifulsoup基本语…

【Python网络爬虫笔记】10- os库存储爬取数据

os库的作用 操作系统交互:os库提供了一种使用Python与操作系统进行交互的方式。使用os库来创建用于存储爬取数据的文件夹,或者获取当前工作目录的路径,以便将爬取的数据存储在合适的位置。环境变量操作:可以读取和设置环境变量。在…

TCP 为什么是 3 次握手 4 次挥手?

前言: TCP 的 3 次握手 4 次挥手是一个非常经典的问题,相信各位从事 Java 的朋友在职业生涯中没少被问到这个问题,本篇我们就展开分析一下 TCP 为什么是 3 次握手 4 次挥手。 TCP 协议 要搞清楚 TCP 为什么是 3 次握手 4 次挥手我们需要先…

智能客户服务:科技赋能下的新体验

在当今这个数字化时代,客户服务已经不仅仅是简单的售后服务,它已竞争的关键要素之一。随着人工智能、大数据、云计算等技术的飞速发展,智能客户服务正逐步改变着传统的服务模式,为企业和消费者带来了前所未有的新体验。 一、智能客…

C++ 内存管理和模板与STL

此篇目是之后各种C库的基础 目录 内存管理 内存分布 内存管理方式 new和delete operator new 与 operator delete函数 实现原理 定位new表达式(placement-new) 模板基础 泛型编程 模板 函数模板 类模板 STL 组成部分 内存管理 内存分布 int globalVar 1; //全局变量 静…

深入理解 CSS 文本换行: overflow-wrap 和 word-break

前言 正常情况下,在固定宽度的盒子中的中文会自动换行。但是,当遇到非常长的英文单词或者很长的 URL 时,文本可能就不会自动换行,而会溢出所在容器。幸运的是,CSS 为我们提供了一些和文本换行相关的属性;今…

Polars数据聚合与旋转实战教程

在这篇博文中,我们的目标是解决数据爱好者提出的一个常见问题:如何有效地从Polars DataFrame中创建汇总视图,以便在不同时间段或类别之间轻松进行比较。我们将使用一个实际的数据集示例来探索实现这一目标的各种方法。 Polars简介 Polars 是…

STM32CUBEMX+STM32F4+IAP串口升级应用,亲测可用,带详解

一、IAP的基本概念 IAP,全名为in applacation programming,即在应用编程。 也就是在应用程序中升级。好处就太多了,比如远程在线升级,不用人到现场拆开,用烧写器连接升级。 实现IAP技术的核心是一段预先烧写在单片机内部的IAP程序。这段程…

CTFHub 命令注入-综合练习(学习记录)

综合过滤练习 命令分隔符的绕过姿势 ; %0a %0d & 那我们使用%0a试试,发现ls命令被成功执行 /?ip127.0.0.1%0als 发现一个名为flag_is_here的文件夹和index.php的文件,那么我们还是使用cd命令进入到文件夹下 http://challenge-438c1c1fb670566b.sa…

深入探索 JVM:原理、机制与实战

一、JVM 概述 JVM(Java Virtual Machine)是 Java 程序运行的核心组件,它提供了一个独立于硬件和操作系统的执行环境,使得 Java 程序能够在不同平台上具有跨平台的特性。 JVM 主要由以下几部分组成: 类装载器&#xf…

视频推拉流EasyDSS无人机直播技术巡查焚烧、烟火情况

焚烧作为一种常见的废弃物处理方式,往往会对环境造成严重污染。因此,减少焚烧、推广绿色能源和循环经济成为重要措施。通过加强森林防灭火队伍能力建设与长效机制建立,各地努力减少因焚烧引发的森林火灾,保护生态环境。 巡察烟火…

挺详细的记录electron【V 33.2.0】打包vue3项目为可执行程序

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、直接看效果 二、具体步骤 1.安装配置electron 1.将 electron 包安装到应用的开发依赖中。 2.安装electron-packager依赖(打包可执行文件&#…

基本分页存储管理

一、实验目的 目的:熟悉并掌握基本分页存储管理的思想及其实现方法,熟悉并掌握基本分页存储管理的分配和回收方式。 任务:模拟实现基本分页存储管理方式下内存空间的分配和回收。 二、实验内容 1、实验内容 内存空间的初始化——可以由用户输…

Vue Web开发(五)

1. axios axios官方文档 异步库axios和mockjs模拟后端数据,axios是一个基于promise的HTTP库,使用npm i axios。在main.js中引入,需要绑定在Vue的prototype属性上,并重命名。   (1)main.js文件引用 imp…

论文概览 |《IJAEOG》2024.08 Vol.132(下)

本次给大家整理的是《International Journal of Applied Earth Observation and Geoinformation》杂志2024年08月第132期的论文的题目和摘要,一共包括88篇SCI论文!由于论文过多,我们将通过两篇文章进行介绍,本篇文章介绍第45--第8…

「数据结构详解·十五」树状数组

「数据结构详解一」树的初步「数据结构详解二」二叉树的初步「数据结构详解三」栈「数据结构详解四」队列「数据结构详解五」链表「数据结构详解六」哈希表「数据结构详解七」并查集的初步「数据结构详解八」带权并查集 & 扩展域并查集「数据结构详解九」图的初步「数据结构…

【sgFileLink】自定义组件:基于el-link、el-icon标签构建文件超链接组件,支持垃圾桶删除、点击预览视频/音频/图片/PDF格式文件

sgFileLink源代码 <template><div :class"$options.name"><el-link click.stop"clickFile(data)"><img :src"getSrc(data)" /><span>{{ getFileNameAndSize(data) }}</span></el-link><el-linkcl…