Elasticsearch 中的相关性和得分

news2024/9/20 22:50:49

在Elasticsearch中,相关性(Relevance)和得分(Score)是搜索引擎技术中非常重要的概念,它们直接影响搜索结果的排序。

相关性(Relevance)

相关性是指搜索结果与用户查询的相关程度。对于用户而言,他们希望搜索结果尽可能与输入的查询意图相关。在Elasticsearch中,相关性是一个动态的概念,依据查询的内容和上下文的不同而变化。

得分(Score)

得分是Elasticsearch用来量化文档与查询相关性的一种机制。得分越高,表示文档与查询条件的相关性越强。Elasticsearch通过计算每个文档的得分来决定搜索结果的排序。

得分计算的方法

Elasticsearch默认使用BM25算法计算得分。BM25是一个基于词频和逆文档频率的算法,考虑了以下几个因素:

  • 词频(TF):在文档中,某个词出现的次数。一个常见的词在某个文档中出现得越多,说明该文档可能与该词更相关。

  • 逆文档频率(IDF):词在整个文档集中的稀有度。出现得少的词通常能提供更有针对性的相关性信息,因此IDF会提高这样的词的得分。

  • 文档长度:短文档通常会比长文档得分高,因为长文档可能包含更多的噪音信息。BM25使用文档长度的均值和标准差来调整得分。

BM25的基本公式如下:

  • TF(t,D):在文档D中词t出现的次数。
  • IDF(t):词t的逆文档频率。
  • ∣D∣:文档D的长度(字数)。
  • avgdl:所有文档的平均长度。
  • b和k1:调节参数,通常设置为 b=0.75和k1=1.2。

调整得分和相关性

在Elasticsearch中,可以通过以下方式调整得分和相关性:

  • 使用权重:在查询中可以为某些字段设置较高的权重,以提高其对结果的重要性。

  • 自定义评分:使用Function Score的查询功能,应用自定义的得分算法调整默认得分。

  • 规范化得分:通过自定义的打分功能,可以根据特定业务逻辑调整文档得分,确保更符合用户的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2107401.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java System.getenv 和 System.getProperty 区别

💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「storm…

全新界面,原生Mac和Linux支持的WinBox 4 发布了!

简介 WinBox 4 终于来了!!​ ​ 适用于 Windows、macOS 和 Linux的原生程序。(不需要开wine之类的软件了) 更现代化的软件界面,终于不是上个世纪的风格了。 支持深色模式,不能亮瞎狗眼了。 官方&#…

echarts多个环形图

echarts图表集 var dataValue [{name:今日待分配方量,value:49}, {name:今日已分配方量,value:602}, {name:今日完成方量,value:1037}]var piedata1 [{name: 1#拌和机,value: 20},{name: 2#拌和机,value: 22},{name: 3#拌和机 ,value: 17},{name: 4#拌和机,value: 18},{name…

品牌做渠道开发有何意义,重要性在哪里?

品牌做渠道开发,就是为了把企业的产品和服务,传递给目标消费者,从而建立并维护了一系列的分销渠道。 渠道开发不仅涉及了销售渠道(电商平台、线下实体店、分销商、代理商)等,还包括制定渠道策略&#xff0…

【区块链 + 人才服务】基于 FISCO BCOS 联盟链的电子证书认证平台 | FISCO BCOS应用案例

传统电子证书认证存在一些弊端,比如由于数据权限过于集中,可能存在私自篡改数据的问题,从而导致数据不可信。其次,因为数据存储于中心服务器,存在单点故障或易被不法分子恶意攻击的风险,造成数据完整性的问…

最新!《第七届人力资源共享服务中心研究报告》重磅来袭 | 附下载

9月5日,“ALL IN 2024 人力资源服务展-上海站”在上海跨国采购会展中心隆重举办。展会上,由人力资源智享会(以下简称“智享会”)与法大大联合出版的《第七届人力资源共享服务中心研究报告》正式发布。该报告立足行业变革趋势、对话…

基于Android Studio的行程记录APK开发指南(三)---界面设计及两种方法获取用户位置

前言 本系列教程我们来看看如何使用Android Studio去开发一个APK用于用户的实时行程记录 第一期:基于Android Studio的用户行程记录APK开发指南(一):项目基础配置与速通Kotlin-CSDN博客第二期:基于Android Studio的行程记录APK开发指南(二):…

2024年SRM管理系统盘点合集,助力企业选型!

本文将盘点六款主流的SRM管理系统,助力企业选型! 想象一下这样一个场景,企业的采购部门每天都在为寻找合适的供应商、管理采购订单以及确保物资及时供应而忙碌。如果没有一个有效的 SRM 管理系统,就如同在黑暗中摸索,效…

Transforms的常见用法

文章目录 一、封装函数与普通函数的用法区别二、Image.open()打开图片的格式三、ToTensor打开图片格式四、ToTensor使用五、Normalize归一化使用六、Resize的使用七、Compose - Resize 使用八、RandomCrop() 随机裁剪用法 一、封装函数与普通函数的用法区…

Android Camera系列(二):TextureView+Camera

两岸猿声啼不住,轻舟已过万重山—李白 Android Camera系列(一):SurfaceViewCamera Android Camera系列(二):TextureViewCamera Android Camera系列(三):GLS…

2024霸王餐小程序cps,h5公众号小程序开源版系统搭建开发,外卖霸王餐小程序系统源码

目录 前言: 一、霸王餐小程序的操作是怎么样的? 二、霸王餐系统后台 三、怎么搭建部署? 前言: 霸王餐项目基于美团和饿了么平台开发的小程序。 一、霸王餐小程序的操作是怎么样的? 1、进入小程序后选择自己要下单的店铺&am…

MongoDB 向 PostgreSQL 宣战

上周 MongoDB 发布了一份亮眼的季度财报,盘后股价涨幅超过 18%。 值得一提的是,MongoDB 的 CEO Dev Ittycheria 特别提到 MongoDB 正在借助自己的数据库服务 Atlas 从 PostgreSQL 那里挖角。原话是举了一个博彩网站的例子: “Initially, th…

Hvv结束了,裁员提上日程

《Java代码审计》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484219&idx1&sn73564e316a4c9794019f15dd6b3ba9f6&chksmc0e47a67f793f371e9f6a4fbc06e7929cb1480b7320fae34c32563307df3a28aca49d1a4addd&scene21#wechat_redirect Hvv陆陆续续结…

反常识!科研巨头扎堆夕阳行业?A股研发之王是它?

这是邢不行第 119 期量化小讲堂的分享 作者 | 邢不行 2023年华为研发费用再创新高,高达1600亿。 多年高研发投入让华为在一众领域遥遥领先。 研发费用占全年收入23% 遍观全球,各行各业巨头也极为重视研发。 2022年全球研发投入排名 细数它们的成功史…

严管下快速通道何在?

首先我们要清楚什么是快速通道? 其实就是一句话,是券商为高净值客户提供的一种特殊交易通道。可以提高你的交易速度,但是这里面又细分了很多。 但是VIP通道也就是快速交易通道其实里面还细分了很多种种类的,我们简单区分下&#x…

JavaEE:多线程进阶(CAS)

文章目录 CAS什么是 CASCAS 伪代码 CAS有哪些应用CAS的ABA问题什么是ABA问题ABA问题带来的BUG解决方案 CAS 什么是 CAS CAS: 全称Compare and swap,字面意思:”比较并交换“,一个 CAS 涉及到以下操作: 我们假设内存中的原数据V,旧的预期值A…

【Python报错已解决】`Provisional headers are shown Learn more`

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 引言:一、问题描述:1.1 报错示例:1.2 报错分析:1.3 解决思路&#xff…

软件测试面试如何正确谈薪

又是一波离职高峰,很多小伙伴已经开始投身跳槽的准备中了。大家选择跳槽无非是想增加自己的工资收入,所以面试过程中的谈薪环节就显得尤为重要,谈的好与不好,未来整个的薪资水平都可能受影响。 那面试中,当问到“你的…

SprinBoot+Vue二手回收微信小程序的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue3.6 uniapp代码 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平…

【C++】vector的简单模拟实现

目录 一、vector的基本实现机制: 二、vector的部分接口模拟实现: 1、构造与析构: 1、普通构造: 2、拷贝构造: 3、析构函数: 2、关于扩容: 1、reserve: 2、resize 3、增删查…