Elastic Search 8.15:通过语义文本和重新排序实现可访问的语义搜索

news2025/1/11 20:50:06

作者:来自 Elastic Nick Chow, Sunayana Vatassery

在 8.15 中,我们的客户可以更轻松地获得出色的搜索结果。我们的最新版本带来了语义重新排名(semantic reranking)、额外的向量搜索工具和更多第三方模型提供商,并将我们的原生学习排名 (Learning to Rank - LTR) 推广到正式版。现在,搜索性能比以往任何时候都更高,速度和效率都有所提高。

Elastic Search 8.15 现已在 Elastic Cloud 上推出 - 这是唯一一款包含此最新版本所有新功能的托管 Elasticsearch 产品。你还可以下载 Elastic Stack 和我们的云编排产品 Elastic Cloud Enterprise 和 Elastic Cloud on Kubernetes,以获得自我管理的体验。

Elastic 8.15 中还有什么新功能?查看 8.15 公告帖子了解更多信息。

触手可及的语义搜索

Elasticsearch 8.15 引入了语义文本(semantic text)和语义重新排名(semantic reranking) - 两种将自然语言搜索带入你的搜索体验的强大方法。

我们继续通过 semantic text  使向量搜索更易于访问 - 这是一种新的字段类型和相应的语义查询类型,可解锁对文本进行向量搜索的简化方法。特别是,语义文本处理自动分块,因此具有长文本字段的用户可以放心,因为他们知道他们拥有完整的多嵌入覆盖和后台处理。向量搜索客户只需设置一个 semantic text 字段即可开始使用 interfence API 自动处理的模型协调和嵌入生成。

对于想要不使用向量进行语义搜索或进一步强化其向量或混合搜索的用户,8.15 还引入了语义重新排名。此功能可以应用强大的语义相似性模型来优化搜索查询的前 N ​​个结果,从而显著改善搜索结果,尤其是自然语言搜索。对于任何搜索系统来说,这一新增功能都可能是一个强大的改进,但对于寻求在不结合向量嵌入的情况下改善自然语言搜索能力的用户来说尤其有价值。

通过附加第三方提供商实现更大的模型灵活性

Elasticsearch 的 open inteference API 继续通过附加第三方提供商为我们的用户提供更大的模型灵活性。8.15 引入了:

  • Google AI Studio(嵌入和完成)和 Vertex AI(嵌入和重新排名)
  • Mistral(嵌入)
  • Amazon Bedrock(嵌入和完成)
  • Anthropic(完成)

所有这些模型提供商都可以通过提供简单的 API 密钥轻松配置为推理端点,然后可以与 retrievers 一起使用,以实现简单且易于组合的搜索查询。

更多工具来微调相关性

Elasticsearch 的原生 “Learning to Rank - 学习排名” 和查询规则功能自 8.15 起正式可用,让用户能够更精细地控制其搜索相关性和结果。

  • “Learning to Rank - 学习排名” 直接内置于 Elasticsearch 中,并扩展了搜索用户的搜索相关性调整管道,因此他们可以使用针对他们关心的功能进行训练的 LTR 模型对结果进行重新排名。这直接在 Elasticsearch 中运行,并支持更精细调整和上下文感知的搜索结果,这些结果可以适应复杂的搜索和用户行为模式。从 8.15 开始,你还可以 rescore collapsed results,这意味着你可以使用 LTR 对字段折叠结果进行重新排名。
  • Query rules 查询规则引入了将业务规则应用于搜索集的能力,即使使用机器学习模型进行混合搜索也是如此。用户可以指定在满足定义条件时将所需的文档固定在搜索结果的顶部 - 从而实现根据查询、用户细分等量身定制的搜索结果,并且它可以与混合搜索和 RRF 的任意组合一起使用。详细使用,请参考文章 “Elasticsearch 查询规则现已正式发布 - query rules”。
  • Playground 现在支持 Google Gemini!
Playground 是查看使用 semantic_text 和语义重新排名的结果的简单方法!

配置你选择的 LLM 并使用 8.15 加速构建 RAG 应用程序。

为客户提供更多向量搜索选项、速度和效率

标量量化改进继续在出色的准确性和更好的效率之间取得平衡,包括 int-4 量化。还有更多向量搜索选项,包括新的稀疏向量查询类型、汉明距离和位编码向量支持。在 Elasticsearch 平台亮点博客中阅读有关这些和其他向量数据库性能改进的更多信息。

试用

在发行说明中阅读有关这些功能和更多内容。

现有的 Elastic Cloud 客户可以直接从 Elastic Cloud 控制台访问其中的许多功能。没有利用云端 Elastic?开始免费试用。

本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。

在这篇博文中,我们可能使用或提到了第三方生成 AI 工具,这些工具由其各自的所有者拥有和运营。 Elastic 无法控制第三方工具,我们对其内容、操作或使用不承担任何责任,也不对你使用此类工具可能产生的任何损失或损害承担任何责任。在使用 AI 工具处理个人、敏感或机密信息时,请谨慎行事。你提交的任何数据都可能用于 AI 培训或其他目的。我们无法保证你提供的信息会得到安全或保密。在使用任何生成式 AI 工具之前,你应该熟悉其隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 和相关标志是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:Elastic Search 8.15: Accessible semantic search with semantic text and reranking | Elastic Blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1997113.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

告别焦虑:使用 acme 实现 ssl 免费证书到期自动更新

文章目录 前言什么是 ACME 协议?ACME 使用指南安装下载使用 gitee 下载设置别名(非必要)注册账号更改证书生成方式生成证书重新生成证书并认证安装 SSL 证书 使用 SSL 证书验证 配置证书自动续期证书续期命令自动续期查看添加的定时任务 cron…

haproxy基础

目录 1 HAProxy介绍 1.1 版本对比 1.2 HAProxy功能 2 参数介绍与实践 2.1 global参数说明 2.2 真实代码格式实例 2.3 常用全局参数 2.3.1 nbproc -- 开启几个进程 2.3.2 cpu-map(CUP绑定) 2.3.3 nbthread 2 --开启2个线程 3 Proxies配置 3.1 Proxies配置-defaults 3.2 Proxi…

dolphinscheduler版本差异的配置造成的故障处理

dolphinscheduler1.3.4的common.properties的配置 [root@dbos-bigdata-test003 conf]# vim /opt/dolphinscheduler/conf/common.properties 下面的这个配置中8088直接在配置成端口即可 yarn.application.status.address=http://yarnIp1:8088/ws/v1/cluster/apps/%s dolphin…

守护历史文化瑰宝,RFID藏品管理系统助力文物保护

在中国悠久的历史长河中,有一座蕴藏着千年文化的古老建筑。这座建筑曾经是伟大文人杜甫的居所,承载着他卓越的文学成就和丰富的人生经历。然而,这样一座历史文化瑰宝的保护和管理一直面临着诸多挑战。 为了解决这一难题,我…

运维工具的衍化对运维工作的新挑战

运维工具的衍化对运维工作产生了深远的影响,这些影响体现在多个方面,包括提升运维效率、优化资源配置、增强故障应对能力、促进团队协作与沟通,以及面临新的挑战如数据安全和隐私保护等。运维工具的衍化对运维工作带来了多方面的新挑战&#…

用户体验至上:9款软件界面设计工具分享

你知道如何选择正确的UI设计软件吗?您知道哪些界面设计软件需要设计美观的用户界面,以及带来良好用户体验的APP吗?根据APP界面的不同功能,制作软件界面的选择也会有所不同。但是,并非要非常精通所有的制作软件界面&…

k8s集群管理 Pod管理命令

k8s集群管理命令 信息查询命令 子命令说明help用于查看命令及子命令的帮助信息cluster-info显示集群的相关配置信息api-resources查看当前服务器上所有的资源对象api-versions查看当前服务器上所有资源对象的版本config管理当前节点上的认证信息 资源对象概述 Pod概述 Pod 管…

vscode 快速生成vue 格式

1.用快捷Ctrl Shift P唤出控制台 输入“Snippets”并选择 Snippets: Configure User Snippets 2.输入vue,选中vue.json vs code自动生成vue.json文件 3.在 vue.json 中添加模板 {"Print to console": {"prefix": "vue2","b…

MATLAB计算心理声学烦恼度例子

本例中,通过检测发动机噪音,并结合心理声学参数,评估了其响度、尖锐度、波动强度、粗糙度及整体心理声学烦恼度。接着,模拟了隔音材料的添加,并对噪音水平进行了重新评估。比较分析后,展示了隔音材料对降低…

【学习笔记】Matlab和python双语言的学习(动态规划)

文章目录 前言一、动态规划动态规划的基本步骤示例1示例2 三、代码实现----Matlab1.示例12.示例2 四、代码实现----python1.示例12.示例2 总结 前言 通过模型算法,熟练对Matlab和python的应用。 学习视频链接: https://www.bilibili.com/video/BV1EK411…

Spring AOP 原理——代理模式

目录 一、代理模式 1.1 静态代理 1.2 动态代理 1.2.1 JDK动态代理 1.2.2 CGLIB动态代理 Spring AOP 是基于动态代理来实现AOP的。 一、代理模式 代理模式, 也叫委托模式。该模式是为其他对象提供⼀种代理以控制对这个对象的访问。它的作用就是通过提供一个代理类&#…

50 mysql 的 “where 1 = 1“ 的优化处理

前言 问题是来自于 chinaunix 问题 ”mysql查询后面加 where 1 1 影响效率吗?” mysql 中在 java 代码中我们经常会使用到 ”where 1 1 and username ‘jerry’ ” 之类的条件 然后 我们这里 来看一下 “where 1 1” 的相关处理 where 条件在 select_lex, QUP_shared…

RPC Dubbo面试题汇总

文章目录 RPCRPC 是什么?RPC的原理是什么?有哪些常见的 RPC 框架?RPC和HTTP的区别 Dubbo什么是Dubbo?为什么要用Dubbo?Dubbo 的核心组件?Dubbo 支持哪些序列化方式呢?Dubbo 集群提供了哪些负载均衡策略?D…

Java中等题-交错字符串(力扣)

给定三个字符串 s1、s2、s3&#xff0c;请你帮忙验证 s3 是否是由 s1 和 s2 交错 组成的。 两个字符串 s 和 t 交错 的定义与过程如下&#xff0c;其中每个字符串都会被分割成若干 非空 子字符串 &#xff1a; s s1 s2 ... snt t1 t2 ... tm|n - m| < 1交错 是…

批发行业进销存-手持打单机办理会员 源码CyberWinApp-SAAS 本地化及未来之窗行业应用跨平台架构

一、手持终端办理会员必备条件 1.手持机的有点可以打印单据开单 2.手持通过接口将数据传到进销存 3.需要支持刷卡&#xff0c;感应身份证&#xff0c;各种卡 4.考虑到网络和工厂&#xff0c;向下无网络环境&#xff0c;数据需要放本地 二、会员办理界面代码 <form id&…

集合练习专题

第一题 public static void main(String[] args) {ArrayList arrayList new ArrayList<>();arrayList.add(new News(" 新冠确诊病例超千万&#xff0c;数百万印度教信徒赴恒河\"圣浴\"引民众担忧"));arrayList.add(new News("男子突然想起2个…

EasyExcel-读Excel-不创建对象的读-合并单元格的处理

EasyExcel官方文档 这几天需要读取excel的内容&#xff0c;但是excel中存在多个sheet页&#xff0c;每个sheet页的标题不同&#xff0c;数据不同&#xff0c;而且多个excel文件。决定使用easyexcel处理&#xff0c;但是感觉无法使用对象接收exceld的数据&#xff0c;所以决定使…

使用 Node.js 模拟执行 JavaScript

准备工作 正确安装好 Node.js ,安装好之后&#xff0c;能正常使用 node 和 npm 两个命令 模拟执行 关于案例分析 写文章-CSDN创作中心 这里就不做分析了&#xff0c;直接使用 我们的目的是&#xff1a; 使用 node.js 加载 Crypto 库&#xff0c; 并执行 getToken 方法 …

Linux驱动开发基础(LED驱动)

所学来自百问网 目录 1. LED原理 2. 普适的GPIO引脚操作方法 2.1 GPIO模块的一般结构 2.2 GPIO框图 2.3 寄存器的操作 2.3.1 一般的操作方式 2.3.2 高效的操作方式 3. 基于IMX6UL_6ULL的GPIO操作方法 3.1 GPIO框图 3.2 CCM 3.3 IOMUXC 3.4 GPIO模块内部 3.5 读写…

软件评审-需求评审、设计评审、编码评审、测试评审(原件)

1.需求规格说明评审报告 2.系统设计评审报告 3.编码与测试评审报告 软件全套资料部分文档清单&#xff1a; 工作安排任务书&#xff0c;可行性分析报告&#xff0c;立项申请审批表&#xff0c;产品需求规格说明书&#xff0c;需求调研计划&#xff0c;用户需求调查单&#xff0…