Elastic:加速生成式人工智能体验

news2025/1/22 15:02:40

作者:Matt Riley

搜索驱动的人工智能和开发人员工具专为速度和规模而打造。

在大型语言模型(LLM)和生成式 AI 的每日突破中,开发者站在了这场运动的最前沿,影响着它的方向和可能性。在这篇博客中,我将分享 Elastic 的搜索客户是如何利用 Elastic 的向量数据库和开放平台,为搜索驱动的 AI 和开发者工具加速和扩展生成式 AI 体验,为他们提供了新的增长途径。

Dimensional Research 进行的最近一次开发者调查并得到 Elastic 支持的结果显示,87% 的开发者已经有了生成式 AI 的用例 —— 无论是数据分析、客户支持、工作场所搜索还是聊天机器人。但只有 11% 已经成功地将这些用例部署到生产环境中。

有几个因素阻碍了他们:

  • 模型部署和管理:选择正确的模型需要实验和快速迭代。为生成式 AI 应用部署 LLM 是耗时且复杂的,对许多组织来说学习曲线陡峭。
  • 法律和合规问题:当处理敏感数据时,这些问题尤其重要,可以成为模型采用的障碍。
  • 扩展性:领域特定数据对于 LLM 理解上下文和生成准确输出至关重要。随着数据的扩展,检索这些数据需要同样可扩展的支持,以应对生成向量嵌入的工作负载,迅速增加对内存和计算资源的需求。在庞大的数据集中,上下文窗口大且代价高昂地传递给 LLM,并且更多的上下文并不一定意味着更高的相关性。只有一个强大的工具平台能够塑造上下文,并平衡相关性与扩展性之间的权衡,以实现一个可行的、面向未来的创新架构。
图表:你的组织预计在构建生成式 AI 用例时,将在哪些领域花费最多的时间和资源?

开发者寻求一种可靠、可扩展且成本效益高的方式来构建生成式 AI 应用程序,以及一个简化实施和 LLM 选择过程的平台。

图表:选择向量搜索引擎时,贵组织的主要考虑因素是什么?

Elastic 通过快速创新的步伐,持续为这些开发者关注的问题提供解决方案,以支持生成式 AI 的用例。

快速、大规模地推出生成式人工智能体验

Elasticsearch 是市场上下载次数最多的向量数据库,Elastic 与 Lucene 社区的深厚合作使我们能够更快地为客户设计和交付搜索创新。 Elasticsearch 现在由 Lucene 9.10 提供支持,帮助客户通过生成式 AI 实现速度和规模。 在 9.10 中,除其他速度提升外,用户还发现多段索引的查询延迟显着改善。 这仅仅是开始,还会有更快的速度。

我们选择 Elastic 作为向量数据库,因为它具有固有的灵活性、可扩展性和可靠性。Elastic 不断通过快速提供支持机器学习和生成式 AI 的新功能来提升水平。

—— Peter O'Connor,Stack Overflow 平台工程部经理

为了快速实施和扩展 RAG 工作负载,Elastic 学习稀疏编码器(ELSER)—— 现已正式发布 —— 是一款易于部署、优化的、用于语义搜索的晚期交互机器学习(ML)模型。ELSER 提供上下文相关的搜索结果,无需精细调整,并为开发者提供了一个内置的可信解决方案,节省了你在模型选择、部署和管理方面的时间和复杂性。

ELSER 在不牺牲速度的情况下提升了搜索的相关性 —— 当 Consensus 升级了其由 Elastic 提供动力的学术研究平台,使用 ELSER 时,它将搜索延迟减少了75%,同时提高了准确性。

当你将 ELSER 与 E5 嵌入模型配对时,你可以轻松应用多语言向量搜索。我们为 Elasticsearch 部署特别定制的 E5 优化工件。通过上传多语言模型或与 Elastic 的推理 API 集成(例如,Cohere 的多语言模型嵌入)也可以实现多语言搜索。这些进步进一步加速了检索增强生成(RAG),使 Elastic 成为扩展你构建的创新生成式 AI 体验的关键基础设施。

Elastic 也专注于高效地扩展这些体验。我们在 8.12 版本中引入的标量量化是向量存储的游戏规则改变者。大型向量扩展可能会导致搜索速度变慢。但这种压缩技术显著降低了内存需求,达到四倍,并且在更高的规模上,对召回率的影响可以忽略不计。它使得在 RAG 中使用的向量搜索速度翻倍,而不牺牲准确性。结果是什么?一个更精简、更快的系统,在规模上削减了基础设施成本。

搜索对于提升 Udemy 用户体验至关重要 —— 将用户与相关的教育内容匹配,这就是为什么 Elastic 一直是我们的长期合作伙伴。自从去年升级到 Elastic Cloud 以来,我们就一直使用 Elastic 作为我们的向量数据库,它为我们的业务开辟了新的机会。随着我们在创新教育解决方案中扩展向量搜索,我们已经看到了查询速度和资源效率的增加。

Udemy 软件工程团队

对于 RAG 来说,最相关的搜索引擎

相关性是获得最佳生成式 AI 体验的关键。使用 ELSER 进行语义搜索和使用 BM25 进行文本搜索是检索作为 LLM 上下文的相关文档的绝佳首选步骤。大型上下文窗口可以进一步通过现在是 Elastic Stack 的一部分的重新排名工具进行细化。重新排名器应用强大的 ML 模型对搜索结果进行微调,并根据用户偏好和信号将最相关的结果置于顶部。学习排序(LTR)现在也是 Elasticsearch 平台的本机功能。这对于依赖于向 LLM 提供最相关结果作为上下文的 RAG 用例非常有用。

通过 inference API 和像 Cohere 这样的第三方提供商,实施进一步简化。升级到我们的最新版本,以测试重新排名器对相关性的影响。

这些方法不仅可以提高搜索准确性(例如 Consensus 的情况下提高了 30%),而且还可以帮助你快速获得结果,为 RAG 优化相关性并有效管理 ML 工作流。

使模型选择和更换变得简单

模型选择就像在干草堆里寻找针一样感觉艰难。实际上,我们的开发者调查突出显示,跨组织的前五大生成式 AI 努力之一是与 LLM 集成。这个难题不仅仅是为一个用例选择开源还是闭源 LLM —— 它还扩展到准确性、数据安全性、特定领域的特性,以及快速适应不断变化的 LLM 生态系统。开发者需要一个直接的工作流程来尝试新模型并轻松更换它们。

Elastic 通过其开放平台、向量数据库和搜索引擎支持转换器模型和基础模型。Elastic 学习稀疏编码器(ELSER)是加速 RAG 实施的可靠起点。

此外,Elastic 的 inference API 为开发者简化了代码和多云推理管理。无论你是使用 ELSER 还是来自 OpenAI(在开发者中评估和使用最多的模型)、Hugging Face、Cohere 或其他来源的嵌入式模型来处理 RAG 工作负载,一个 API 调用就能确保管理混合推理部署的代码整洁。借助 inference API,可以轻松访问广泛的模型,因此你可以找到合适的选择。与特定领域的自然语言处理(NLP)和生成式 AI 模型的轻松集成简化了模型管理,释放你的时间专注于 AI 创新。

图表:你的组织使用过、评估过或计划评估哪些嵌入模型?
图表:你的组织目前使用或预计将来会使用哪些类型的模型?

携手同行:与集成共创卓越体验

开发者还可以托管包括公共和私有 Hugging Face 模型在内的多样化转换模型。虽然 Elasticsearch 作为整个生态系统的多功能向量数据库,那些偏好使用诸如 LangChain 和 LlamaIndex 工具的开发者,可以利用我们的集成快速启动基于 LangChain 模板的生产就绪的生成式 AI 应用。Elastic 的开放平台让你能够快速适应、实验并加速生成式 AI 项目。Elastic 最近还被添加为 On Your Data 的第三方向量数据库,这是一个构建对话式 copilots 的新服务。另一个好例子是 Elastic 与 Cohere 团队背后的合作,使 Elastic 成为 Cohere 嵌入式向量的优秀向量数据库。

生成式 AI 正在重塑每一个组织,Elastic 在这里支持这一转型。对开发者而言,成功实施生成式 AI 的关键是持续学习(你已经看过 Elastic Search Labs 了吗?)和快速适应不断变化的 AI 景观。

当你将 Elastic 的准确性和速度与 Google Cloud 的强大功能结合起来时,你可以构建一个非常稳定和成本效益高的搜索平台,同时为用户提供令人愉悦的体验。

—— Sujith Joseph,思科系统的首席企业搜索和云架构师

立即尝试!

  • 在 Elastic Search 发布说明中阅读有关这些功能以及更多内容。
  • 现有的 Elastic Cloud 客户可以直接从 Elastic Cloud 控制台访问许多这些功能。还没有使用 Elastic Cloud?开始免费试用。
  • 尝试 Elasticsearch Relevance Engine,我们的一套用于构建 AI 搜索应用程序的开发者工具。

本文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。 当前不可用的任何特性或功能可能无法按时交付或根本无法交付。

在这篇博文中,我们可能使用或引用了第三方生成人工智能工具,这些工具由其各自所有者拥有和运营。 Elastic 对第三方工具没有任何控制权,我们对其内容、操作或使用不承担任何责任,也不对你使用此类工具可能产生的任何损失或损害负责。 使用人工智能工具处理个人、敏感或机密信息时请务必谨慎。 你提交的任何数据都可能用于人工智能培训或其他目的。 无法保证你提供的信息将得到安全或保密。 在使用之前,你应该熟悉任何生成式人工智能工具的隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 和相关标志是 Elasticsearch N.V. 的商标、徽标或注册商标。 在美国和其他国家。 所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:Accelerating generative AI experiences | Elastic Blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1576401.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【研发管理】产品经理知识体系-数字化战略

导读: 数字化战略对于企业的长期发展具有重要意义。实施数字化战略需要企业从多个方面进行数字化转型和优化,以提高效率和创新能力,并实现长期竞争力和增长。 目录 1、定义 2、数字化战略必要性 3、数字战略框架 4、数字化转型对产品和服务设计的影响…

chrome 浏览器 有自带的自动字幕功能,支持英文,控制您的音乐、视频等媒体内容

chrome 浏览器 有自带的自动字幕功能,支持英文,控制您的音乐、视频等媒体内容

蚁剑修改特征性信息

前言 我们首先得知道蚁剑的流量特征: 编码器和解码器的特征:蚁剑自带的编码器和解码器具有明显的特点,可以通过更改配置文件来达到流量加密的目的1。例如,蚁剑支持多种编码方式,如base64、chr、rot13等,这…

C++中的inline用法

1. 引入inline关键字的原因 在c/c中,为了解决一些频繁调用的小函数大量消耗栈空间(栈内存)的问题,特别的引入了inline修饰符,表示为内联函数。 栈空间就是指放置程序的局部数据(也就是函数内数据&#xf…

初识Java中的NIO

1.概述 Java NIO 全称java non-blocking IO ,是指 JDK 提供的新 API。从 JDK1.4 开始,Java 提供了一系列改进的输入/输出新特性,被统称为 NIO(即 New IO),是同步非阻塞的。NIO采用内存映射文件的方式来处理输入输出,NI…

【C++进阶】哈希表(哈希函数、哈希冲突、开散列、闭散列)

🪐🪐🪐欢迎来到程序员餐厅💫💫💫 主厨:邪王真眼 主厨的主页:Chef‘s blog 所属专栏:c大冒险 总有光环在陨落,总有新星在闪烁 引言: 我们之前…

CSS 学习笔记 总结

CSS 布局方式 • 表格布局 • 元素定位 • 浮动布局(注意浮动的负效应) • flex布局 • grid布局(感兴趣的可以看下菜鸟教程) 居中设置 元素水平居中 • 设置宽度后,margin设置为auto • 父容器设置text-alig…

鸿蒙原生应用已超4000个!

鸿蒙原生应用已超4000个! 来自 HarmonyOS 微博近期消息,#鸿蒙千帆起# 重大里程碑!目前已有超4000个应用加入鸿蒙生态。从今年1月18日华为宣布首批200多家应用厂商正在加速开发鸿蒙原生应用,到3月底超4000个应用,短短…

【ARMv7-M】| 01——阅读笔记 | 简介|应用程序级编程和内存模型

系列文章目录 【ARMv7-M】| 01——阅读笔记 | 简介|应用程序级编程和内存模型 失败了也挺可爱,成功了就超帅。 文章目录 前言1、简介2、应用程序级编程模型2.1 编程模式和访问等级2.2 数据类型和运算操作2.3 寄存器和执行状态1.2.4 异常和中断1.2.5 浮点单元寄存器…

android 资源文件混淆

AGP7.0以上引用AndResGuard有坑 记录下 在项目的build.gradle中添加如下 buildscript {ext.kotlin_version "1.4.31"repositories {google()jcenter()maven {url "https://s01.oss.sonatype.org/content/repositories/snapshots/"}}dependencies {class…

【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(七)- 向量算术指令格式

1. 引言 以下是《riscv-v-spec-1.0.pdf》文档的关键内容: 这是一份关于向量扩展的详细技术文档,内容覆盖了向量指令集的多个关键方面,如向量寄存器状态映射、向量指令格式、向量加载和存储操作、向量内存对齐约束、向量内存一致性模型、向量…

成功案例(IF=13.263)| 基因组+重测序+GWAS揭示豇豆传播过程中基因组的变化及荚果相关性状的遗传调控关键位点

研究背景 豇豆(Vigna unguiculata (L.) Walp.),豆科的一员,是一种一年生的热带或亚热带草本植物,用于人类食物和动物饲料,作为青粪、干草或青贮饲料。有两种主要栽培亚种Vigna unguiculata ssp. sesquiped…

文档管理系统解决方案(word原件)

1.系统概述 1.1.需求描述 1.2.需求分析 1.3.重难点分析 1.4.重难点解决措施 2.系统架构设计 2.1.系统架构图 2.2.关键技术 数据备份技术 3.系统功能设计 3.1.功能清单列表 3.2.基础数据管理 3.3.位置管理 3.4.文档使用 3.5.文档管理 软件全套资料包获取方式①:软件项…

leetcode热题100.接雨水

Problem: 42. 接雨水 文章目录 题目思路复杂度Code 题目 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。 示例 1: 输入:height [0,1,0,2,1,0,1,3,2,1,2,1] 输出:6 …

pyside6,“提升为”的部件使用困惑

在Qt designer中,新建一个QMainWindow,新建一个QWidget,并命名为widget,如图: 新建NewClass.py,输入代码: # encoding: utf-8 from PySide6.QtWidgets import QWidgetclass NewClass(QWidget):…

【JavaScript】原型链/作用域/this指针/闭包

1.原型链 参考资料:Annotated ES5 ECMAScript起初并不支持如C、Smalltalk 或 Java 中“类”的形式创建对象,而是通过字面量表示法或者构造函数创建对象。每个构造函数都是一个具有名为“prototype”的属性的函数,该属性用于实现基于原型的继…

mysql的索引类型与数据存储

mysql索引与类型 什么是索引? 索引(Index)是帮助MySQL高效获取数据的数据结构。我们可以简单理解为:快速查找排好序的一种数据结构。Mysql索引主要有两种结构:BTree索引和Hash索引。我们平常所说的索引,如…

真实的招生办对话邮件及美国高校官网更新的反 AI 政策

这两年 ChatGPT 的热度水涨船高,其编写功能强大,且具备强大的信息整合效果,所以呈现的内容在一定程度上具备可读性。 那么,美国留学文书可以用 ChatGPT 写吗?使用是否有风险?外网博主 Kushi Uppu 在这个申…

鸿蒙学习记录

问题小测记录 总结链接:小测总结 学习笔记:鸿蒙开发学习记录 1、 main_pages.json存放页面page路径配置信息。 2、在stage模型中,下列配置文件属于AppScope文件夹的是? app.json5 3、module.json5配置文件中,包含…

自然语言处理技术(Natural Language Processing)知识点

自然语言处理知识点 自然语言处理1. word2vec是什么2. 常用的NLP工具和软件3. 朴素贝叶斯分类器4. BiLSTM-CRF模型怎么去实现5. Bert模型实现NER6. 命名实体识别任务中,怎么去处理数据分布不均的问题?7. 用户问题检索相关文本时,具体都用了哪…