搜索如何加速你迈向 “AI 优先” 的步伐

news2024/11/25 4:33:30

作者:来自 Elastic Hayley Sutherland

人工智能与搜索的结合使企业智能达到了新的水平,自然语言处理 (NLP)、基于机器学习 (ML) 的相关性、向量/语义搜索和大型语言模型 (LLMs) 等技术帮助组织最终释放未分析数据的价值。组织需要搜索和知识发现技术来发现、分析和利用关键数据。然而,数据泛滥意味着传统搜索系统难以帮助业务用户快速找到所需内容。作为回应,现代搜索系统通过利用基于人工智能的功能,在结果的准确性、相关性和实用性方面取得了巨大飞跃。现在,人工智能的新浪潮 —— 生成式人工智能 (generative AI - GenAI) —— 正在改变前瞻性组织处理搜索、知识管理和其他形式的知识发现的方式。

通过从企业数据源检索相关信息,搜索被证明是将 GenAI 与业务和现实世界数据连接起来的基础,这一过程称为检索增强生成 (retrieval augmented generation - RAG)。通过为 GenAI 模型添加相关信息,搜索系统可以确保答案和见解准确、相关且实用。现实世界的问题和可操作的见解是 AI 与实际业务环境的交汇点,而 RAG 中的检索步骤的重要性不容小觑。

在深入研究 RAG 之前,让我们先回顾一下,了解我们是如何走到这一步的。这有助于了解在何处最好地利用不同形式的 AI 和信息检索,以充分利用技术投资并加速成为 AI 优先组织的道路。

我们是如何走到这一步的?

在过去 10 多年里,IDC 定期对组织进行调查,了解企业搜索和知识发现的挑战和好处。调查问题侧重于 “隐藏” 或未分析数据所代表的一些未开发价值。我们对知识工作者进行调查,了解他们每周在搜索相关活动上浪费了多少时间,例如寻找他们从未真正找到的信息、在多个数据源中搜索一条信息,或者将多条信息连接起来以得出见解或答案。

从 2013 年、2015 年、2019 年和 2023 年的总体来看,这些问题的数据显示,过去五年没有取得显著进步的传统搜索引擎一直在努力跟上组织数据不断增加的数量和种类。这些传统引擎通常使用传统的关键字搜索和脆弱的基于规则的系统,而不是自适应、智能、语义和混合搜索。因此,使用这些工具的组织必须应对相关性排名不佳、查询理解过时或不准确以及基本的可查找性挑战。

另一方面,研究表明,与人工智能创新保持同步的搜索系统在过去五年中取得了显著进步。人工智能带来了更好的搜索、翻译和组合信息的能力。这些能力包括:

  • 日益复杂的自然语言理解,允许更多用户以更自然的语言提问
  • 基于机器学习的相关性排名,改善结果显示顺序,实现个性化以及基于受欢迎程度的重新排名
  • 语义/向量搜索,通过扩展搜索系统的语义理解,超越精确的关键字匹配,进一步增强自然语言搜索功能。关键字和向量搜索的组合(又称混合搜索)在电子商务搜索用例中特别受欢迎,因为它能够找到精确的 SKU/产品名称以及推荐或类似的产品,从而提高转化率、交叉销售和追加销售

使用现代搜索意味着与 2019 年相比,2023 年员工每周在搜索相关活动上浪费的时间减少了 12 个小时 —— 这是一项显着的生产力提高 【1】。与此同时,客户也更加满意,更愿意消费。采用现代人工智能搜索的零售组织报告了诸多好处,例如成本节约(39%)、利润(35%)、客户满意度和参与度(34%)的提高,以及将资源引导至更高价值和/或创收任务的能力(25%)。

新要求:从搜索到搜索 AI(Search AI)

几乎每个行业的领导者都面临着利用 AI 实现业务优势的需求,并且必须加速其组织向 AI 优先转型。IDC 发现,83% 的 IT 领导者认为,利用自身业务数据的 GenAI 模型将为他们带来显著的竞争优势【2】。然而,到 2024 年 1 月,只有 24% 的组织认为他们的资源已为 GenAI 做好了充分准备【3】。过去一到两年的试验、错误和成功表明,搜索技术有助于通过 RAG 弥合 GenAI 与企业数据之间的差距。与需要重新训练 AI 模型的微调相比,RAG 是一种更具成本效益且更省时的方法,用于用特定和/或专有数据补充 LLM:

如上图所示,RAG 在索引/预处理和查询管道中涉及许多步骤和技术。根据数据类型和所涉及的用例,可能需要向量搜索或向量和关键字的组合(又称混合)搜索。公司应该评估其资源,以确定他们想要自己构建和维护哪些部分。IDC 建议如下:

  • 确保组织在 RAG 的检索步骤中利用具有高准确度和相关性的强大搜索技术。要寻找的方面包括混合搜索(关键字和语义/向量)、自动重新排名和低代码/无代码工具,这些工具可让各种用户轻松进行测试和调整。此步骤对于确保 LLM 提供最相关、最有用和最可操作的摘要和答案至关重要。
  • 评估数据源的准确性和新鲜度,并考虑将使用哪些工具来连接、过滤或将数据提取到管道中。确保数据治理和业务规则(例如访问权限)不会在此过程中丢失,并且系统具有强大的安全防护。
  • 确定哪种类型的 AI 最适合不同的用例。应战略性地应用 GenAI,以确保其使用可行、有价值且负责任。如果需要,请选择具有必要经验的提供商来协助确定用例和 AI 使用的优先级。
  • 寻找可以协助完成将企业数据连接到 LLM 所需的部分或全部步骤的合作伙伴,包括解析、分块、嵌入、存储以及使用向量或混合搜索来检索要提供给 LLM 的关键信息。

Hayley Sutherland

IDC 对话式人工智能和智能知识发现研究经理

Hayley Sutherland 是 IDC 软件市场研究和咨询小组的对话式人工智能和智能知识发现研究经理。她的核心研究范围包括对话式人工智能和搜索,重点关注聊天机器人和数字助理的人工智能软件开发工具和技术、语音人工智能和文本人工智能、机器翻译、嵌入式知识图谱创建、智能知识发现和情感计算(也称为情绪人工智能)。


赞助商寄语

Elastic 完整的基于云的搜索、可观察性和安全性解决方案建立在 Elastic Search Al 平台上,超过 50% 的财富 500 强企业都在使用该平台。通过利用所有结构化和非结构化数据并保护和保护私人信息,Elastic 可帮助组织利用搜索的精确性来兑现 Al 的承诺。

IDC 信息简报:人工智能的进步如何改变游戏规则
了解人工智能如何改变搜索游戏规则 — 此外,还可获得使用专有数据构建现代搜索的基本指导。获取简介
  1. IDC 的北美知识发现调查,2023 年 2 月,n = 522
  2. IDC 的 GenAI ARC 调查,2023 年 8 月,n = 1,363
  3. IDC 的未来企业弹性和支出调查,第 1 波,2024 年 1 月,n = 881

本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。

在这篇博文中,我们可能使用或提到了第三方生成 AI 工具,这些工具由其各自的所有者拥有和运营。Elastic 无法控制第三方工具,我们对其内容、操作或使用不承担任何责任,也不对您使用此类工具可能产生的任何损失或损害承担任何责任。将 AI 工具用于个人、敏感或机密信息时请谨慎。您提交的任何数据都可能用于 AI 培训或其他目的。无法保证您提供的信息将得到安全或保密。在使用任何生成式 AI 工具之前,您应熟悉其隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 和相关标志是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:How search accelerates your path to "AI first" | Elastic Blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2208855.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uniapp 整合 OpenLayer3 - 全图、切换底图、导航、定位

一、全图 主要代码: // 获取当前可见视图范围 //console.log(this.map.getView().calculateExtent()); // 设置中心点 //this.map.getView().setCenter(transform([125.33,43.90], EPSG:4326, EPSG:3857)); // 设置层级 //this.map.getView().setZoom(10);// 中心…

【ProtoBuf】ProtoBuf基础与安装

本篇文章介绍 C 使用方向 文章目录 ProtoBuf简介ProtoBuf安装WindowsLinux ProtoBuf简介 ProtoBuf(全称为 Protocol Buffer)是一种序列化结构数据的方法 序列化是将对象转换为可存储的或传输的格式的过程,通常用于数据交换或持久化存储。我们在C/Java中编写的类不…

JAVA-数据结构-排序

1.直接插入排序 1.原理&#xff1a;和玩扑克牌一样&#xff0c;从左边第二个牌开始&#xff0c;选中这个&#xff0c;和前面的所有牌比较&#xff0c;插在合适的位置 public static void insertsort(int[] arr){//直接插入排序for (int i 1; i < arr.length; i) {//此循环…

SSD融合FERPlus模型实现面部情绪识别

关于深度实战社区 我们是一个深度学习领域的独立工作室。团队成员有&#xff1a;中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等&#xff0c;曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万粉丝&#xff0c;拥有2篇国家级人工智能发明专利。 社区特色…

帝国竞争主义算法(ICA)的MATLAB代码复现

目录 1 帝国竞争主义算法优化BP神经网络代码复现 2 帝国竞争主义算法优化支持向量机代码复现 3 帝国竞争主义算法优化长短期记忆神经网络代码复现 1 帝国竞争主义算法优化BP神经网络代码复现 1&#xff09;单输出回归预测&#xff1a;单输出回归预测&#xff1a;帝国主义竞…

API接口并发请求控制实现

文章目录 一、问题概述二、解决思路1. AtomicInteger2. LongAdder3. Semaphore4. 实现区别三、API接口并发控制1. 核心源码2. 源码放送 一、问题概述 某API接口&#xff0c;承载某重要业务&#xff0c;希望控制任意时间点的并发访问数在5以内&#xff0c;该如何实现&#xff1…

数据结构-5.5.二叉树的存储结构

一.二叉树的顺序存储&#xff1a; a.完全二叉树&#xff1a; 1.顺序存储中利用了静态数组&#xff0c;空间大小有限&#xff1a; 2.基本操作&#xff1a; (i是结点编号) 1.上述图片中i所在的层次后面的公式应该把n换成i(图片里写错了)&#xff1b; 2.上述图片判断i是否有左…

ThingsBoard规则链节点:JSON Path节点详解

引言 JSON Path节点简介 用法 含义 应用场景 实际项目运用示例 智能农业监控系统 工业自动化生产线 车联网平台 结论 引言 ThingsBoard是一个功能强大的物联网平台&#xff0c;它提供了设备管理、数据收集与处理以及实时监控等核心功能。其规则引擎允许用户通过创建复…

Java-学生管理系统[初阶]

这次我们来尝试使用Java实现一下"学生管理系统"&#xff0c;顾名思义&#xff0c;就是实现一个能用来管理学生各种数据的系统。在后续学习中我们将对"学生管理系统"进行两种实现&#xff1a; &#x1f4da; 学生管理系统[初阶](不带模拟登录系统) &#…

衡石分析平台系统管理手册-智能运维之系统日志

系统日志​ 点击系统设置->系统日志 在这个页面&#xff0c;从时间&#xff0c;操作者, IP&#xff0c;行为&#xff0c;结果&#xff0c;类别&#xff0c;对象&#xff0c;描述等方面记录了用户行为&#xff0c;系统管理员可以从此页面针对整个系统的用户行为进行审计工作…

【C++】set/map 与 multiset/multimap

✨✨欢迎大家来到Celia的博客✨✨ &#x1f389;&#x1f389;创作不易&#xff0c;请点赞关注&#xff0c;多多支持哦&#x1f389;&#x1f389; 所属专栏&#xff1a;C 个人主页&#xff1a;Celias blog~ 目录 ​编辑 序列式容器和关联式容器 一、set 1.1 set介绍 1.2 …

大健康零售电商的智囊团:知识中台的应用与影响

在数字化浪潮席卷各行各业的今天&#xff0c;大健康零售电商行业也在积极探索转型升级的新路径。知识中台&#xff0c;作为一种集知识管理、数据挖掘与智能化应用于一体的新型技术架构&#xff0c;正逐渐成为推动这一转型的关键力量。本文将深入探讨知识中台在大健康零售电商中…

Light灯光组件+组件的相关操作+游戏资源的加载

Light灯光组件 Type: Directional:平行光&#xff0c;模仿的是太阳光 Spot:聚光灯 Area:区域光 Color&#xff1a; 颜色值 Mode: RealTime:实时 Mix:混合 Baked:烘焙 Intersity: 光照强度 Indirect Multiplier:光照强度乘数 Shadow Type:影子设置&#xff1a;…

CV方法再学习

轻量化模型 Mobile系列(V1~V3) MobileNetV1 MobileNetV1之所以轻量&#xff0c;与深度可分离卷积的关系密不可分 深度可分离卷积 主要是两种卷积变体组合使用&#xff0c;分别为逐通道卷积&#xff08;Depthwise Convolution&#xff09;和逐点卷积&#xff08;Pointwise C…

Nginx UI 一个可以管理Nginx的图形化界面工具

Nginx UI 是一个基于 Web 的图形界面管理工具&#xff0c;支持对 Nginx 的各项配置和状态进行直观的操作和监控。 Nginx UI 的功能非常丰富&#xff1a; 在线查看服务器 CPU、内存、系统负载、磁盘使用率等指标 在线 ChatGPT 助理 一键申请和自动续签 Let’s encrypt 证书 在…

八、Python基础语法(判断语句-下)

一、if elif else 结构 应用场景&#xff1a;多个判断条件下&#xff0c;并且这些判断条件存在一定的关联。 语法&#xff1a; elif也是python中关键字&#xff0c;后面跟一个判断条件&#xff0c;判断条件后面跟冒号 存在冒号&#xff0c;需要换行缩进&#xff0c;处于elif…

金九银十软件测试面试题(800道)

今年你的目标是拿下大厂offer&#xff1f;还是多少万年薪&#xff1f;其实这些都离不开日积月累的过程。 为此我特意整理出一份&#xff08;超详细笔记/面试题&#xff09;它几乎涵盖了所有的测试开发技术栈&#xff0c;非常珍贵&#xff0c;人手一份 肝完进大厂 妥妥的&#…

QD1-P5 HTML 段落标签(p)换行标签(br)

本节视频 www.bilibili.com/video/BV1n64y1U7oj?p5 ‍ 本节学习 HTML 标签&#xff1a; p标签 段落br标签 换行 ‍ 一、p 标签-段落 1.1 使用 p 标签划分段落 <p>段落文本</p>示例 <!DOCTYPE html> <html><head><meta charset"…

算法剖析:滑动窗口

文章目录 前言一、长度最小的子数组二、无重复字符的最长子串三、最大连续1的个数 III四、将 x 减到 0 的最小操作数五、水果成篮六、找到字符串中所有字母异位词七、串联所有单词的子串八、最小覆盖子串总结 前言 滑动窗口可以看作为一种特殊的通向双指针&#xff0c;这两个指…

轻松翻译:顶尖翻译器评测!

在工作生活中如果遇到翻译需求&#xff0c;就少不了一些好用的翻译器&#xff0c;接下来是我们就来为大家推荐几款市面上口碑极佳的翻译软件&#xff01; 福昕在线翻译 直达链接&#xff1a; fanyi.pdf365.cn/ 操作教程&#xff1a;立即获取 福昕在线翻译是一款基于云端技…