Workplace Search 的演变:使用 Elasticsearch 搜索你的私人数据

news2024/12/26 9:19:46

作者:Dana Juratoni, Aditya Tripathi

Workplace Search 功能将来将与 Elastic Search 合并。 这是你需要了解的内容。

生成式人工智能技术的最新进展为搜索带来了一系列可能性。 随着开发人员构建新的体验,用户正在采用新的搜索使用方式 —— 从用自然语言编写的搜索查询到通过上传图像或语音样本进行搜索。 在 Elastic®,我们一直致力于确保 Elasticsearch® 拥有开发人员构建现代搜索所需的正确机器学习工具。

在我们继续这一旅程的过程中,我们希望分享有关工作场所(Workplace)搜索的一些进展:

  • Elasticsearch 是推荐的工具,用于为未来的内部知识搜索用例构建搜索体验。
  • 独立的 Workplace Search 产品将继续以其当前形式获得支持。 Elasticsearch 将添加新功能,Workplace Search 将获得安全升级和修复。

如果你正在使用独立的 Workplace Search 产品或有兴趣为工作场所搜索用例构建搜索体验,则此博客将为你提供重要信息。

历史背景

当 Swiftype 于 2017 年与 Elastic 联手时,独立的 Workplace Search 产品成为我们产品的一部分。从那时起,我们向 Workplace Search 的流行数据库、文件系统和其他工具添加了许多内容源。 虽然用户喜欢 Workplace Search 包含各种数据源的集成,但有明确的反馈表明,开发人员希望通过透明度和灵活性来调整搜索体验。 这些调优工具仅在直接使用 Elasticsearch 平台时才可用。

随着最近 ChatGPT 和生成式 AI 技术的流行,内部知识搜索用例(即能够搜索所有私人内容源 —— 数据库、知识库、文件系统、协作或票务工具)对我们的用户来说变得越来越重要。 毫无疑问,私人数据的搜索检索和 LLM 在一起效果更好。

Elasticsearch 连接器是未来

客户喜欢使用 Workplace Search 内容源

使用 Workplace Search 产品的客户喜欢通过内容源提取数据、在搜索体验中使用索引数据以及使用内置工具管理数据和搜索的简单性。 这些功能不会消失,而是会作为我们 Elastic Search 产品的一部分不断发展 —— 其中一些工作从早期的 8.x 版本开始。 内容源已被连接器 (connectors) 取代和提升为一种 Elastic 集成。 这些连接器直接写入搜索优化的 Elasticsearch 索引,而不是使用使用抽象隐藏索引 (以 . 为开始的系统索引)。 通过这样做,利用平台功能(例如与第三方 transformer 模型集成)来转换索引数据的能力变得直观且易于配置。 因此,设置搜索体验比以往更加灵活,并且 Elasticsearch 本机功能提供了多种数据和搜索管理方式。

Elastic 连接器的典型部署

内部知识搜索用例最常见的架构涉及通过原生连接器和/或自我管理连接器客户端将私有组织数据引入 Elastic。 然后,自我管理的搜索应用程序会公开最终授权用户通过搜索体验查看的数据。

两个选项:Elastic Cloud 上的原生连接器或自托管客户端

连接器可作为原生连接器直接在 Elastic Cloud 部署中使用,无需额外的基础设施。 如果你更喜欢自行托管原生连接器,则可以将它们用作连接器客户端,以便在你自己的基础设施上轻松部署和自我管理,无需进行开发。 为此,你可以选择从源运行连接器或通过 Docker 进行部署。 连接器客户端是开放代码的,可以进行定制以满足你的特定需求。 此外,你可以利用我们的连接器框架创建新的连接器客户端,与我们当前目录中可能未涵盖的数据源集成。

在我之前的文章中,有一个例子 “Enterprise:使用 MySQL connector 同步 MySQL 数据到 Elasticsearch”。

转换数据以支持你的搜索

同步内容被索引到常规搜索优化的 Elasticsearch 索引,这些索引可直接在你的搜索体验中使用。 默认情况下,连接器特定逻辑和捆绑的 ent-search-generic-ingestion 管道会按照部署中的配置提取和转换数据。 对于更高级的用例,可以使用以下工具过滤和转换数据:

  • 基本同步规则,对于所有连接器都是相同的
  • 用于数据源级别远程过滤的高级同步规则
  • 适用于连接器客户端的自我管理提取服务
  • 自定义管道过滤,然后通过摄取管道持久化到 Elasticsearch(请阅读搜索中的摄取管道以了解更多详细信息。)
  • 摄取管道特别强大,因为它们为 ML 模型(例如 ELSER)以及通过连接器索引的任何私有数据提供了极其易于访问的集成点。

使用 Elastic Search 构建体验

一旦你在 Elasticsearch 中拥有数据,你就可以使用 Search UI 和 SearchKit 等前端组件项目构建自己的自定义搜索体验。 我们的内部知识搜索示例应用程序向你展示了如何使用现有工具开始使用。

Javascript 客户端库使你能够轻松构建搜索或将搜索集成到你的 Web 应用程序中,或使用众多 Elasticsearch 客户端库之一。

我们正在快速添加功能以使搜索更加强大。 使用 Elasticsearch 构建你的内部搜索系统,你可以在这些功能发布后立即使用它们。

  • Elasticsearch 支持向量、语义、混合和生成式 AI 搜索用例。 查看我们的一些语义和向量搜索功能,包括强大的开箱即用的稀疏向量模型。 在 8.11 中,此模型已正式发布,只需单击几下即可将其应用于使用 Elastic 连接器或网络爬虫写入的数据。
  • 借助基于搜索模板的完全可定制的搜索应用程序 API,如果你的用例需要的话,这个新 API 可以抽象化 Elasticsearch Query DSL 的学习曲线。 你可以随时使用 Query DSL 深入了解详细信息。
  • 新的搜索管理工具可让你直接管理特定查询的结果,例如提升或隐藏结果,并以编程方式使用同义词管理 API。

Workplace Search 产品和 workplace search 用例

独立的 Workplace Search 产品将继续成为受支持的体验,因此虽然建议迁移到新功能,但这不是必需的。 任何希望提升内部知识搜索以包括语义搜索、向量搜索或基于聊天提示的体验的用户都将从过渡到使用 Elastic 连接器中受益。 在 Elastic Search 的支持下,企业中的工作场所搜索用例范围取得了许多引人注目的进步。 现在是考虑升级内部知识搜索的好时机,以使其为你的用户带来惊人的体验!

为你提供的资源

  • 用于为你的内部知识源构建搜索体验的示例应用程序
  • Elastic Search 和 Workplace Search 功能比较(请参阅我们文档中的表格)
  • 新的! 搜索实验室在 GitHub 上有代码 notebooks、工程博客和示例项目。
  • 你知道 Elasticsearch 是向量数据库超集吗?

本文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。 当前不可用的任何特性或功能可能无法按时交付或根本无法交付。

在这篇博文中,我们可能使用或引用了第三方生成人工智能工具,这些工具由其各自所有者拥有和运营。 Elastic 对第三方工具没有任何控制权,我们对其内容、操作或使用不承担任何责任,也不对你使用此类工具可能产生的任何损失或损害负责。 使用人工智能工具处理个人、敏感或机密信息时请务必谨慎。 你提交的任何数据都可能用于人工智能培训或其他目的。 无法保证你提供的信息将得到安全或保密。 在使用之前,你应该熟悉任何生成式人工智能工具的隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 和相关标记是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。 所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:https://github.com/elastic/elasticsearch-labs/tree/main/example-apps/internal-knowledge-search

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1220257.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基础课7——数据预处理

在智能客服系统中,数据预处理是进行自然语言处理(NLP)的关键步骤之一。它是对用户输入的文本数据进行分析、处理和转换的过程,目的是将原始文本数据转化为计算机可理解的语言,为后续的智能回答提供支持。 1.什么是数据…

html在线生成二维码(附源码)

文章目录 1.设计来源1.1 主界面1.2 美化功能 2.效果和源码2.1 动态效果2.2 源代码 源码下载 作者:xcLeigh 文章地址:https://blog.csdn.net/weixin_43151418/article/details/134458927 html二维码生成(附源码),生成二…

Cow Lineup S——离散化、单调队列、双指针

题目描述 思路 x、id不大于1亿,数据量太大,使用离散化将id离散化成一串从1开始连续的编号,使用map集合进行离散化使用双指针维护一段区间,这段区间满足每个编号都包含 如何使用map集合进行离散化? 维护一个变量nums…

在Linux上安装Oracle 数据库 11g (含静默方式安装)

好久没碰11g了,今天(2023年11月16日)因为有个需求又装了一遍。 在OCI上安装了一个Oracle Linux 6实例: $ uname -a Linux instance-20231116-1239-db11g 4.1.12-124.80.1.el6uek.x86_64 #2 SMP Mon Oct 9 02:32:10 PDT 2023 x86…

Springboot升级为3.0.6

版本升级 Springboot升级为3.0.6 版本从原来的2.7.12换成了3.0.6 <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>3.0.6</version><relativePath/> <…

使用宝塔面板安装mysql

1.第一步 在官网https://www.bt.cn/new/download.html下载页面直接在服务器控制面板复制这里的代码下载即可 2.第二步 下载好后按照服务器面版上有个公网地址&#xff0c;含有用户名和密码&#xff0c;保存好&#xff0c;然后通过公网地址打开一个网页&#xff0c;绑定自己注册…

【数据结构与算法】JavaScript实现双向链表

文章目录 一、双向链表简介二、封装双向链表类2.0.创建双向链表类2.1.append(element)2.2.toString()汇总2.3.insert(position,element)2.4.get(position)2.5.indexOf(element)2.7.update(position,element)2.8.removeAt(position)2.9.其他方法2.10.完整实现 三、链表结构总结3…

苍穹外卖--新增员工

请求方式Post,请求参数&#xff1a; 用EmployeeDTO类接收参数 Controller层实现&#xff1a; PostMappingpublic Result save(RequestBody EmployeeDTO employeeDTO){employeeService.save(employeeDTO);return Result.success();}service层实现&#xff1a; Overridepublic …

国家大基金三期线上金融正式倒计时!11月17日,共启芯片产业新篇章

国家大基金三期线上金融正式倒计时&#xff01;11月17日&#xff0c;共启芯片产业新篇章 新时代浪潮下&#xff0c;全球化进程不断推动各科技大国的核心发展&#xff0c;芯片作为强有力的竞争标志&#xff0c;是国与国之间的重要技术战争焦点。同时&#xff0c;国内基金发展势…

数字艺术藏品软件的独特创新与未来趋势

随着科技的飞速发展&#xff0c;数字艺术藏品软件逐渐崭露头角&#xff0c;为艺术爱好者们提供了一个全新的收藏方式。这类软件不仅为艺术家提供了展示作品的平台&#xff0c;也为收藏家们提供了收藏和分享艺术品的渠道。本文将从开发思路、技术实现、市场前景等方面探讨数字艺…

TP_Link WR886N 硬改闪存16M内存64M,刷入openwrt

一、换内存&#xff0c;拆闪存&#xff1a; 1、先原机开机试试是否功能正常&#xff1b; 2、拆机&#xff0c;比较难拆&#xff0c;容易坏外壳&#xff1b; 3、找到内存和闪存&#xff0c;用胶带把边上的小元件&#xff0c;电阻都贴好&#xff1b; 4、加助焊油&#xff0c;用风…

IPSec:strongswan -- IKEv2如何检测到经过了nat设备

拓扑 其中NAT设备将来自DUTA的报文源IP 101.0.0.2转换为102.0.0.2。DUTA发起IPSec连接。 DUTA计算natd_chunk和natd_hash DUTA先用自己的SPI&#xff0c;对等体的SPI&#xff08;为0&#xff09;&#xff0c;IP和端口号做SHA1处理。如下图&#xff1a; 代码位于ike_natd.c的函…

【论文解读】CP-SLAM: Collaborative Neural Point-based SLAM System_神经点云协同SLAM系统(上)

目录 1 Abstract 2 Related Work 2.1 单一智能体视觉SLAM&#xff08;Single-agent Visual SLAM&#xff09; 2.2 协同视觉SLAM&#xff08;Collaborative Visual SLAM&#xff09; 2.3 神经隐式表示&#xff08;Neural Implicit Representation&#xff09; 3 Method 3.…

欧科云链研究院:DeFi 将要纳税?美国国税局召开听证会

出品&#xff5c;欧科云链研究院 作者&#xff5c;Matthew Lee 北京时间 11月15日&#xff0c;美国国税局&#xff08;IRS&#xff09;召开了一场备受瞩目的听证会&#xff0c;讨论扩大加密货币资产的征税范围。此次听证会囊括了诸多关键议题&#xff0c;包括用户隐私、必须报…

【数据结构】树与二叉树(十八):树的存储结构——Father链接结构、儿子链表链接结构

文章目录 5.1 树的基本概念5.1.1 树的定义5.1.2 森林的定义5.1.3 树的术语 5.2 二叉树5.3 树5.3.1 树的存储结构1. 理论基础2. 典型实例 5.3.2 Father链接结构a. 定义树节点结构b. 创建新节点c. 主函数d. 代码整合 5.3.3 儿子链表链接结构a. 定义树节点结构b. 创建新节点c. 添加…

DOORS和Reqtify—需求管理和需求追溯工具

产品概述 IBM Rational DOORS可实现对整个产品的全生命周期需求管理&#xff0c;覆盖从需求、到设计以及测试阶段&#xff0c;是一款被广泛使用的企业级专业需求管理工具。DOORS可以将项目开发过程中产生的各级需求和与需求相关的文件、网址URL进行链接管理&#xff0c;同时能够…

微信小程序Error: ENOENT: no such file

问题描述 当编译的时候 会提示找不到这个文件&#xff08;index&#xff09;&#xff0c;但是确信项目目录里已经删除了该页面路径&#xff0c;并且app.json的pages列表中也 导致这个问题应该是&#xff1a;新添加了文件&#xff0c;后面删除了或者修改了文件名&#xff0c;导…

Vue3.0和2.0语法不同分析

前言&#xff1a;本篇文章只做VUE3.0和VUE2.0语法上的不同分析&#xff0c;不做性能和源码架构等的分析。 一、VUE3.0和VUE2.0代码结构不同 VUE3.0代码实例 <template><div><span>count is {{ count }}</span><span>plusOne is {{ plusOne }}…

AH8691-60V降压至3.3V电源芯片:ESOP8封装解决方案

AH8691-60V降压至3.3V电源芯片&#xff1a;ESOP8封装解决方案 随着电子设备的日益普及&#xff0c;电源管理芯片的重要性也日益凸显。一款高效率、低功耗的电源芯片可以大大提高电子设备的性能和可靠性。今天&#xff0c;我们将介绍一款60V降压至3.3V电源芯片&#xff0c;采用…

c++递归分析出依赖的头文件

我想使用boost::optional&#xff0c;但boost库太大&#xff0c;添加到git时比较费劲。 怎样分析出boost/optional.hpp依赖的头文件&#xff0c;然后精准地添加到git上呢&#xff1f; 使用g就可以了&#xff0c;步骤如下 进入目录boost_1_78_0/boost执行 g -MM -H optional.hp…