LangChain与Elasticsearch向量数据库的完美结合

news2024/9/23 9:24:19

在过去的一年中,生成式 AI (Generative AI) 领域取得了显著的进展。许多新的服务和工具应运而生。其中,LangChain 已成为构建大语言模型 (LLM) 应用程序(例如检索增强生成 (RAG) 系统)最受欢迎的框架之一。该框架极大地简化了原型开发,并使开发者能够轻松实验不同的模型和检索系统。

最近Elasticsearch将其集成从社区包升级为官方的 LangChain 合作伙伴包。这一升级使得在 LangChain 应用程序中引入 Elasticsearch 功能变得更加简便。Elastic 团队通过专门的代码库管理代码和发布过程。

Elasticsearch 是目前最灵活且性能卓越的检索系统之一,具备可扩展的数据存储和向量数据库功能。Elastic 的一个重要目标是成为最开放的检索系统。Elasticsearch与 LangChain 等库紧密合作,并为生成式 AI 生态系统添加了原生支持功能,从将 Elasticsearch 作为向量数据库,到实现混合搜索,再到协调完整的 RAG 应用程序。

使用 Elasticsearch 和 LangChain 快速构建 RAG 系统

RAG 是一种为用户提供非常相关答案的技术。相比直接使用大语言模型 (LLM),它的主要优点在于可以轻松集成用户数据,并且能够最大程度地降低 LLM 出现错误信息的风险。这是通过增加一个文档检索步骤来实现的,该步骤为 LLM 提供相关的上下文信息。

Elasticsearch 一直是进行相关文档检索的首选解决方案,并且持续引领创新,提供多种检索策略。在将 Elasticsearch 集成到 LangChain 时,我们使用户能够轻松选择最常见的检索策略,比如密集向量、稀疏向量、关键字检索或混合检索。同时,也允许高级用户进一步自定义这些策略。

构建一个简单的 RAG 应用程序

按如下方式安装包pip install langchain-elasticsearch;然后,我们将一些示例文档添加到我们的 Elasticsearch 存储中。

texts = [
    "LangChain is a framework for developing applications powered by large language models (LLMs).",    
    "Elasticsearch is a distributed, RESTful search and analytics engine capable of addressing a growing number of use cases.",    
    ...
]
es_store.add_texts(texts)

接下来,我们使用 OpenAI 提供的默认 gpt-3.5-turbo 模型作为LLM模型,该模型也为 ChatGPT 提供支持。

from langchain_openai import ChatOpenAI

llm = ChatOpenAI(api_key="sk-...") # or set the OPENAI_API_KEY environment variable

采用一个标准提示来指示LLM。将 Elasticsearch转换为 LangChain 检索器。最后,我们将检索步骤与将文档添加到提示符并将其发送到 LLM.
在这里插入图片描述
现在用户可以就数据提出问题:

rag_chain.invoke("Which frameworks can help me build LLM apps?")

LangChain 和 Elasticsearch 检索器

Elasticsearch 存储提供了现成的常见检索策略,开发者可以自由探索最适合特定场景的方案。但如果数据模型比单一字段的文本更复杂呢?例如,如果索引包含了一个网络爬虫生成的文档,这些文档包含文本、标题、URL 和标签等多个字段,而所有这些字段都对搜索至关重要,应该如何处理?Elasticsearch 的查询 DSL (Query DSL) 为用户提供了完全的搜索数据灵活性。在 LangChain 中,ElasticsearchRetriever 可以直接实现这种灵活性。只需定义一个函数,将用户输入的查询映射到 Elasticsearch 请求即可。

假设我们想在检索步骤中添加语义重新排序功能。通过增加 Cohere 重新排序步骤,排在前面的结果将变得更加相关,而无需额外的手动调整。为此,让我们定义了一个 Retriever,它接收一个返回对应 Query DSL 结构的函数。
在这里插入图片描述
这个检索器可以顺畅地集成到上面的 RAG 代码中。这样一来, RAG 流程中的检索部分将变得更加精确,从而将更相关的文档传递给大语言模型 (LLM),最终提供更为相关的答案。

Elastic 对 LangChain 生态系统的持续投入,将最新的检索创新融入了这个最受欢迎的生成式 AI (GenAI) 库之一。通过此次合作,Elastic 和 LangChain 让开发者能够快速、轻松地为用户构建 RAG 解决方案,同时提供了对结果质量进行深入调整的灵活性。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2048196.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【网络安全】通过设备ID绕过双因素身份验证

未经许可,不得转载。 文章目录 正文正文 某站点登陆界面如下所示:https://redacted.com/login 输入正确的用户名密码并拦截登录请求,请求包如下: POST /api/authentication/login-2fa HTTP/1.1 Host: redacted.com Content-Length: 100 Sec-Ch-Ua: "Not)A;Brand&quo…

(南京观海微电子)——投影仪原理及使用介绍

投影仪 是一种用来放大显示图像的投影装置。目前已经应用于会议室演示以及在家庭中通过连接DVD影碟机等设备在大屏幕上观看电影。在电影院,也同样已开始取代老电影胶片的数码影院放映机,被用作面向硬盘数字数据的银幕。 投影仪的成像原理 首先&#xff…

这款新的 AI 工具会消灭 ChatGPT 吗?

随着大型语言模型 (LLM) 的出现,ChatGPT迅速成为全球计算机用户的家喻户晓的名字。这款由 OpenAI 设计的深度学习聊天机器人以知识宝库而闻名——一部互联网百科全书。 继ChatGPT的脚步之后,许多其他生成式AI工具也纷纷涌现。 2023 年 3 月,一…

大型、复杂、逼真的安全服和安全帽检测:SFCHD数据集和SCALE方法

智能守护工地安全:SFCHD数据集与SCALE模块介绍 在人工智能(AI)技术飞速发展的今天,其在建筑工地安全领域的应用正逐渐展现出巨大潜力。尤其是高风险行业如化工厂的施工现场,对工人的保护措施要求极为严格。个人防护装…

07、stm32外部中断

一、配置 二、代码 /* Private define ------------------------------------------------------------*/ /* USER CODE BEGIN PD */ uint8_t keyFalg 0; // 1按键被按下 /* USER CODE END PD *//* USER CODE BEGIN 4 */ void HAL_GPIO_EXTI_Callback(uint16_t GPIO_Pin) {if…

GStreamer 简明教程(三):动态调整 Pipeline

系列文章目录 GStreamer 简明教程(一):环境搭建,运行 Basic Tutorial 1 Hello world! GStreamer 简明教程(二):基本概念介绍,Element 和 Pipeline 文章目录 系列文章目录前言一、静…

windows11怎么加密?如何对win11系统文件进行加密?

“昔者,有物藏于室,恐人窥之,必施锁钥以护之。今之世,信息如海,数据若金,保护之责,重于泰山。Windows 11,微软之新篇,亦需加密之术,以护数据安全。” 本文将…

Golang | Leetcode Golang题解之第341题扁平化嵌套列表迭代器

题目: 题解: type NestedIterator struct {vals []int }func Constructor(nestedList []*NestedInteger) *NestedIterator {var vals []intvar dfs func([]*NestedInteger)dfs func(nestedList []*NestedInteger) {for _, nest : range nestedList {if…

期末速成复习资料——操作系统

体型:选择20判断10填空10*2简答4*5计算2*10 第一章 在一个计算机系统中,通常都含有多种硬件和软件资源。归纳起来可将这些资源分为四类:处理机、存储器、I/O设备以及文件(数据和程序)。相应地,OS的主要功能…

html中的<base>标签和 href属性的使用

先截图一个菜鸟教程的案例 说白了就是将本页面所有的URL前边都加上base标签后边的href中的内容即:

财务会计与管理会计(八)

文章目录 电商绩效工资计算IF函数的应用 参数表的格式转换INDEX、MATCH函数的应用 巧妙计算计件工资引出问题调整方案增加变量扩大范围 智能值班表VLOOKUP函数的使用方法 按照设备类别自动编号VLOOKUP、COUNTIF、TEXT函数的使用方法 多公司多月份损益汇总表OFFSET、INDIRECT函数…

154 · 正则表达式匹配

链接:LintCode 炼码 - 更高效的学习体验! 题解: class Solution { public:/*** param s: A string * param p: A string includes "." and "*"* return: A boolean*/bool isMatch(string &s, string &p) {// w…

Unity求向量和平面的交点

已知条件:平面P的法向量,平面上的一点P0,直线L的方向向量,直线上的一点L0 公式推导: 主要是两点: 1.目标点T在直线上:TL0D*(D未知) 2.目标点T在平面上,则T…

Kubectl 常用命令汇总大全

kubectl 是 Kubernetes 自带的客户端,可以用它来直接操作 Kubernetes 集群。 从用户角度来说,kubectl 就是控制 Kubernetes 的驾驶舱,它允许你执行所有可能的 Kubernetes 操作;从技术角度来看,kubectl 就是 Kubernetes…

【JavaEE】一文学会如何使用:文件IO操作(详解)

目录 前言 什么是IO? IO流原理 IO流分类 InputStream字节流输入 文件输入流--FileInputStream 理解InputStream中的read方法 关闭文件操作 利用Scanner进行字符获取 OutputStream字节流输出 文件输出流--FileOutputStream 理解OutputStream中的…

计算机毕业设计选题推荐-在线学习平台-Java/Python项目实战

✨作者主页:IT研究室✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…

Linux - 权限

文章目录 一、用户二、文件 一、用户 1、Linux下有两种用户:超级用户(root)、普通用户。 超级用户:可以再linux系统下做任何事情,不受限制 。 普通用户:在linux下做有限的事情。 超级用户的命令提示符是“…

Python数据分析实战:从零开始构建销售预测模型

随着大数据时代的到来,数据分析已经成为企业决策的重要依据之一。Python作为一种强大的编程语言,在数据分析领域有着广泛的应用。本文将通过一个具体的案例——销售预测——来演示如何使用Python进行数据预处理、特征工程、模型构建与评估。无论你是Pyth…

【持续更新】Adoobe Afteer Effeects 2024 v24.5.0.052最新免费修改版

利用Adoobe Afteer Effeects CC,您可以轻松打造生动的动画标题、字幕以及下三分屏元素。无论是从零开始还是借助应用内丰富的预设动画,都能让您的文字以各种方式动起来,无论是旋转、滑动或是平移,创意无限。 将视频和图像融合在一…

负载均衡、高可用

负载均衡 负载均衡(Load Balance):可以利用多个计算机和组合进行海量请求处理,从而获得很高的处理效率,也可以用多个计算机做备份(高可用),使得任何一个机器坏了整个系统还是能正常…