LangChain的RAG实践

news2025/1/18 6:42:09

1. 什么是RAG

RAG的概念最先在2020年由Facebook的研究人员在论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中提出来。在这篇论文中他们提出了两种记忆类型:

  • 基于预训练模型(当时LLM的概念不像现在这么如日中天,但LLM也可以被归类为预训练模型)的参数型记忆;
  • 基于向量的非参数型记忆。

RAG技术将这两种记忆类型进行了整合,最终,在知识密集型的NLP任务上,比如QA,比单独使用上述两种类型的记忆获得了更好的效果。接下来将具体介绍RAG如何来补充LLM的一些短板,以及在两种记忆的具体体现,并使用LangChain来实现基本RAG流程。

2. LLM面临的挑战和RAG带来的好处

目前来看,LLM是几乎是解决各个任务的最佳解决方案。在通用聊天这一领域,很多大模型都能够实现接近人类的水平表现。但它的表现也不是完美,也存在着诸多不足:

  • 在没有答案的情况下提供虚假的信息(幻觉);
  • 在专业领域表现不足,无法给出回答,这和大模型使用的训练数据息息相关,很多领域的数据是相对粉封闭的;
  • 对于同样的问题可能会产生不同的回答,这在对问题答案稳定性要求高的领域是不能接受的;
  • 无法感知不断变化的知识。

可以把大模型比做一个刚毕业找到工作的大学生,他具备了很多通识性的知识,但对组织内部的专业知识知之甚少,因此需要尽快掌握组织内部的领域知识,可以让资深员工手把手的传输知识,也可以通过阅读组织内的文档吸收知识。与此类似,RAG通过问题匹配知识,并将知识带给大模型,再利用大模型出色的生成能力来回答问题,这样大模型这个“新人”就能变得专业,也能感知到不断变化的外部信息。

3. LangChain的RAG实践

在本节,我们将重点利用LangChain框架来进行RAG实践

3.1 RAG架构

典型的RAG架构与搜索引擎的架构类型,分为离线和在线部分,其中离线部分是对数据进行索引,这里的索引和传统的搜索引擎的倒排索引不同,这里的索引是对数据的向量化,如图(来自LangChain官网)

image.png

从图中我们可以清晰的看到,在离线索引阶段,总共有4个主要的步骤:

  1. 加载内容,非结构化数据通常需要提取内容,比如从word文档、pdf文档中提取文本内容;
  2. 内容分块,将提取的内容进一步切分为小块(chunk),这样在匹配问题时可以将上下文缩减到很小;
  3. 对于每个分块的内容获取其向量(embedding),这个获取向量的过程可以借助大模型本身的能力来实现,例如,gpt就提供了embedding的接口;
  4. 存储向量,将获取的向量通过向量数据库存储起来,方便查询。

这里最终存储的结果就是论文中提出的基于向量的非参数化的记忆。 接下来我们再来看在线(检索和生成)的部分,如图(来自LangChain官网)

image.png

在Question到大模型这条链路中,增加了Retrieve这个步骤。用户的问题被embedding后,会在向量库中匹配出最佳的内容,并和用户的问题一起,构成Prompt交给大模型,大模型根据这个Prompt再生成对应的答案返回给用户。除了第二节中提到的RAG带来的好处,这里还有一个工程层面的优势,通过Retrieve找到与问题最相关的知识,从而减少了上下文,压缩了Prompt的token数量。

上面两部分构成了RAG的基本架构,下面我们将使用LangChain来完整的实现一个RAG原型。

3.2 基于LangChain的RAG实现

为了方便我们对比效果,我们首先先实现一个直接将问题抛给大模型的流程,代码如下:

ini
复制代码
from langchain_community.llms import LlamaCpp
# 加载本地模型文件地址,使用mixtral-8*7B的大模型
model_home = "~/models/mixtral-8x7b-instruct-v0.1.Q8_0.gguf"
# 使用llm_model作为加载框架
llm_model = LlamaCpp(model_path=model_home)
prompt = "孙悟空几打白骨精?"
print(llm_model.invoke(prompt))

这里,我使用的是本地的大模型mixtral-8X7B-instruct 8位量化的版本,通过LlamaCpp框架进行加载。模型输出的答案为

erlang
复制代码
孙悟空与白骨精的第一次较量是在《西游记》第六回中发生的,这是在孙悟空带着猪八戒、沙和尚前来拜访时,白骨精就偷偷地上前来欺诈孙悟空和他的同伴们。当时,白骨精就利用孙悟空和他的同伴们对于自己还不知道的身份感到的好奇心进行了诱饵计 stratagem.

当时,孙悟空和他的同伴们都没有想到白骨精会是一个女妖的存在,所以他们都被白骨精诱饵计 seduction stratagem给骗了过来,而在此期间,孙悟空和他的同伴们都没有意识到到底是谁在利用他们的

可以看到,模型给出的答案,并不尽如人意。首先,“三打白骨精”这个故事并不是在原文第六回发生的,其次,给的答案并没有准确的回复“几打”这个问题。 即便是ChatGPT 3.5 也无法回答这样的问题。

image.png

我们尝试用RAG来解决这个问题。基于RAG的流程和架构,我们除了依赖大模型,还需要依赖一个用于向量存储和查询的引擎,为了方便,直接follow官方的样例,使用Chroma。

对于非参数化记忆,我先后选择了目录、《三打白骨精》这章内容和《三打白骨精》概要。

下面的代码实现了RAG的离线过程:

ini
复制代码
from langchain_community.document_loaders import DirectoryLoader
from langchain_community.embeddings import LlamaCppEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import Chroma

# 使用DirectoryLoader 加载文件,作为外部知识
loader = DirectoryLoader('/Users/trent/dev/data/rag', glob="**/*.txt")
docs = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=256, chunk_overlap=200)
splits = text_splitter.split_documents(docs)
embeddings = LlamaCppEmbeddings(model_path=model_home)
vectorstore = Chroma.from_documents(documents=splits, embedding=embeddings)

下面的代码实现了RAG的在线过程:

python
复制代码
import os
from langchain import hub
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

# 可以在LangSimth生成一个API key用于整个RAG链路的追踪
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_API_KEY"] = "langSimth_api_key"

# 将向量存储作为retriever
retriever = vectorstore.as_retriever()
# 从[LangSmith Hub](https://smith.langchain.com/hub)拉取promt的模版
prompt = hub.pull("rlm/rag-prompt")

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm_model
    | StrOutputParser()
)

我们以RAG的形式再次进行提问:

arduino
复制代码
rag_chain.invoke("孙悟空几打白骨精?")

非参数化记忆的不同,得到的答案也不尽相同,对于这个问题,概要作为非参数化记忆,得到的答案最为准确。 下面是LangSmith中对利用三个外部文件进行试验的结果。

截屏2024-04-05 22.37.54.png

这里要推荐一下LangSmith这个可观测性组件,可以清晰的追踪到RAG的流程,以下图为例,既可以看到一次Q&A的全过程,又可以观测到Retriever的输入输出。

截屏2024-04-05 22.42.14.png

以上就是用LangChain实现的一个简单RAG流程。

Retriever这个组件的引入可以有效的增强LLM的能力,但也会带来新的挑战:

  1. 外部的知识如何选择,不同的外部知识会带来不一样的效果表现,这就要具体问题具体分析了;
  2. 外部的知识如何进行处理,chunk如何切分,chunk size如何设置等等;
  3. 提问的模板如何设置,好的提问模板可以充分利用LLM的能力,从工程上来讲,Context的长度也需要尽可能的精简。

这些问题,需要在具体的场景中进行具体的分析,同时也需要有合适的机制通过不断的反馈来积累最佳实践。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1588125.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

钉钉与金蝶云星空对接集成获取流程实例(宜搭)打通收款退款新增

钉钉与金蝶云星空对接集成获取流程实例(宜搭)打通收款退款新增 接入系统:钉钉 钉钉(DingTalk)是阿里巴巴集团专为中国企业打造的免费沟通和协同的多端平台,提供PC版,Web版和手机版,有…

GD32F470_微波多普勒无线雷达探测器探头传感器模块10.525GHz HB100带底板

2.20 微波多普勒无线雷达传感器 微波运动传感器是利用多普勒雷达原理设计的微波移动物体探测器。不同于一般的红外探测器,微波传感器通过通过检测物体反射的微波来探测物体的运动状况,检测对象将并不会局限于人体,还有很多其他的事物。微波传…

DB schema表中使用全局变量及在DB组件中查询

DB schema表中使用全局变量及在DB组件中查询 规则如下: 使用如下: 如果在unicloud-db组件上不加判断条件,就会报错,并进入到登录页。 那么就会进入到登录页,加上了判断条件,有数据了就不会了。 因为在sc…

java列表排序练习题

1、(模式识别方面:四个连续相等的数)编写下面的方法,测试某个数组是否有四个连续的值相同的数字。 public static boolean isConsecutiveFour(int[] values)编写测试程序,提示用户输入一个整数列表,如果这个列表中有四个连续的具有相同值的数…

Linux的环境搭建

目录 第一步:购买腾讯云轻量级云服务器 Step1:打开腾讯云 ​编辑 Step2:登录腾讯云并完成认证 Step3:选择服务器类型 Step4:选择服务器配置 第二部:下载XShell Step1:打开XShell Step2…

用于扩展Qt自身的插件(下)

扩展Qt自身的插件 引言必须满足项创建插件示例代码生成插件配置加载插件的环境创建使用插件的项目配置库和头文件依赖的步骤:应用程序代码运行结果总结引言 本文继上篇的扩展Qt自身的插件,接着记录Qt自身的插件,只不过本文提及的用于扩展Qt自身的插件是可以在QtCreator的设…

在 Leetcode 上使用 Javascript 查找数组中的所有重复项(使用 JS 的 DSA)

在本篇博客文章中,我们将探讨如何在数组中找出所有重复的元素,这个问题源自LeetCode上的一个问题。 问题描述: 我们有一个包含n个整数的数组,所有整数都在范围[1, n]内。每个整数要么出现一次,要么出现两次。任务是找…

如何借助AI高效完成写作提纲

AI变革力量:未来数据中心的智能化之旅! 在当今这个信息爆炸的时代,人工智能(AI)在众多领域展现出了它的能力,特别是在写作领域。AI写作工具不仅能够帮助我们高效地生成内容,还能在一定程度上提升…

在vue和 js 、ts 数据中使用 vue-i18n,切换语言环境时,标签文本实时变化

我的项目需要显示两种语言(中文和英文),并且我想要切换语言时,页面语言环境会随之改变,但是目前发现,只能在vue中使用$t(‘’)的方式使用,但是这种方式只能在vue中使用,但是我的菜单文件是定义在js中&#…

JAVAEE之事务和事务传播机制

1.事务 1.1 事务的概念 事务是⼀组操作的集合, 是⼀个不可分割的操作. 事务会把所有的操作作为⼀个整体, ⼀起向数据库提交或者是撤销操作请求. 所以这组操作要么同时成功, 要么同时失败. 1.2 需要事务的原因 转账的时候,要么同时成功,要么同时失败…

关闭笔记本自带的键盘

目录 一、问题 二、方法 【方法一】 【方法二】 一、问题 笔记本自带的键盘上的个别按键又坏了,可能是因为使用电脑时,最先坏的几个按键那里温度比较高,久而久之就烧坏了吧。距离上次更换新键盘才差不多一年,所以不打算再买新…

2024年思维100春季线上比赛倒计时8天,来做做官方样题

今天是2024年4月12日,距离2024年春季思维100活动第一阶段的线上比赛4月20日还有8天。今年思维100活动的考试重点是什么呢?虽然主办方未公布,我们可以从主办方发布的参考题目中来推测今年的考试重点,并且按照这个来举一反三&#x…

任推邦七款热门拉新项目,普通人逆袭路径,月入6个W!

任推邦 不扣量的项目拉新平台 1UC网盘 —网推 价格上涨行业置顶 ,大厂项目 市场空白,预算充足,不限量 适合自媒体/抖快等渠道 上传下载不限速 2迅雷网盘—网推 官方核心服务商,大厂项目 群组内测(新增转播收…

TiDB 数据库调度(PD)揭秘

目录 一、PD 简介 1.1 元数据管理 1.2 调度决策 1.3 全局服务 1.4 集群配置与管理 二、TiKV 管理 2.1 调度需求 2.2 信息收集 三、TiDB server 管理 四、PD 集群主节点选取 一、PD 简介 TiDB PD (Placement Driver) 是 TiDB 分布式数据库系统中的核心组件之一,负…

应用实战|从头开始开发记账本2:基于模板快速开始

上期视频我们创建好了BaaS服务的后端应用。从这期视频开始,我们将从头开发一个互联网记账本应用。本期视频我们介绍一下如何使用模板快速开启我们的应用开发之旅。 应用实战|从头开始开发记账本2:基于模板快速开始 相关代码 本期视频我们介绍…

LigaAI x 极狐GitLab,共探 AI 时代研发提效新范式

近日,LigaAI 和极狐GitLab 宣布合作,双方将一起探索 AI 时代的研发效能新范式,提供 AI 赋能的一站式研发效能解决方案,让 AI 成为中国程序员和企业发展的新质生产力。 软件研发是一个涉及人员多、流程多、系统多的复杂工程&#…

三小时使用鸿蒙OS模仿羊了个羊,附源码

学习鸿蒙arkTS语言,决定直接通过实践的方式上手,而不是一点点进行观看视频再来实现。 结合羊了个羊的开发思路,准备好相应的卡片素材后进行开发。遇到了需要arkTS进行解决的问题,再去查看相应的文档。 首先需要准备卡片对应的图片…

ccf201509-3模板生成系统(list,map,字符串综合运用)

问题描述 成成最近在搭建一个网站,其中一些页面的部分内容来自数据库中不同的数据记录,但是页面的基本结构是相同的。例如,对于展示用户信息的页面,当用户为 Tom 时,网页的源代码是: 而当用户为 Jerry 时…

【Spring Boot 源码学习】SpringApplication 的 run 方法核心流程介绍

《Spring Boot 源码学习系列》 SpringApplication 的 run 方法核心流程介绍 一、引言二、往期内容三、主要内容3.1 run 方法源码初识3.2 引导上下文 BootstrapContext3.3 系统属性【java.awt.headless】3.4 早期启动阶段3.5 准备和配置应用环境3.6 打印 Banner 信息3.7 新建应用…

一起学习python——基础篇(16)

今天继续说说python的网络请求方法——get方法和post方法。上一章已经简单说了一下get方法,现在说一下post方法如何进行网络请求。 假如服务端开发人员给你一个接口文档内容如下: Request(请求参数): 1、接口url为http://127.0.0.1:5005/a…