RAG的学习与实践——LangChain和LlamaIndex学习笔记

news2024/11/14 20:36:37

RAG

RAG(Retrieval Augmented Generation)系统,代表“检索增强生成”。RAG由五个关键步骤组成:

  • 加载:这是指将数据从其所在位置(无论是文本文件、PDF、其他网站、数据库还是 API)获取到您的管道中。LlamaHub提供数百种连接器可供选择。
  • 索引:这意味着创建一个允许查询数据的数据结构。对于大模型来说,这几乎总是意味着创建vector embeddings数据含义的数字表示,以及许多其他元数据策略,以便轻松准确地找到上下文相关的数据。
  • 存储:一旦数据被索引,您几乎总是希望存储索引以及其他元数据,以避免重新索引。
  • 查询:对于任何给定的索引策略,您可以通过多种方式利用 LLM 和 LlamaIndex 数据结构进行查询,包括子查询、多步查询和混合策略。
  • 评估:任何管道中的关键步骤是检查它相对于其他策略的有效性,或者何时进行更改。评估提供客观衡量您对查询的答复的准确性、忠实度和速度。
    在这里插入图片描述

学习文章:大模型RAG框架llama-index技术调研

(1)向量数据库

向量数据库是一种以向量或数据点的数学表示形式存储数据的数据库。 人工智能和机器学习使非结构化数据能够转换为捕获意义和上下文的数字表示(向量)。

常见的向量数据库:

  • Chroma:开源嵌入数据库。功能丰富:查询、过滤、密度估计和许多其他功能。LangChain和LlamaIndex都支持。
  • Pinecone:可托管向量数据库的平台。支持全托管服务、高度可伸缩、实时数据摄取、低延迟的搜索并且和LangChain集成。
  • Weaviate:开源向量数据库。可以无缝扩展到数十亿个数据对象。速度快(Weaviate可以在几毫秒内从数百万个对象中快速搜索出最近的10个邻居)、更灵活(使用Weaviate,可以在导入或上传自己的数据时对数据进行矢量化,可以利用与OpenAI, Cohere, HuggingFace等平台集成的模块)和搜索扩展(除了快速矢量搜索,Weaviate还提供推荐、摘要和神经搜索框架集成)。
  • Faiss:用于快速搜索相似性和密集向量的聚类的开源库。它包含能够在不同大小的向量集中搜索的算法,甚至可以处理那些超过内存容量的向量集。
  • Qdrant:可以作为API服务运行,支持搜索最接近的高维向量。使用Qdrant,可以将嵌入或神经网络编码器转换为应用程序,用于匹配,搜索,推荐等任务。

参考文章:LLM 学习之「向量数据库」

(2)LangChain

LangChain 是一个基于大型语言模型(LLM)开发应用程序的框架。

参考文章:langchain 组件详解、Langchain、langchain-知识库问答

* 核心模块

核心模块主要有六个:模型输入输出(Model I/O)、数据连接(Data Connection)、链(Chains)、记忆(Memory)、代理(Agents)和回调(Callbacks)。
在这里插入图片描述

1 Model I/O

管理大语言模型(Models),及其输入(Prompts)和格式化输出(Output Parsers)。

在这里插入图片描述

主要包含组件:PromptsLanguage ModelsOutput Parsers。用户原始输入与模型和示例进行组合,然后输入给大语言模型,再根据大语言模型的返回结果进行输出或者结构化处理。

学习文章:02|LangChain | 从入门到实战 -六大组件之Models IO

结构化格式输出:(16-2)输出解析器(Output Parsers)(2)

2 Data connection

管理主要用于建设私域知识(库)的向量数据存储(Vector Stores)、内容数据获取(Document Loaders)和转化(Transformers),以及向量数据查询(Retrievers)

在这里插入图片描述
主要包含组件:Document loadersDocument transformersText embedding modelsVector storesRetrievers

学习文章:03|LangChain | 从入门到实战 -六大组件之Retrival

文本切割器:LangChain教程 | langchain 文本拆分器 | Text Splitters全集、RAG 分块Chunk技术优劣、技巧、方法汇总(五)

上下文压缩器:实现RAG管道中的上下文压缩和过滤

3 Chains

用于串联 Memory ↔️ Model I/O ↔️ Data Connection,以实现 串行化 的连续对话、推测流程
在这里插入图片描述
学习文章:04|LangChain | 从入门到实战 -六大组件之chain

4 Memory

用于存储和获取对话历史记录的功能模块
在这里插入图片描述
主要包括两个操作:。把Memory集成到系统中涉及两个核心问题:存储的历史信息是什么、如何检索历史信息。

学习文章:05|LangChain | 从入门到实战 -六大组件之Memory、LangChain之内存记忆 ( Memory )

5 Agents

Agent的核心思想是使用大型语言模型(LLM)来选择要采取的行动序列。在Chain中行动序列是硬编码的,而Agent则采用语言模型作为推理引擎来确定以什么样的顺序采取什么样的行动。
在这里插入图片描述
Agent相比Chain最典型的特点是“自治”,它可以通过借助LLM专长的推理能力,自动化地决策获取什么样的知识,采取什么样的行动,直到完成用户设定的最终目标。因此,作为一个智能体,需要具备以下核心能力:

  • 规划:借助于LLM强大的推理能力,实现任务目标的规划拆解和自我反思。
  • 记忆:具备短期记忆(上下文)和长期记忆(向量存储),以及快速的知识检索能力。
  • 行动:根据拆解的任务需求正确地调用工具以达到任务的目的。
  • 协作:通过与其他智能体交互合作,完成更复杂的任务目标。

学习文章:从API到Agent:万字长文洞悉LangChain工程化设计、06|LangChain | 从入门到实战 -六大组件之Agent

6 Callbacks

Callbacks模块是框架中的一个核心组件,它允许用户定义特定的回调函数来响应某些事件或执行特定动作。这种机制极大地增强了Langchain的灵活性和功能性,使得在不修改现有代码的基础上,可以扩展或定制AI模型的行为。提供了一个回调系统,可连接到 LLM 申请的各个阶段,便于进行日志记录、追踪等数据导流。

主要有两种回调机制:

  • 构造器回调将用于在该对象上进行的所有调用,并且将仅作用于该对象,即如果将处理程序传递给LLMChain的构造函数,则不会被附加到该链上的模型使用。
  • 请求回调仅用于该特定请求,以及该请求包含的所有子请求(例如,对LLMChain的调用触发对模型的调用,使用的是通过传递的相同处理程序),这些回调是显式传递的。

学习文章:大模型从入门到应用——LangChain:回调函数(Callbacks)

(3)LlamaIndex

LlamaIndex是一个连接大型语言模型(LLMs)与外部数据的工具,它通过构建索引和提供查询接口,使得大模型能够学习和利用私有或者特定领域的数据。这一工具的出现,极大地拓展了大型语言模型的应用范围和深度,下面我们就来详细介绍LlamaIndex的基本概念、优劣势、代码示例以及使用场景。

参考文章:LlamaIndex 入门实战、LlamaIndex 一 简单文档查询、LlamaIndex 文档1

* 核心模块

在这里插入图片描述
LlamaIndex为我们提供了五大功能模块:

  • 数据连接器(Data connectors):从其原生源和格式中获取现有数据。这些数据可以是 API、PDF、
    SQL 等。
  • 数据索引(Data Indexes):将数据结构化为中间表示,使其易于 LLM 使用且性能良好。
  • 引擎(Engines):为数据提供便捷访问。例如:
    • 查询引擎:用于问答的接口(例如 RAG pipeline)。
    • 聊天引擎:用于与数据进行多消息“来回”互动的对话接口。
  • 数据代理(Data Agents):由 LLM 驱动,通过工具增强,从简单的助手函数到 API 集成等。
  • 应用集成(Application Integrations):此模块可以方便的将LlamaIndex与AI应用框架结合。

在这里插入图片描述

1 Data connectors

数据连接器(也称为reader)是LlamaIndex中的重要组件,它有助于从各种来源和格式摄取数据,并将其转换为由文本和基本元数据组成的简化文档表示形式。

  • 首先,使用文件加载器将不同类型的文件加载成Document对象形式。使用SimpleDirectoryReader是一种基础的文件加载方式。
    from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
    
    # 使用SimpleDirectoryReader从指定路径加载数据
    documents = SimpleDirectoryReader("D:\GitHub\LEARN_LLM\LlamaIndex\data").load_data()
    
    可以在LlamaHub中找到需要的文件类型的加载器:LlamaHub。
    也可以选择将文字转换成Document结构。例如
    from llama_index.core import Document
    doc = Document(text="text")
    
  • 然后,将文档内容进行转换。这些转换包括分块、提取元数据和对每个块进行向量化,从而确保大模型能够检索数据。最简单的方式是用from_documents方法。
    from llama_index.core import VectorStoreIndex
    
    vector_index = VectorStoreIndex.from_documents(documents)
    vector_index.as_query_engine()
    
    此外,我们可以选择更改embeding模型。
    先使用pip install llama-index-embeddings-huggingface 安装相应的库,然后用下述代码更改嵌入模型。在这里插入图片描述
    节点是更细粒度的数据实体,表示源文档的“块”,可以是文本块、图像或其他类型的数据。它们还携带元数据和与其他节点的关系信息,这有助于构建更加结构化和关系型的索引。在LlamaIndex中,一旦数据被摄取并表示为文档,就可以选择将这些文档进一步处理为节点。下面是如何使用SimpleNodeParser将文档解析为节点:
    from llama_index.node_parser import SimpleNodeParser 
    
    # Assuming documents have already been loaded 
    
    # Initialize the parser 
    parser = SimpleNodeParser.from_defaults(chunk_size=1024, chunk_overlap=20) 
    
    # Parse documents into nodes 
    nodes = parser.get_nodes_from_documents(documents)
    

学习文档:【AI大模型应用开发】【LlamaIndex教程】1. 数据连接模块教程(附代码)、Embeddings、LlamaIndex 组件 - Loading

2 Data Indexes

LlamaIndex的核心本质在于它能够在被摄取的数据上构建结构化索引,这些数据表示为文档或节点。它的核心其实就是索引结构的集合,用户可以使用索引结构或基于这些索引结构自行建图。
在这里插入图片描述

下面是最简单的构建索引方式

 from llama_index.core importVectorStoreIndex
 
 # Assuming docs is your list of Document objects
 index = VectorStoreIndex.from_documents(docs)

学习文档:【LlamaIndex 教程】一文看懂LlamaIndex用法,为LLMs学习私有知识、LlamaIndex使用指南、LlamaIndex 组件 - Storing

3 Engines

LlamaIndex 提供了定义 LLM 模块的统一接口,无论是来自 OpenAI、Hugging Face 还是 LangChain,这样您就不必自己编写定义 LLM 接口的样板代码。该接口由以下部分组成(更多详细信息如下):

  • 支持文本完成和聊天端点
  • 支持流式和非流式端点
  • 支持同步和异步端点

基座LLM模型
LlamaIndex支持OpenAIHuggingFace上的模型。使用Huggingface上的模型需要结合Settings库来自定义模型。

from llama_index.core import PromptTemplate

# Transform a string into input zephyr-specific input
def completion_to_prompt(completion):
    return f"<|system|>\n</s>\n<|user|>\n{completion}</s>\n<|assistant|>\n"

# Transform a list of chat messages into zephyr-specific input
def messages_to_prompt(messages):
    prompt = ""
    for message in messages:
        if message.role == "system":
            prompt += f"<|system|>\n{message.content}</s>\n"
        elif message.role == "user":
            prompt += f"<|user|>\n{message.content}</s>\n"
        elif message.role == "assistant":
            prompt += f"<|assistant|>\n{message.content}</s>\n"

    # ensure we start with a system prompt, insert blank if needed
    if not prompt.startswith("<|system|>\n"):
        prompt = "<|system|>\n</s>\n" + prompt

    # add final assistant prompt
    prompt = prompt + "<|assistant|>\n"

    return prompt

import torch
from llama_index.llms.huggingface import HuggingFaceLLM
from llama_index.core import Settings

Settings.llm = HuggingFaceLLM(
    model_name="HuggingFaceH4/zephyr-7b-beta",
    tokenizer_name="HuggingFaceH4/zephyr-7b-beta",
    context_window=3900,
    max_new_tokens=256,
    generate_kwargs={"temperature": 0.7, "top_k": 50, "top_p": 0.95},
    messages_to_prompt=messages_to_prompt,
    completion_to_prompt=completion_to_prompt,
    device_map="auto",
)

嵌入Embedding模型
LlamaIndex也支持使用本地的自定义嵌入模型

from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core import Settings

Settings.embed_model = HuggingFaceEmbedding(
    model_name="BAAI/bge-small-en-v1.5"
)

Prompts
LlamaIndex 使用提示来构建索引、执行插入、在查询期间执行遍历并合成最终答案。LlamaIndex 使用一组开箱即用的默认提示模板。

from llama_index.core import PromptTemplate

template = (
    "We have provided context information below. \n"
    "---------------------\n"
    "{context_str}"
    "\n---------------------\n"
    "Given this information, please answer the question: {query_str}\n"
)
qa_template = PromptTemplate(template)

# you can create text prompt (for completion API)
prompt = qa_template.format(context_str=..., query_str=...)

# or easily convert to message prompts (for chat API)
messages = qa_template.format_messages(context_str=..., query_str=...)

查询引擎
检索器负责根据用户查询(或聊天消息)获取最相关的上下文。它可以构建在索引之上,但也可以独立定义。它用作查询引擎(和聊天引擎)中的关键构建块,用于检索相关上下文。

retriever = index.as_retriever()
nodes = retriever.retrieve("Who is Paul Graham?")

在这里插入图片描述

学习文章:LlamaIndex 组件 - Models、LlamaIndex 组件 - Querying

4 Data Agents

5 Application Integrations

(4)LangChain和LlamaIndex区别

LangChain:一个使用LLM开发应用程序的通用框架。LangChain是一个基于大语言模型(LLM)的框架,它并不开发LLM,而是为各种LLM实现通用的接口,将相关的组件“链”在一起,简化LLM应用的开发。它支持模型集成、提示工程、索引、记忆、链、代理等多种组件功能。

1)核心架构:LangChain 的核心是其链式架构,它允许开发者将不同的组件(如模型、提示、索引、记忆等)组合成一个处理流程。这种设计旨在灵活地处理各种复杂任务。

2)集成与交互:强调大模型与外部工具和数据库的集成。这种方法允许开发者利用各种资源来完成任务,而不仅限于模型本身的能力。

3)抽象层:提供了一个抽象层,允许不同的模型和工具通过标准化的接口进行交互,增加了模块间的互操作性。

4)组件与支持功能:

  • 支持多种模型接口,如OpenAI、Hugging Face等。
  • 支持提示工程,将提示作为输入传递给模型。
  • 提供基于向量数据库的索引功能,如文档检索。
  • 基于记忆组件提供上下文功能,存储对话过程中的数据。
  • 支持链式调用,将多个组件链接在一起逐个执行。
  • 支持代理Agent功能,用于根据用户输入决定模型采取的行动。

5)适用情景:更适合需要复杂对话流程、上下文管理、以及多步骤任务的应用场景,如聊天机器人、任务自动化等。 由于其提供了较为全面的组件支持,LangChain可以简化开发流程,让开发者更加关注于业务逻辑和模型效果的优化。但是,这也意味着它的学习曲线可能较陡,需要开发者对各种组件有深入的理解。


LlamaIndex:一个专门用于构建RAG系统的框架。LlamaIndex是一个基于向量搜索的索引框架,主要用于提升大型语言模型在长文本或大量数据上的查询效率。它侧重于处理数据的索引和检索,使得模型能够快速定位到最相关的信息。

1)核心架构:Llama-Index 专注于索引和检索,主要通过向量搜索来提高大型语言模型在处理大量数据时的效率。

2)数据结构与优化:更侧重于数据索引的结构和优化。这使得它在处理和访问大型数据集方面表现出色。

3)信息索引:设计允许开发者构建和维护一个可扩展的信息索引,以便快速响应查询,特别适用于需要快速访问和分析大量数据的应用。

4)组件与支持功能:

  • 专注于索引和检索功能,与向量数据库紧密结合。
  • 支持自定义的索引结构和查询逻辑,适用于复杂的数据检索需求。
  • 通常与大型语言模型结合使用,但更侧重于索引侧的性能优化。
  • 提供了优化的数据结构和算法,以提升在大量数据上的查询速度。

5)适用场景:当应用场景主要涉及大量数据的快速检索和查询时,LlamaIndex更加适用,如知识问答系统、文档搜索引擎等。 专注于索引和检索,LlamaIndex相对容易上手,特别是对于需要快速构建高效查询系统的开发者来说,可以快速实现原型并优化性能。


参考文章:深度比较大模型开发工具链-LangChain和Llama-Index

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1910548.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

自定义@AnonymousAccess注解

一.目的&#xff1a; 自定义AnonymousAccess注解&#xff0c;可以直接在controller上添加该注解使请求绕过权限验证进行匿名访问&#xff0c;便于快速调用调试以及部分不需要进行安全验证的接口。而不是每次都需要去SecurityConfig文件中进行修改。 二.流程&#xff1a; 三.实…

软件项目运维服务方案(Word原件)

1.项目情况 2.服务简述 2.1服务内容 2.2服务方式 2.3服务要求 2.4服务流程 2.5工作流程 2.6业务关系 2.7培训 3.资源提供 3.1项目组成员 3.2服务保障 软件文档全套下载&#xff1a;本文末个人名片直接获取或者进主页。

【峟思】智能一体化水位监测系统的创新应用与优势解析

在全球气候变化与城市化加速的双重挑战下&#xff0c;极端天气事件频发&#xff0c;城市内涝、河流泛滥等水位灾害对社会安全和经济稳定构成了严峻威胁。为有效应对这些挑战&#xff0c;智能一体化水位监测系统应运而生&#xff0c;凭借其高效、精准、智能的技术特性&#xff0…

PostgreSQL 里怎样解决多租户数据隔离的性能问题?

文章目录 一、多租户数据隔离的性能问题分析&#xff08;一&#xff09;大规模数据存储和查询&#xff08;二&#xff09;并发访问和锁争用&#xff08;三&#xff09;索引维护成本高&#xff08;四&#xff09;资源分配不均 二、解决方案&#xff08;一&#xff09;数据分区&a…

行至第11年,追光动画距离“中国皮克斯”还有多远?

百花奖提名名单公布后&#xff0c;入围最佳影片大奖的唯一一部动画电影《长安三万里》&#xff0c;竟然成为了获奖呼声最高的电影。 去年暑期档上映的《长安三万里》以18.24亿票房一跃成为中国影史动画电影票房亚军&#xff0c;虽然这个数据在今年春节档被《熊出没逆转时空》超…

【苍穹外卖】Day2 手把手敲完细节

目录 1. 新增员工 1.1 需求分析和设计 1.2 代码开发 ①定义DTO类&#xff1a;(在sky-pojo里&#xff09; ②EmployeeController中创建新增员工方法save() ③EmployeeService里声明save方法&#xff08;altenter&#xff09; ④EmployeeServiceImpl中实现save方法 ⑤在E…

喜讯丨美格智能通过国际EcoVadis平台认证企业社会责任并荣获承诺奖章,彰显可持续发展实力

作为全球领先的无线通信模组及解决方案提供商&#xff0c;美格智能在社会责任领域再创新高。近日&#xff0c;美格智能凭借在企业社会责任和可持续性采购发展方面的卓越表现&#xff0c;通过国际在线权威评价机构EcoVadis对公司环境、劳工与人权、商业道德、可持续采购等方面审…

线性回归笔记

https://blog.51cto.com/u_16213589/7682076 残差图 多元回归-最小二乘法-残差分析笔记 一.多元线性回归模型的假设 我们需要进行以下六个假设&#xff0c;这些假设是经典的多元线性回归模型有效的前提&#xff1a; 1、因变量Y和自变量X1&#xff0c;X2&#xff0c;…&#…

文献阅读:基于测序的空间转录组方法的系统比较

文献介绍 文献题目&#xff1a; Systematic comparison of sequencing-based spatial transcriptomic methods 研究团队&#xff1a; 田鲁亦&#xff08;广州实验室&#xff09;、刘晓东&#xff08;西湖大学&#xff09; 发表时间&#xff1a; 2024-07-04 发表期刊&#xff…

Python自动化测试系列[v1.0.0][自动化测试报告]

BeautifulReport测试报告 获取BeautifulReport模块 BeautifulReport 源码Clone地址为 BeautifulReport &#xff0c;其中BeautifulReport.py和其template是我们需要的 BeautifulReport 如下代码是BeautifulReport.py的源码&#xff0c;其中几个注释的地方需要注意&#xff…

C编程使用clock函数实现计算一段代码的执行时间:毫秒单位

一、函数原型 在Linux系统中&#xff0c;clock()函数是一个非常重要且常用的函数&#xff0c;它主要用于测量程序运行的CPU时间。这个函数是C/C语言中的一个标准函数&#xff0c;其原型定义在<time.h>头文件中。以下是对clock()函数的详细解析&#xff1a; #include <…

Khoj 一个处在免费领域应用最佳的AI对话工具

文章目录 1. 了解 khoj1.1 文档1.2 价格1.3 代理人 2. 特点3. 应用3.1 全文搜索3.1.1 ChatGPT没有3.1.2 Khoj 3.2 APP 对话3.2.1 khoj & whatsApp3.2.2 ChatGPT 3.3 摘要总结3.3.1 ChatGPT3.3.2 Khoj 3.4 图片分析3.4.1 chatgpt3.4.2 khoj 3.5 格式转换3.5.1 ChatGPT3.5.2 …

基于STM主题模型的主题提取分析-完整代码数据

直接看结果: 代码: import re from collections import defaultdict import random import matplotlib.pyplot as plt import numpy as npimport pandas as pd import numpy as np import re from sklearn.feature_extraction.text import CountVectorizer from nltk.corpus…

c++ 多边形 xyz 数据 获取 中心点方法

有需求需要对。多边形 获取中心点方法&#xff0c;绝大多数都是 puthon和java版本。立体几何学中的知识。 封装函数 point ##########::getCenterOfGravity(std::vector<point> polygon) {if (polygon.size() < 2)return point();auto Area [](point p0, point p1, p…

聚类分析方法(二)

目录 三、层次聚类方法&#xff08;一&#xff09;层次聚类策略&#xff08;二&#xff09;AGNES算法&#xff08;三&#xff09;DIANA算法 四、密度聚类方法&#xff08;一&#xff09;基本概念&#xff08;二&#xff09;算法描述&#xff08;三&#xff09;计算实例&#xf…

flowable7.0.1常见问题解答

说明&#xff1a;本文采用Q-A的形式&#xff0c;持续更新... Q&#xff1a;flowable中任务审批时在taskCompleted监听中获取当前审批提交的表单内容&#xff1f; A&#xff1a;taskService.setLocalVirables(Map<String,Object> variables)&#xff1b;也可以通过添加缓…

MVC 可以把通用命名空间放在配置文件

这种方式的引入,是将命名空间引入到所有视图中了,不需要在使用using单独引用了。

【大数据】什么是数据湖?一文揭示数据湖的本质

很多人跟我一样&#xff0c;对于数据湖充满好奇&#xff0c;也许还读了不少数据湖文章&#xff0c;但无论别人怎么说&#xff0c;你还是会觉得难以把握数据湖的本质。 有些人会望文生义说&#xff0c;数据湖嘛&#xff0c;就是什么东西都可以往里面扔&#xff0c;特别是对非结构…

奇瑞新能源车型EQ2在驾校领域的CAN总线数据应用

在当今这个快速发展的汽车时代&#xff0c;科技的进步不仅推动了汽车性能的提升&#xff0c;也为驾驶培训领域带来了革命性的变化。其中&#xff0c;奇瑞EQ2作为一款电动汽车&#xff0c;其在驾校领域的应用尤其值得关注&#xff0c;特别是其采用的CAN总线技术。CAN总线&#x…

【面向就业的Linux的基础】从入门到熟练,探索Linux的秘密(十三)-常用的命令

上述是一些系统命令的基本练习&#xff0c;可以当做日常笔记学习收藏一下&#xff01;&#xff01;&#xff01; 目录 前言 一、文件权限 二、文件检索 三、查看文件内容 四、用户相关 五、工具 六、安装软件 七、作业​​​​​​​ 总结 前言 上述是一些系统命令的…