RAG学习笔记系列（一）

news2026/3/17 5:14:49

RAG 介绍

RAG 全称为 Retrieval Augmented Generation（检索增强生成）。是基于LLM构建系统的一种架构。
RAG 基本上可以理解为：搜索 + LLM prompting。根据用户的查询语句，系统会先使用搜索算法获取到相关内容作为上下文，然后将用户查询语句和获取到的上下文一起注入到 prompt 中，然后将 prompt 提供给 LLM 来生成回答内容。

RAG初步实现

RAG 初步实现可以简单分解为以下步骤：

将待检索文本分割成块
使用 Transformer Encoder 模型将文本嵌入为向量（embedding），并将向量存储
构建一个 prompt，可以让模型根据搜索到的内容对用户提出的问题进行回答

使用时：

使用相同的 Transformer Encoder 模型，将用户的查询文本转换成向量
使用查询的向量从向量存储中找到 top-k 的结果
将用户提的问题和查询到的文本块一起作为上下文整合到 prompt 中

def question_answering(context, query):
    prompt = f"""
                Give the answer to the user query delimited by triple backticks ```{query}```\
                using the information given in context delimited by triple backticks ```{context}```.\
                If there is no relevant information in the provided context, try to answer yourself, 
                but tell user that you did not have any relevant context to base your answer on.
                Be concise and output the answer of size less than 80 tokens.
                """

    response = get_completion(instruction, prompt, model="gpt-3.5-turbo")
    answer = response.choices[0].message["content"]
    return answer

高级RAG

高级 RAG 架构如下图所示：
在这里插入图片描述
图中，绿色元素为 RAG 核心技术点，蓝色元素为文本。（本架构图对一些细节进行省略，不宜按照本图进行实施）
RAG 核心技术点

		 1. 分块和矢量化
		 2. 搜索索引构建
		 3. 重排序和过滤
		 4. 查询转换
		 5. 聊天引擎
		 6. 查询路由
		 7. RAG 中的 Agent
		 8. 响应合成

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1605531.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

RAG学习笔记系列（一）

RAG 介绍

RAG初步实现

高级RAG

相关文章

最大公约数和最小公倍数（C语言）

ospf综合路由实验

工作必备！快速了解多微信高效管理工具

财商的思考

视频拍摄知识+AIGC数据预处理

【工位ubuntu的配置】补充

【MATLAB源码-第28期】基于matlab的16QAM定时同步仿真，采用gardner算法，Costa锁相环。

手势估计 | 使用TensorRT实现的实时手势估计+手势分类

VN6501使用方法（学习笔记）

iOS ------ Block的总结

C语言基础知识巩固——1.基本知识

指针专题（1）

前端开发攻略---Vue项目(Vue2和Vue3)引入高德地图，超详细，超简单，保姆级教程。

2024.4.18

网络运输层之(3)GRE协议

html之标签学习（带你进来，别犹豫，是你喜欢的样子）

仿真测试平台设计资料：921-6U CPCI卫星接口仿真测试平台

Http 请求偶发400错误

档案集中管理的痛点怎么解决？

【赛题】2024年“华中杯”数模竞赛赛题发布