《Advanced RAG》-01-朴素RAG存在的问题

news2026/2/12 10:03:18

摘要

文章阐述了RAG技术如何通过整合外部知识源来提升大型语言模型（LLM）的性能，使其能够产生更精确、上下文感知的回应，并减少幻觉现象。

自2023年以来，RAG已成为基于LLM的系统中最流行的架构，许多产品依赖此技术。然而，RAG在信息检索、上下文整合等方面存在问题，如信息提取不完整、分块策略不合适、索引结构不足优化、检索过程中的准确性和召回率不高、生成过程中的信息冗余和输出不一致等。

文章通过对比图表，展示了RAG的工作流程和存在的问题，并强调了优化RAG性能的重要性。最后，文章提到接下来的文章将提供解决这些问题的措施，以提高RAG的有效性。

作者观点

RAG技术能够提升LLM的性能，生成更准确和上下文相关的回答。
RAG面临的问题包括信息提取的不完整性、分块策略的一刀切、索引结构的低效、检索过程的低相关性和准确性、生成过程中的过度依赖增强信息等。
优化RAG的关键在于改进每个步骤，包括编制索引、检索和生成，以提高整体性能。
文章认为，通过采取措施改进RAG的缺陷，不仅能提升系统的生成效果，还能为未来的研究和应用提供新的方向。

检索增强生成（RAG）是通过整合外部知识源的附加信息来改进大型语言模型（LLM）的过程。这样，大型语言模型就能做出更精确、更能感知上下文的反应，同时还能减少幻觉。

自 2023 年以来，RAG 已成为基于 LLM 的系统中最流行的架构。许多产品的功能都严重依赖 RAG。因此，优化 RAG 的性能，使检索过程更快、结果更准确已成为一个至关重要的问题。

朴素RAG概览

图 1 展示了天真 RAG 的典型工作流程。

图 1：天真 RAG 的典型工作流程。图片由作者提供。

如图 1 所示，RAG 主要包括以下步骤：

索引：索引化过程是一项关键的离线初始步骤。
- 从原始数据的清理和提取开始，将各种文件格式（如PDF、HTML和Word）转换为标准化的纯文本。
- 为了适应语言模型的上下文约束，这些文本被分割成更小更易管理的块，即所谓的分块过程。这些块然后使用Embedding模型转换为向量表示。
- 最后，创建索引将这些文本块及其向量嵌入作为键值对存储，从而实现高效可扩展的搜索能力。
检索：从外部知识源检索相关上下文。
- 为实现这一目标，用户查询由Embedding模型处理，生成语义相关的嵌入。
- 然后，在向量数据库上进行相似性搜索，以检索出TopK个最接近的数据对象。
生成：用户查询和检索到的上下文数据填充到提示模板中。最后，从检索步骤得到的增强提示输入到LLM中图。