【大模型从入门到精通32】开源库框架LangChain RAG 系统中的问答技术2

news2026/2/11 17:26:13

这里写目录标题

- - 探索高级问答链类型
  - - MapReduce 和 Refine 技术
  - 实用建议和最佳实践
  - 解决 RetrievalQA 限制
  - 结论
  - 进一步阅读和探索
  - 理论问题
  - 实践问题

探索高级问答链类型

MapReduce 和 Refine 技术

MapReduce 和 Refine 是设计用来规避由语言模型 (LM) 上下文窗口大小所导致的限制的高级技术，允许处理大量的文档。

# 配置使用 MapReduce 技术的问答链
# 此配置使多个文档的信息能够被聚合
question_answering_chain_map_reduce = RetrievalQA.from_chain_type(
    language_model,
    retriever=vector_database.as_retriever(),
    chain_type="map_reduce"
)

# 使用用户提供的查询执行 MapReduce 技术
response_map_reduce = question_answering_chain_map_reduce({"query": query})

# 打印通过 MapReduce 技术获得的聚合答案
print("MapReduce 答案:", response_map_reduce["result"])

# 配置使用 Refine 技术的问答链
# 此方法允许基于查询逐步完善答案
question_answering_chain_refine = RetrievalQA.from_chain_type(
    language_model,
    retriever=vector_database.as_retriever(),
    chain_type="refine"
)

# 使用相同的用户提供的查询执行 Refine 技术
response_refine = question_answering_chain_refine({"query": query})

# 打印经过逐步完善的答案，展示迭代改进的过程
print("Refine 答案:", response_refine["result"])

实用建议和最佳实践

选择 MapReduce 或 Refine：决定使用 MapReduce 或 Refine 取决于任务的具体需求。MapReduce 最适合需要快速汇总来自多个来源的信息的情况；而 Refine 更适用于需要高准确度和逐步完善答案的任务。
优化性能：在实施这些技术时，特别是在分布式系统中，要注意网络延迟和数据序列化的成本。高效的数据传输和处理可以显著影响整体性能。
实验是关键：MapReduce 和 Refine 的有效性会因数据性质和问答任务的特点而异。重要的是要对这两种技术进行实验，以确定哪种最适合特定的应用场景。

解决 RetrievalQA 限制

值得注意的是，RetrievalQA 链无法保留对话历史记录，这会影响后续查询的流程。

# 从假设的库中导入问答链
from some_library import question_answering_chain as qa_chain

# 定义与课程内容相关的初始查询
initial_question_about_course_content = "课程大纲是否覆盖概率论？"
# 使用问答链生成对初始查询的响应
response_to_initial_question = qa_chain({"query": initial_question_about_course_content})

# 定义一个后续查询，没有显式保留对话上下文
follow_up_question_about_prerequisites = "为什么这些先修课程很重要？"
# 使用问答链生成对后续查询的响应
response_to_follow_up_question = qa_chain({"query": follow_up_question_about_prerequisites})

# 显示对初始和后续查询的响应
print("对初始查询的响应:", response_to_initial_question["result"])
print("对后续查询的响应:", response_to_follow_up_question["result"])

这一限制强调了将对话记忆集成到 RAG 系统中的必要性，这是一个将在后续章节中探讨的话题。

结论

高级问答技术为 RAG 系统提供了更动态、更准确的回答路径，增强了用户交互。通过仔细实施 RetrievalQA 链，并解决其内在局限，开发者可以创建出能够与用户进行有意义对话的高度复杂系统。

进一步阅读和探索

探讨最新语言模型技术及其对 RAG 系统的影响。
研究将对话记忆集成到 RAG 框架中的其他策略。
本章为理解和实施 RAG 系统中的高级问答技术提供了基础，为该领域的进一步创新奠定了舞台。

理论问题

RAG 系统问答过程涉及的三个主要阶段是什么？
描述将所有检索到的文档片段传递给 LM 上下文窗口的局限性，并提及至少两种克服这种限制的策略。
使用向量数据库 (VectorDB) 在 RAG 系统文档检索中的意义是什么？
RetrievalQA 链如何将文档检索与问答结合起来？
在克服 LM 上下文窗口大小限制方面，比较 MapReduce 和 Refine 技术的区别。
在分布式系统中实施 MapReduce 或 Refine 技术时，需要考虑哪些实际因素？
为什么在 RAG 系统中实验 MapReduce 和 Refine 技术至关重要？
RetrievalQA 链关于对话历史记录的主要限制是什么，以及这对后续查询有何影响？
讨论将对话记忆集成到 RAG 系统中的重要性，以及如何潜在地提升用户交互体验。
推荐哪些领域进行进一步的阅读和探索，以增进对 RAG 系统及其功能的理解？

实践问题

基于本章关于 RAG 系统高级问答技术的内容，以下是与关键概念和代码示例相符的一些 Python 任务：
- 向量数据库初始化
  - 实现一个 Python 函数来初始化一个用于文档检索的向量数据库。使用 Chroma 类作为数据库，并使用 OpenAIEmbeddings 生成嵌入。该函数应接受一个目录路径作为输入，用于指定向量数据库存储数据的位置，并打印当前数据库中的文档数量。
- RetrievalQA 链设置
  - 创建一个 Python 函数来设置一个带有自定义提示模板的 RetrievalQA 链。该函数应初始化一个语言模型和一个向量数据库检索器，然后使用这些组件配置 RetrievalQA 链。使用本章中提供的自定义提示模板，并允许函数接受模型名称和文档存储目录作为参数。
- 使用 MapReduce 和 Refine 技术进行问答
  - 编写一个 Python 脚本来演示使用 MapReduce 和 Refine 技术进行问答。脚本应包括语言模型和向量数据库组件的初始化、MapReduce 和 Refine 问答链的设置，以及使用示例查询执行这些链。打印两种技术的结果。
- 处理对话上下文
  - 实现一个 Python 函数来模拟处理对话上下文中后续查询的情况。函数应接受两个查询（初始查询和后续查询）并使用问答链生成对两者的响应。此任务旨在说明章节中提到的关于保存对话历史记录的限制。你的实现不需要解决该限制，但应展示系统目前如何处理后续查询。