LLMs之RAG之IncarnaMind：IncarnaMind的简介(提高RAG召回率的两个优化技巧=滑块遍历反向查找+独立查询)、安装、使用方法之详细攻略

news2026/2/7 11:47:22

导读：在IncarnaMind项目中，提出了几个优化技巧，是非常值得我们在优化RAG系统的时候，进行思考和借鉴。

>> 文档分块能够提高相似度检索中的效率和准确性：可以通过小分块和大分块的结合来优化检索效果。分块大小需要权衡，分块不宜太大，否则会影响检索效果；分块也不宜太小，以免检索结果不完整。

>> 分块技巧—滑块遍历和反向查找(用小分块保证尽可能找到更多的相关内容，用大分块保证内容完整性)：在相似度检索时，可以使用滑块遍历结果，根据小块的信息反向查找大块内容，以便提交给语言模型作为上下文。比如Langchain中ParentDocumentRetriever(父文档检索器)就采用了这一思路。

>> 用LLM将用户的提问转换成独立查询：当用户提问后，重新提炼问题并拆分成多个独立查询。通过过滤掉无用信息，使得查询更准确，进而提升用户体验和检索结果的质量。

LLMs之RAG：知识检索增强生成方法(搭建本地知识库、利用外挂信息库增强LLMs自身能力的一种方法，外部知识检索+LLMs生成回复=知识问答任务)的简介、实现方法(LangChain/Loc……等)、案例应用之详细攻略

IncarnaMind的简介

1、版本更新

2、应对的挑战及其提出的解决方案

(1)、流程图—高级架构

(2)、流程图—滑块窗口分块

3、不同模型的性能对比表

IncarnaMind的安装

1、环境配置以及闭源模型的密钥

2、安装

IncarnaMind的使用方法

1、基础用法

LLMs之RAG：知识检索增强生成方法(搭建本地知识库、利用外挂信息库增强LLMs自身能力的一种方法，外部知识检索+LLMs生成回复=知识问答任务)的简介、实现方法(LangChain/Loc……等)、案例应用之详细攻略

https://yunyaniu.blog.csdn.net/article/details/130215772

IncarnaMind的简介

IncarnaMind允许你使用大型语言模型（LLMs）如GPT与你的个人文件（PDF，TXT）进行聊天。尽管OpenAI最近推出了GPT模型的微调API，但它不允许base版本的预训练模型学习新数据，而且响应可能容易受到事实幻觉的影响。利用我们的滑块窗口分块机制和集合检索器，可以有效地查询地面真实文档中的精细和粗粒度信息，以增强LLMs。

GitHub地址：https://github.com/junruxiong/IncarnaMind

1、版本更新

开源和本地LLMs支持	开源和本地LLMs支持推荐模型：我们主要使用Llama2系列模型进行测试，并建议使用llama2-70b-chat（完整或GGUF版本）以获得最佳性能。随时尝试其他LLMs。系统要求：运行GGUF量化版本需要超过35GB的GPU RAM。
备用开源LLMs选项	备用开源LLMs选项内存不足：如果受到GPU RAM的限制，请考虑使用Together.ai API。它支持llama2-70b-chat和大多数其他开源LLMs。此外，您可以获得25美元的免费使用额度。即将推出：将来将发布更小型和经济实惠的微调模型。
注意事项	如何使用GGUF模型：有关获取和使用量化GGUF LLM的说明（类似于GGML），请参考此视频（从10:45到12:30）。
即将推出的功能	前端UI界面经过微调的小型开源LLMs OCR支持异步优化支持更多文档格式。

视频地址：https://user-images.githubusercontent.com/44308338/268073295-89d479fb-de90-4f7c-b166-e54f7bc7344c.mp4