1、rag定义
检索增强生成 (RAG) 模型代表了检索系统和生成模型两大不同但互补组件完美结合的杰作。通过无缝整合相关信息检索和生成与背景相关的响应,RAG模型在人工智能领域达到了前所未有的复杂程度。
2、rag工作流程
2.1、rag整体框架
query通过llm处理后,经过rag检索数据库database,返回context给到大模型,大模型再根据返回的内容生成答案。
2.2、rag框架分解
2.2.1、query处理
当query输入给rag模型时,模型会解析出query的含义和意图。
2.2.2、文档检索
query被处理后,系统进入到检索阶段,通过向量召回,文本召回等方式,找出与query最相近的的文档。
2.2.3、响应生成
拿到检索后的结果后,llm将检索到的结果,进行组织,生成上下文相关的答案
2.2.4、集成
rag模型集成检索和生成任务,使其能够精确地应付各种任务。
3、构建rag平台选择
openai:提供强大的生成模型,chatgpt
hugging face的transformers库:自然语言处理工具包
langchain和llamaindex:LangChain 和 LlamaIndex为开发人员提供了构建 RAG 流水线的工具和框架,包括对检索系统、生成模型和提示工程的支持
OpenLLaMA和Falcon:提供了构建 RAG 管道的一系列工具和资源,包括对向量搜索引擎、语言模型以及与外部数据源集成的支持
4、参考文献
【1】、Understanding RAG: A Deeper Dive into the Fusion of Retrieval and Generation - DEV Community