复旦大学的研究人员对检索增强生成技术 (RAG) 的现有方法进行了系统性的研究,提出了一种三步式方法来优化 RAG 框架,并通过实验证明了该方法在提高大型语言模型性能方面的有效性,特别是在多模态检索和问答方面的应用。
论文介绍
基于检索的生成技术 (Retrieval-Augmented Generation, RAG) 在将最新信息集成到大型语言模型 (LLMs) 中、减少幻觉和提高响应质量方面面临着重大挑战。尽管 RAG 方法有效,但复杂的实现和较长的响应时间阻碍了它们的应用。优化 RAG 对于增强 LLM 性能至关重要,使其能够在实时应用领域(如医疗诊断)中发挥作用,而医疗诊断领域对准确性和及时性至关重要。
目前,解决这些挑战的方法包括涉及查询分类、检索、重新排序、重新打包和摘要的工作流程。查询分类确定检索的必要性,而 BM25、Contriever 和 LLM-Embedder 等检索方法获取相关文档。重新排序优化检索文档的顺序,重新打包则对其进行组织以更好地生成。摘要提取关键信息用于响应生成。然而,这些方法都有其局限性。例如,查询重写和分解可以改进检索,但计算量大。使用深度语言模型进行重新排序可以提高性能,但速度较慢。现有方法还难以有效地平衡性能和响应时间,因此不适合实时应用。
复旦大学的研究人员对现有的 RAG 方法及其潜在组合进行了系统研究,以确定最佳实践。他们采用了一种三步法:比较每个 RAG 步骤的方法,评估每种方法对整体 RAG 性能的影响,以及探索针对不同场景的有前景的组合。他们提出了一些平衡性能和效率的策略。一个显著的创新是集成了多模态检索技术,该技术显著增强了有关视觉输入的问答能力,并使用“检索即生成”策略加速了多模态内容生成。与现有方法相比,这种方法通过提供更高效、更准确的解决方案,为该领域做出了重大贡献。
评估过程涉及详细的实验设置,以确定每个 RAG 模块的最佳实践。使用了 TREC DL 2019 和 2020 等数据集进行评估,并采用了各种检索方法,包括用于稀疏检索的 BM25 和用于密集检索的 Contriever。实验测试了不同的分块大小和技术,例如从小到大 (small-to-big) 和滑动窗口 (sliding windows),以提高检索质量。评估指标包括平均精度均值 (mean average precision, mAP)、归一化折损累计增益 (normalized discounted cumulative gain, nDCG@10) 和召回率 (recall, R@50 和 R@1k)。此外,还探讨了使用相关和不相关上下文对生成器进行微调以增强性能的影响。
该研究在各种关键性能指标上取得了显著改进。值得注意的是,Hybrid with HyDE 方法在 TREC DL 2019 和 2020 数据集中取得了最高分,平均精度均值 (mAP) 分别为 52.13 和 53.13,大大优于基线方法。通过 recall@50 衡量的检索性能也得到显著提升,分别达到 55.38 和 66.14。这些结果突出了推荐策略的有效性,证明了检索效率和有效性的实质性改进。
总之,这项研究解决了优化 RAG 技术以增强 LLM 性能的挑战。它系统地评估了现有方法,提出了创新的组合,并证明了性能指标的显著改进。多模态检索技术的集成代表了人工智能研究领域的重大进步。这项研究不仅为部署 RAG 系统提供了一个强大的框架,也为未来探索进一步优化和在各个领域应用奠定了基础。
论文下载
- 论文地址:https://arxiv.org/abs/2407.01219
如何系统的去学习大模型LLM ?
作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的 AI大模型资料
包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~
👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享]👈
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。