下一代RAG:MemoRAG

news2024/12/24 21:57:42

MemoRAG是一个建立在高效、超长记忆模型之上的创新 RAG(Retrieval-Augmented Generation)框架,由智源研究院(北京人工智能研究院)与中国人民大学高瓴人工智能学院联合推出并开源。

MemoRAG:通过记忆启发的知识发现迈向下一代RAG,为 RAG 提供基于内存的数据接口,适用于多种用途的应用程序!

图片

MemoRAG与主要处理具有明确信息需求查询的标准 RAG 不同,MemoRAG利用其记忆模型实现对整个数据库的全局理解。通过从记忆中回忆与查询相关的线索,MemoRAG增强了证据检索,从而产生更准确、更丰富的上下文响应。

在处理需要对整个数据库进行高级理解的查询时,标准RAG与MemoRAG之间的比较,以《哈利·波特》书籍作为数据库。左侧图,由于输入查询的隐含性质,标准RAG难以准确定位所需的证据,导致答案不够准确。右侧图MemoRAG构建了覆盖整个数据库的全局记忆。当提出查询时,MemoRAG 首先回忆相关线索,使有用的信息得以检索,从而得到一个精确且全面的答案。

图片

MemoRAG特点

图片

  • 全局记忆:在单个上下文中处理高达100万个token,为庞大的数据集提供全面的了解。 

  • 可优化与灵活:轻松适应新任务,仅需几个小时的额外训练即可实现优化性能。 

  • 上下文线索:从全局记忆中生成精确线索,将原始输入与答案连接起来,并从复杂数据中解锁隐藏的洞察。 

  • 高效缓存:通过支持缓存分块、索引和编码,将上下文预填充速度提高多达30倍。 

  • 上下文重用一次性编码长上下文,并支持重复使用,提高需要重复数据访问的任务的效率。

在三个基准上测试了MemoRAG,使用了三种不同的生成器(Llama3-8B-Instruct-8K、Phi-3-mini-128K、Mistral-7B-Instruct-v0.2-32K),得出以下结论: 

主要实验结果。每个版块中最好的结果以粗体显示。这些实验中使用的记忆模型是基于 Mistral-7B-Instruct-v0.2-32K 训练的,可在 HuggingFace 上获取。

图片

  • MemoRAG 在所有数据集上的表现都超过了所有基线模型,展示了其强大的领域泛化能力。 

  • 直接将完整上下文输入到大型语言模型(LLMs)通常比其他 RAG 方法(BGE-M3、Stella-v5 和 HyDE)表现更好。这一发现揭示了标准 RAG 系统在处理长上下文和高级问题方面的困难。 

  • 相比之下,MemoRAG 一贯超越了直接使用完整上下文的性能,展示了其有效弥合处理超长上下文和解决复杂任务之间差距的能力。

  • MemoRAG 在三个领域内数据集上展示了卓越的性能,这表明其潜力可以通过更多样化的训练数据进一步增强。

MemoRAG使用

可以直接用 HuggingFace 模型初始化。通过该MemoRAG.memorize()方法,记忆模型可以在较长的输入上下文中构建全局记忆。

  • TommyChien/memorag-qwen2-7b-inst可以处理最多400K个token的上下文,

  • TommyChien/memorag-mistral-7b-inst可以管理最多128K个token的上下文。

  • 通过增加参数beacon_ratio,可以扩展模型处理更长上下文的能力。例如,TommyChien/memorag-qwen2-7b-inst可以处理最多一百万个token beacon_ratio=16。

from memorag import MemoRAG
# Initialize MemoRAG pipelinepipe = MemoRAG(    mem_model_name_or_path="TommyChien/memorag-mistral-7b-inst",    ret_model_name_or_path="BAAI/bge-m3",     gen_model_name_or_path="mistralai/Mistral-7B-Instruct-v0.2", # Optional: if not specify, use memery model as the generator    cache_dir="path_to_model_cache",  # Optional: specify local model cache directory    access_token="hugging_face_access_token",  # Optional: Hugging Face access token    beacon_ratio=4)
context = open("examples/harry_potter.txt").read()query = "How many times is the Chamber of Secrets opened in the book?"
# Memorize the context and save to cachepipe.memorize(context, save_dir="cache/harry_potter/", print_stats=True)
# Generate response using the memorized contextres = pipe(context=context, query=query, task_type="memorag", max_new_tokens=256)print(f"MemoRAG generated answer: \n{res}")

运行上述代码时,编码后的键值 (KV) 缓存Faiss 索引分块段落都存储在指定的 中save_dir。之后,如果再次使用相同的上下文,则可以快速从磁盘加载数据:

pipe.load("cache/harry_potter/", print_stats=True)

通常,加载缓存权重非常高效。例如,使用内存模型对200K令牌上下文进行编码分块和索引大约需要35秒但从缓存文件加载时只需1.5秒

摘要任务

要执行摘要任务,请使用以下脚本:

res = pipe(context=context, task_type="summarize", max_new_tokens=512)print(f"MemoRAG summary of the full book:\n {res}")

https://github.com/qhjqhj00/MemoRAGhttps://arxiv.org/pdf/2409.05591MemoRAG: Moving Towards Next-Gen RAG Via Memory-Inspired Knowledge Discovery

来源 | PaperAgent

RAG专栏20

RAG专栏 · 目录

上一篇一个全面、先进、公平且模块化的开源RAG框架

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2127880.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机视觉的应用33-基于双向LSTM和注意力机制融合模型的车辆轨迹预测应用实战

大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用33-基于双向LSTM和注意力机制融合模型的车辆轨迹预测应用实战。在当今复杂的数据处理场景中,尤其是面对时间序列或序列数据时,双向 LSTM结合注意力机制的模型因其强大的序列…

普通人,适合转行大模型吗?大模型的未来前景怎么样?

前言 在当今时代,AI大模型的发展如火如荼,其在各行各业的应用日益广泛。那么,作为普通人,我们是否应该转行投身于大模型领域呢?本文将从以下几个方面阐述,为什么普通人应该转行大模型,以及大模…

learn C++ NO.15——priority_queue与反向迭代器

priority_queue是什么? priority_queue即优先级队列,它是一个STL库中的容器适配器,底层是用堆实现的。它常被用于解决topK问题。 priority_queue的使用 由于是容器适配器,所以它并不支持迭代器去遍历容器。使用的接口与stack、…

智能物流新“黑神话”:各位“天命人”,这份行业应用锦集请收下!

全球工业革新浪潮中,智能物流正成为制造业转型升级的核心驱动力之一。高柔性的智能物流解决方案可以帮助企业应对复杂的物流挑战,实现生产到仓储全过程的智能化、柔性化和高度集成,带来显著的经济效益。 作为行业领先的全场景柔性物流综合解…

经验证的稳定RSV-pre-F三聚体蛋白--助力疫苗领域百亿蓝海市场角逐战

前 言 历经六十年,RSV疫苗终于上市。今年上半年,美国FDA先后批准GSK和辉瑞的RSV疫苗上市,主要用于60岁以上老年人,且辉瑞的疫苗扩展到妊娠32-36周的孕妇。至此RSV疫苗的百亿蓝海市场角逐战正式打响。 RSV概述 RSV(…

【数据结构】排序算法系列——希尔排序(附源码+图解)

希尔排序 算法思想 希尔排序(Shell Sort)是一种改进的插入排序算法,希尔排序的创造者Donald Shell想出了这个极具创造力的改进。其时间复杂度取决于步长序列(gap)的选择。我们在插入排序中,会发现是对整体…

开源 AI 智能名片 S2B2C 商城系统在人仓合一平台招募社区合伙人模式中的应用与价值

摘要:本文主要探讨人仓合一平台招募社区合伙人的模式,分析其对流量整合与变现的意义。重点阐述开源 AI 智能名片 S2B2C 商城系统在该模式中的应用,包括如何助力合伙人盘活微信群流量、整合客户资源、实现商品信息推广以及推动流量变现&#x…

从传统编程到低代码,企业如何以更低成本、更快速度交付项目,推动年收入增长

在这数字化转型的大潮中,商业环境也发生着巨大的变化,企业对于项目交付的速度、质量和成本控制都有着越来越高的要求。传统编程模式的门槛高、开发周期长,各方面的成本算下来,成为企业快速发展的瓶颈。低代码开发的兴起&#xff0…

AcWing算法基础课-788逆序对的数量-Java题解

大家好,我是何未来,本篇文章给大家讲解《AcWing算法基础课》788 题——逆序对的数量。本文详细讲解了如何通过归并排序算法高效计算数组中的逆序对数量。通过递归分治和归并过程,我们不仅实现了数组的排序,还在排序过程中巧妙地计…

【深度学习】【图像分类】【OnnxRuntime】【C++】ResNet模型部署

【深度学习】【图像分类】【OnnxRuntime】【C】ResNet模型部署 提示:博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论 文章目录 【深度学习】【图像分类】【OnnxRuntime】【C】ResNet模型部署前言模型转换--pytorch转onnxWindows平台搭建依赖环境ONNXRuntime推…

这种钛镍合金不简单!强度高且模量低,制造过程也不难

大家好,今天我们要来聊聊一种神奇的合金——《A polymer-like ultrahigh-strength metal alloy》发表于《Nature》。在许多新兴技术中,比如变形飞机和超人型人工肌肉,都需要一种既强又灵活的金属合金。但长久以来,要实现这种“强而…

电商品牌假货要怎么处理

在电商蓬勃发展的今日,假货问题如影随形,严重威胁着品牌的声誉与市场的健康。力维网络以专业打假服务,为品牌保驾护航。 一、精准监测,揪出假货端倪 力维网络的数据监测系统犹如一张严密的大网,覆盖全网。通过全面采集…

828华为云征文 | 华为云Flexus X实例上实现Docker容器的实时监控与可视化分析

前言 华为云Flexus X,以顶尖算力与智能调度,引领Docker容器管理新风尚。828企业上云节之际,Flexus X携手前沿技术,实现容器运行的实时监控与数据可视化,让管理变得直观高效。无论是性能瓶颈的精准定位,还是…

揭晓2024年上半年热门跨境电商平台排行榜完整版,排在第二的居然是它!

随着全球电商市场的持续发展和融合,跨境电商平台已成为众多商家拓展国际市场的重要渠道。面对琳琅满目的平台选择,卖家如何做出明智的决策,成为了关注的焦点。本文将从今年上半年GMV这个维度来盘点一下热门电商平台的最新排行榜,有…

qwen2 VL 多模态图文模型;图像、视频使用案例

参考: https://huggingface.co/Qwen/Qwen2-VL-2B-Instruct 模型: export HF_ENDPOINThttps://hf-mirror.comhuggingface-cli download --resume-download --local-dir-use-symlinks False Qwen/Qwen2-VL-2B-Instruct --local-dir qwen2-vl安装&#x…

你不得不知的日志级别

前言 写日志是一项具有挑战性的任务,在工作中我们常常面临一些困境,比如: 开发人员在编写代码时常常陷入纠结,不确定在何处打印日志才是最有意义的;SRE人员在调查生产问题时可能因为缺乏必要的日志信息而束手无策&am…

基于SSM的“高校学生社团管理系统”的设计与实现(源码+数据库+文档)

基于SSM的“高校学生社团管理系统”的设计与实现(源码数据库文档) 开发语言:Java 数据库:MySQL 技术:SSM 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 系统结构图 首页 注册 登录 后台首页界面 社团公告页面 留…

Engage2024用户大会成功举办,数聚股份携手销售易共绘数字化转型新篇章

2024年9月5日,销售易第六届用户大会Engage2024在上海盛大举行。销售易,作为唯一一家入选Gartner SFA魔力象限、且产品能力全球前四的国产CRM软件,当之无愧是国产CRM软件的龙头,其用户大会自然就是CRM领域盛会,汇聚了众…

生命周期函数

所有继承MonoBehavior的脚本 最终都会挂载到Gameobiject游戏对象上 1.生命周期西数 就是该脚本对象依附的Gameobject对象从出生到消亡整个生命周期中 会通过反射自动调用的一些特殊函数 2.Unity帮助我们记录了一个Gameobject对象依附了哪些脚本 会自动的得到这些对象&#x…

视频监控系统中的云镜控制PTZ详细介绍,以及视频监控接入联网平台相关协议对PTZ的支持

目录 一、PTZ概述 二、PTZ 控制的应用场景 1、公共场所 2、安全监控 3、交通监控 4、工业生产环境中的质量监控 5、大型活动的现场直播或录制 三、PTZ摄像的优缺点 1、优点 2、缺点 四、PTZ控制的基本原理 1、云台控制 2、镜头控制 五、 PTZ 控制协议 1. Pelco-…