无限上下文，多级内存管理！突破ChatGPT等大语言模型上下文限制

无限上下文，多级内存管理！突破ChatGPT等大语言模型上下文限制

news2026/2/13 8:14:21

目前，ChatGPT、Llama 2、文心一言等主流大语言模型，因技术架构的问题上下文输入一直受到限制，即便是Claude 最多只支持10万token输入，这对于解读上百页报告、书籍、论文来说非常不方便。

为了解决这一难题，加州伯克利分校受操作系统的内存管理机制启发，提出了MemGPT。该模型的最大创新是模仿操作系统的多级内存管理机制，通过数据在不同的内存层级之间的传输，来打破大语言模型固定上下文的限定。

开源地址：https://github.com/cpacker/MemGPT

论文：https://arxiv.org/abs/2310.08560

在这里插入图片描述

MemGPT主要包含主上下文和外部上下文两大内存类型。主上下文相当于操作系统的主内存,是大语言模型可以直接访问的固定长度上下文窗口。

外部上下文则相当于磁盘存储,保存了主上下文之外的额外信息。MemGPT还提供了丰富的功能调用,允许大语言模型主动管理自己的内存而无需人工干预。

这些功能调用可以将信息在主上下文和外部上下文之间进行导入导出。大语言模型可以根据当前任务目标,自主决定何时移动上下文信息以更好利用有限的主上下文资源。

在这里插入图片描述

研究人员在多个测试环境中进行了评估，结果表明,MemGPT可以有效处理远超大语言模型上下文长度限制的文本内容，例如，MemGPT可以处理长度远超过GPT-3.5和GPT-4上下文限制的文档。

当取回的文档数增加时,固定上下文模型的性能受限于取回器的质量,而MemGPT可以通过调用分页机制取回更多文档,其问答准确率也获得提升。

在新提出的多步嵌套关键词提取任务中,MemGPT通过多次调用外部上下文,成功完成了需要跨文档进行多跳查询才能得出解的任务,而GPT-3.5和GPT-4的准确率在嵌套层数增加时急剧下降到0。

主上下文

MemGPT中的主上下文相当于操作系统中的“主内存”,是大语言模型可以直接访问的固定长度上下文窗口。研究人员将主上下文分为三个部分:

系统指令:这部分保存了MemGPT的基本控制逻辑,例如，函数调用模式等,长度固定且只读。

对话上下文:这是一个先入先出的队列,保存了最近的用户交互历史,只读且会在长度超限时裁剪前段对话。

工作上下文:这是一个读写临时存储,大语言模型可以通过功能调用自主向其中写入信息。

需要注意的是，这三个部分合起来，不能超过底层大语言模型的最大上下文长度。

外部上下文

外部上下文保存了主上下文之外的额外信息,相当于操作系统中的“磁盘存储”。外部上下文需要明确的函数调用才能将信息导入主上下文供模型访问，包括以下两种类型:

回溯存储:保存完整的历史事件信息,相当于对话上下文的无压缩版本。

归档存储:通用的读写数据库,可以作为主上下文的溢出空间保存额外信息。在对话应用中,归档存储可以保存有关用户或系统角色的事实、喜好等额外信息。

在这里插入图片描述

回溯存储允许检索特定时间段的历史交互。在文档分析中,归档存储可以支持更大的文档集搜索。

自主编辑与检索

MemGPT通过大语言模型产生的函数调用在内存层级之间主动移动数据,实现自主的编辑与检索。例如，可以自主决定何时在上下文之间移动信息,以适应当前任务目标,无需人工参与。

在这里插入图片描述

创新点在于系统指令中详细描述了内存体系结构和功能调用方法,指导大语言模型学习使用这些工具管理内存。

大语言模型可以根据反馈调整调用策略。同时,当主上下文空间不足时,系统会提醒大语言模型及时保存重要信息,引导其管理内存。

链式调用

在MemGPT中,各种外部事件会触发大语言模型进行推理,这包括用户消息、系统内存警告、用户交互事件等。

功能调用可以请求获取控制权,从而实现链式调用。例如，检索结果分页浏览时,连续调用可以将不同页面的数据收集到主上下文中。

在这里插入图片描述

而Yield调用则会暂停大语言模型,直到下一个外部事件触发才再启动推理。这种基于事件的控制流协调了内存管理、模型推理和用户交互之间的顺畅沟通。

解析器与优化

MemGPT使用解析器验证大语言模型生成的函数调用,检查参数等是否正确。调用后会将结果反馈给模型,这样可以学习调整策略,减少错误。

此外，MemGPT的系统指令可以进行实时更新,以便在不同任务上给模型加入定制化的内存管理指导，实现持续优化。

本文素材来源加州伯克利分校MemGPT论文，如有侵权请联系删除

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1164872.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

物联网AI MicroPython传感器学习之 QMC5883指南针罗盘传感器

物联网AI MicroPython传感器学习之 QMC5883指南针罗盘传感器

学物联网，来万物简单IoT物联网！！ 一、产品简介 QMC5883是一款表面贴装的集成了信号处理电路的三轴磁性传感器，应用场景主要包括罗盘、导航、无人机、机器人和手持设备等一些高精度的场合。引脚定义 VCC：3V3&#…

阅读更多...

【Java 进阶篇】Java ServletContext详解：获取MIME类型

【Java 进阶篇】Java ServletContext详解：获取MIME类型

MIME（Multipurpose Internet Mail Extensions）类型是一种标识文件类型的文本标签，通常用于指示浏览器如何处理Web服务器返回的文件。在Java Web应用程序中，ServletContext对象提供了一种方便的方法来获取文件的MIME类型。本篇博客…

阅读更多...

【实战Flask API项目指南】之五 RESTful API设计

【实战Flask API项目指南】之五 RESTful API设计

实战Flask API项目指南之 RESTful API设计本系列文章将带你深入探索实战Flask API项目指南，通过跟随小菜的学习之旅，你将逐步掌握 Flask 在实际项目中的应用。让我们一起踏上这个精彩的学习之旅吧！ 前言当小菜踏入Flask后端开发的世界时…

阅读更多...

Redis-命令操作Redis

Redis-命令操作Redis

🎬 艳艳耶✌️：个人主页 🔥 个人专栏 ：《Spring与Mybatis集成整合》《Vue.js使用》 ⛺️ 越努力 ，越幸运。 1.Redis简介 1.1.什么是Redis Redis是一个开源（BSD许可），内存存储的数据…

阅读更多...

费用预算管理系统

费用预算管理系统

费用预算管理系统 1. 模块概述《费用管理》以企业费用管理为核心，围绕费用支出审批流程，从费用发生前的事前申请，报销单据审批、付款单据审批，再到出纳付款、会计记账等所有工作流程都在系统中全员、协同完成；并且能…

阅读更多...

el-table中的el-input标签修改值，但界面未更新，解决方法

el-table中的el-input标签修改值，但界面未更新，解决方法

el-table中的el-input标签修改值，界面未更新在el-table中的el-input里面写的change事件根本不触发，都不打印，试了网络上各种方法都没用然后换成input事件，input事件会触发，但界面也未更新。我在触发事件的时候&…

阅读更多...

微信小程序之开发工具介绍

微信小程序之开发工具介绍

一、微信小程序开发工具下载微信小程序开发工具下载可以参考这篇博客《微信小程序开发者工具下载-CSDN博客》二、开发工具组成部分如下图所示，开发者工具主要由菜单栏、工具栏、模拟器、编辑器和调试器 5 个部分组成。。 1、菜单栏菜单栏中主要包括项目、文…

阅读更多...

听GPT 讲Rust源代码--library/std(13)

听GPT 讲Rust源代码--library/std(13)

题图来自 Decoding Rust: Everything You Need to Know About the Programming Language[1] File: rust/library/std/src/os/horizon/raw.rs 在Rust源代码中，rust/library/std/src/os/horizon/raw.rs这个文件的作用是为Rust的标准库提供与Horizon操作系统相关的原始…

阅读更多...

STM32HAL-完全解耦面向对象思维的架构-时间轮片法使用（timeslice）

STM32HAL-完全解耦面向对象思维的架构-时间轮片法使用（timeslice）

目录概述一、开发环境二、STM32CubeMx配置三、编码四、运行结果五、代码解释六、总结概述 timeslice是一个时间片轮询框架，完全解耦的时间片轮询框架，非常适合裸机单片机引用。接下来将该框架移植到stm32单片机运行，单片机…

阅读更多...

王道计算机网络

王道计算机网络

一、计算机网络概述 (一)计算机网络基本概念计算机网络的定义、组成与功能定义：以能够相互共享资源的方式互连起来的自治计算机系统的集合。目的：资源共享， 组成单元：自治、互不影响的计算机网络协议从不同角度计算机网络…

阅读更多...

【Python入门二】安装第三方库(包)

【Python入门二】安装第三方库(包)

安装第三方库/包 1 使用pip安装2 使用PyCharm软件安装3 离线安装，使用whl文件安装参考在Python中，有多种安装第三方库的方法，下面是一些常用的方法： 1 使用pip安装 pip是Python中最常用的包管理工具，也是最常用的在线…

阅读更多...

PASCAL VOC 格式

PASCAL VOC 格式

文章目录 ImageSets 文件夹Main 文件夹:Segmentation 文件夹:Layout 文件夹:Action 文件夹: Annotations 文件夹主要标签：物体标签： SegmentationClass 文件夹SegmentationObject 文件夹 PASCAL VOC（Visual Object Classes）是一个…

阅读更多...

计算流体动力学（CFD）软件

计算流体动力学（CFD）软件

CFD，英语全称 (Computational Fluid Dynamics），即计算流体动力学。CFD 是近代流体力学，数值数学和计算机科学结合的产物，是一门具有强大生命力的交叉科学。它是将流体力学的控制方程中积分、微分项近似地表示为离散的代…

阅读更多...

ardupilot开发 --- 代码解析篇

ardupilot开发 --- 代码解析篇

0. 前言根据SITL的断点调试和自己阅读代码的一些理解，写一点自己的注释，有什么不恰当的地方请各位读者不吝赐教。 1. GCS::update_send 线程主动向MavLink system发送消息包。 1.1 不断向地面站发送飞机状态数据 msg_attitude: msg_location: n…

阅读更多...

MYSQL 多表联查详解

MYSQL 多表联查详解

目录一、一个案例引发的多表连接二、笛卡尔积的错误和与正确的多表查询 2.1、笛卡尔积错误展示 2.2、笛卡尔积解决方法 2.3、练习三、多表查询分类 3.1、等值连接 vs 非等值连接 3.2、自连接 vs 非自连接 3.3、内连接 vs 外连接内连接（inner join&…

阅读更多...

基于FPGA的图像RGB转CMYK实现,包含testbench和MATLAB辅助验证程序

基于FPGA的图像RGB转CMYK实现,包含testbench和MATLAB辅助验证程序

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1、RGB转CMYK的原理 4.2、基于FPGA的实现方法 5.算法完整程序工程 1.算法运行效果图预览将仿真结果导入到matlab中，得到如下对比结果： 2.算法运行软件版本 matl…

阅读更多...

C++虚函数产生的多态

C++虚函数产生的多态

C虚函数产生的多态 1、先看下面代码，参考施雷老师课堂笔记 #include<iostream> #include<vector> #include <algorithm> #include <functional> using namespace std;/* 虚函数，静态绑定和动态绑定覆盖： 基类和派生…

阅读更多...

Vue3 实现 clipboard 复制功能

Vue3 实现 clipboard 复制功能

一个很小的交互功能，网上搜了一下有一个 vue3-clipboard 直接支持vue3，到github仓库看了下，原作者已经不维护这个项目了： 推荐使用 vueuse 自带的 useclipboard 功能，由 vue 团队维护，稳定性基本没问题官…

阅读更多...

UDP服务端和客户端通信代码开发流程

UDP服务端和客户端通信代码开发流程

一、UDP通信 TCP：传输控制协议，面向连接的，稳定的，可靠的，安全的数据集流传递稳定和可靠:丢包重传数据有序:序号和确认序号流量控制:稳定窗口 UDP：用户数据报协议面向无连接的,不稳定的,不可靠,不安…

阅读更多...

数据链路层协议【MAC帧和ARP协议】

数据链路层协议【MAC帧和ARP协议】

全文目录以太网帧格式MAC地址MAC地址和IP地址对比理解 MTU定义：细节：为什么它重要： MTU对IP协议的影响MTU对TCP和UDP的影响 ARP协议ARP数据报的格式ARP协议的作用ARP协议的工作流程以太网帧格式定义: 以太网是一种数据链路层和物理层标准…

阅读更多...

推荐文章

最新文章