长上下文语言模型与RAPTOR 方法

news2025/1/20 5:59:24

在科技领域的前沿,长上下文语言模型(Long Context LLMs)和新兴检索方法如RAPTOR 正在引发广泛关注。本文将围绕这些技术展开讨论,并探讨它们在实际应用中的创新性和科技性。

长上下文语言模型的崛起

近几周来,随着新型长上下文语言模型(如Gemini、Claude 3)的出现,关于“RAG(Retrieval-Augmented Generation)是否已经过时”的讨论甚嚣尘上。这些新模型能够处理高达百万个tokens的上下文,这无疑为我们提供了前所未有的机会。

我最近在某些项目中使用了这些长上下文LLMs,例如我上周发布的代码助手,它使用长上下文LLM回答关于我们文档中L表达式语言的问题。在这个项目中,我们处理了大约60,000个tokens的上下文,将问题和文档结合起来生成答案。这种方法非常简洁,不需要检索,只需将所有文档加载到上下文中并直接生成答案。我个人非常喜欢这种使用长上下文LLMs的方法,但在实际应用中,我们需要考虑一些问题。

评估与性能

为了进行评估,我设置了20个问题并生成了相应的答案。通过LangSmith仪表板,我观察到P50延迟(即50百分位延迟)在35到46秒之间,而P99延迟则高达420秒。这种延迟因试验而异,但总体上是可以预期的。更有趣的是,生成每个答案的成本约为1到1.3美元。

在考虑使用长上下文LLMs时,我们必须权衡这些因素,尤其是与传统的RAG系统相比,后者通过检索更小、更定向的片段来回答问题。

本地LLMs的替代方案

很多人问我是否可以用本地LLM来替代这种方法。我的首选本地LLM是Mistol 7B V2,它具有32,000个token的上下文窗口。然而,这仍然不足以处理我约60,000个tokens的文档。因此,虽然本地LLM在某些场景下是一个可行的替代方案,但在处理超大规模文档时,仍存在一定的局限性。

轻量级检索策略的探索

这些考虑促使我思考是否存在适用于长上下文模型的轻量级检索策略,这些策略既能利用大量上下文,又能解决上述限制。

其中一个观点是可以在文档级别进行索引,将完整的文档直接嵌入,然后利用KNN(K近邻)算法进行检索。这种方法无需对文档进行任何拆分或分块。

另一个有趣的想法是构建文档树。传统的KNN方法在需要整合多个文档的信息时可能不够灵活,而文档树可以通过聚类和递归总结信息来解决这个问题。

RAPTOR 方法的介绍

最近,一篇关于RAPTOR 方法的论文引起了广泛关注,其代码也已开源,这使得Llama Index团队推出了一个相应的Llama包RAPTOR r方法的核心思想是通过递归总结和嵌入文档来构建文档树,从而提高检索性能。

首先,我们将一组文档嵌入,然后对它们进行聚类。接着,我们对每个聚类中的内容进行总结,将这些总结作为更高层次的抽象。这个过程递归进行,直到只有一个聚类为止。最终,我们将这些总结和原始文档一起嵌入并进行检索。

实验与实现

为了验证这个方法的有效性,我使用了Claude 3来进行文档总结,并使用OpenAI的嵌入模型。通过递归聚类和总结,我们构建了一个包含原始文档和总结的向量索引。

实验结果表明,这种方法能够有效地提高检索性能,尤其是在需要整合多个文档信息的情况下。通过结合原始文档和总结,我们可以在不同粒度的抽象层次上进行检索,从而提高答案的准确性和全面性。

总结

长上下文LLMs和RAPTOR 方法为我们提供了新的可能性,特别是在处理大规模文档和复杂信息整合任务时。虽然直接使用长上下文LLMs是一种有效的解决方案,但在某些情况下,结合轻量级检索策略RAPTOR r方法,能够进一步提高性能和灵活性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1957979.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于 SSM 的汽车租赁系统

基于 SSM 的电器网上订购系统 开发语言:Java 数据库:MySQL 技术:Spring、JSP、MyBatis 工具:MyEclipse/IDEA、Tomcat 引言 汽车租赁是在约定时间内,租赁经营人将租赁汽车(包括载货汽车和载客汽车&#x…

前端在浏览器总报错,且获取请求头中token的值为null

前端请求总是失败说受跨域请求影响,但前后端配置已经没有问题了,如下: package com.example.shop_manage_sys.config;import org.springframework.beans.factory.annotation.Autowired; import org.springframework.context.annotation.Conf…

paddle ocr 文字识别模型训练 svtr

训练模型方法参考:https://github.com/PaddlePaddle/PaddleOCR/blob/main/doc/doc_ch/recognition.md 实践:https://aistudio.baidu.com/projectdetail/4482681 SVTR 算法原理 SVTR: Scene Text Recognition with a Single Visual Model Yongkun Du a…

Linux网络-ss命令

作者介绍:简历上没有一个精通的运维工程师。希望大家多多关注我,我尽量把自己会的都分享给大家,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 Linux服务器作为一个常用的网络服务器,主要的作用就是向客户端提供网络…

数据结构(邓俊辉)学习笔记】高级搜索树03——红黑树

文章目录 1. 动机1.1 观察体验1.2 持久性1.3 关联性1.4 O(1)重构 2. 结构2.1 定义规则2.2 实例验证2.3 提升交换2.4 末端节点2.5 红黑树,即是B树2.6 平衡性2.7 接口定义 3. 插入3.1 以曲为直3.2 双红缺陷3.3 算法框架3.4 RR-13.5 RR-23.6 归纳…

将nvim的配置 上传gitee

首先是创建仓库 接着进入这个界面 然后是上传代码, 结果: 可以看到已经是可以了。 然后是 拉取代码进行测试。 第一次 拉取 使用 git clone .(家里) 做一点修改,然后上传。(公司) 然后在git pu…

Kotlin 的优势:现代编程语言的卓越选择

文章目录 简洁与优雅的语法空安全特性函数式编程,支持高阶函数、lambdaKotlin 内联函数与 Java 的互操作性强大的类型推断协程支持lazy 委托object 单例模式区间表达式现代的开发工具支持 本文首发地址 https://h89.cn/archives/301.html 最新更新地址 https://gite…

2024-07-27 Unity Excel —— 使用 EPPlus 插件读取 Excel 文件

文章目录 1 前言2 项目地址3 使用方法3.1 写入 Excel3.2 读取 Excel3.3 读写 csv 文件 4 ExcelSheet 代码 1 前言 ​ 前几日,一直被如何在 Unity 中读取 Excel 的问题给困扰,网上搜索相关教程相对古老(4、5 年以前了)。之前想用 …

探索 Electron:如何进行网址收藏并无缝收录网页图片内容?

Electron是一个开源的桌面应用程序开发框架,它允许开发者使用Web技术(如 HTML、CSS 和 JavaScript)构建跨平台的桌面应用程序,它的出现极大地简化了桌面应用程序的开发流程,让更多的开发者能够利用已有的 Web 开发技能…

嵌入式人工智能(28-基于树莓派4B的语音播报模块-SYN6288)

1、语音播报模块 语音播报在一些嵌入式场景中很常见,广泛应用于游戏篮球机音效语音播报,跑步机语音导航,按摩椅语音操作指引,设备故障提示,设备操作引导语音,车载安全语音警示,公共场所语音提示…

系统移植(七)u-boot移植 ④ trusted版本

文章目录 一、U-boot源码适配(一)执行make stm32mp15_trusted_defconfig命令进行配置,生成.config文件(二)执行make menuconfig命令,对u-boot源码进行重新配置1. 对u-boot源码进行配置,移除pmic…

Executable Code Actions Elicit Better LLM Agents

Executable Code Actions Elicit Better LLM Agents Github: https://github.com/xingyaoww/code-act 一、动机 大语言模型展现出很强的推理能力。但是现如今大模型作为Agent的时候,在执行Action时依然还是通过text-based(文本模态)后者JSO…

Java Web——第一天

Web开发课程安排 Web标准 Web标准也称为网页标准,由一系列的标准组成,大部分由W3C( World Wide Web Consortium,万维网联盟)负责制定 三个组成部分: HTML:负责网页的结构 (页面素和内容) CSS:负责网页的表现 (页面元素的外观、位置等页面…

Ubuntu 20.04.6 安装 Elasticsearch

1.准备 -- 系统更新 sudo apt update sudo apt upgrade -- 安装vim 文本编辑器 sudo apt install vim-- jdk 版本确认 java -versionjdk 安装可以参照:https://blog.csdn.net/CsethCRM/article/details/140768670 2.官方下载Elasticsearch 官方地址:h…

PPT图表制作

一、表格的底纹 插入→表格→绘制表格→表设计→选择单元格→底纹 二、把一张图片做成九宫格 1. 把一张图片画成九宫格(处理过后还是一张图片,但是有框线) 绘制33表格→插入图片→全选表格单元格→右键设置形状格式→填充→图片或纹理填充…

Teamcenter RAC开发,创建Item的两种方式

1、如果描述不必填,采用胖客户端的创建方式 newItem itemType.create(newItemId, "", targetTypeComp.getTypeName(), item_name, // "test1", null, null2、如果描述必填,则需要采用SOA的创…

汇川CodeSysPLC教程03-2-6 ModBus TCP

什么是ModBus TCP? ModBus TCP是一种基于TCP/IP协议的工业网络通信协议,常用于工业自动化和控制系统。它是ModBus协议的一个变种,ModBus协议最初由Modicon(现在是施耐德电气的一部分)在1979年开发。 以下是ModBus TC…

二分类、多分类、多标签分类的评价指标

前言 在机器学习和深度学习中,常见的分类任务可以分为:二分类(Binary Classification); 多分类(Multi-class Classification); 多标签分类(Multi-label Classification); 序列分类 (Sequence Classification); 图分类…

SQL优化相关

文章目录 SQL优化1. 数据插入2. 主键优化页分裂页合并索引设计原则 3. order by 优化4. group by 优化5. limit优化6. count优化7. update 优化 SQL优化 1. 数据插入 当我们需要插入多条数据时候,建议使用批量插入,因为每次插入数据都会执行一条SQL&am…

使用YApi平台来管理接口

快速上手 进入YApi官网,进行注册登录https://yapi.pro/添加项目 3. 添加分类 4. 添加接口 5. 添加参数 添加返回数据 可以添加期望 验证 YAPI(Yet Another Practice Interface)是一个现代化的接口管理平台,由淘宝团队…