Speculative RAG:为知识密集型数据服务的RAG

Speculative RAG:为知识密集型数据服务的RAG

news2026/2/14 12:27:22

论文链接
RAG的一个棘手问题是不知道该召回多少chunk，少了可能丢信息，多了会引入噪声信息。虽然有self-reasoning等自我反思的解决办法，但是整体链路太长，延迟高，不利于工业落地。

虽然无法面对整个服务场景，但是对于知识密集型数据，可以用Speculative RAG解决。所谓知识密集，即你要问的问题只集中在少数几个chunk里，不需要长篇大论地找答案，例如一个章节就解决一个事，你要问这个事，把这个章节拿来就全解决了。

对于这种数据，Speculative RAG加速的办法是：（举个例子）把72b或32b的大模型换成多个7b模型，称为draft。RAG检索到100个chunk，先用k-means把100个chunk聚类，然后随机地把各个桶里的信息分到每个draft模型，多个draft模型并行推理。
！！！因为用了小模型，所以必须保证问题足够简单。
并行推理的结果作为draft被后续模型评测，例如忠诚度、相关度，评测结果最好的作为最终答案。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2131898.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

HTML + js 生成一个线路走向图，可以标记总共有多少站，用户到达第几站了

HTML + js 生成一个线路走向图，可以标记总共有多少站，用户到达第几站了

文章目录前言一、用途二、使用步骤1.轨迹代码2.运行前言 HTML + js 生成一个线路走向图例如：用来记录用户到达那一站了，可以标记总共有多少站，用户到达第几站了提示：以下是本篇文章正文内容，下面案例可供参考一、用途用来记录用户到达那一站了，可以标记总共有多少…

阅读更多...

保姆级AI编程Cursor-Vscode使用教程

保姆级AI编程Cursor-Vscode使用教程

一: 下载，安装(输入语言后，然后迁移插件) 下载地址：https://www.cursor.com/settings 二: 登录三. 玩AI--给一张UI图，一键生成需求代码（需要自己去小改一下，大部分都可用） 四、项目实践-优…

阅读更多...

苹果手机管理软件哪个好用苹果手机如何从安卓手机导入数据

苹果手机管理软件哪个好用苹果手机如何从安卓手机导入数据

随着科技的发展，手机已经成为我们日常生活中不可或缺的一部分。苹果手机以其稳定的性能和卓越的用户体验受到广大用户的喜爱。然而，如何高效管理苹果手机以及如何从安卓手机导入数据，是许多用户在使用过程中常遇到的问题。本文将围绕“苹果手…

阅读更多...

异步和多线程

异步和多线程

概念异步（Asynchronous）： 异步是一种编程模型，其核心思想是在等待I/O操作（如文件读写、网络通信等）完成时，不阻塞当前线程的执行，而是允许程序继续执行其他任务。当I/O操作完成后&…

阅读更多...

Linux系统调用进程标识符

Linux系统调用进程标识符

目录一、冯诺依曼体系结构二、操作系统 2.1什么是操作系统？ 2.2为什么需要操作系统？ 2.3怎么管理？ 2.4总结 2.5系统调用三、进程的理解 3.1进程的基本概念 3.2对进程的描述 3.3对进程的组织 3.4task_struct内容的分类 3.5Linux下…

阅读更多...

2024年【危险化学品生产单位安全生产管理人员】考试资料及危险化学品生产单位安全生产管理人员考试试卷

2024年【危险化学品生产单位安全生产管理人员】考试资料及危险化学品生产单位安全生产管理人员考试试卷

题库来源：安全生产模拟考试一点通公众号小程序 2024年危险化学品生产单位安全生产管理人员考试资料为正在备考危险化学品生产单位安全生产管理人员操作证的学员准备的理论考试专题，每个月更新的危险化学品生产单位安全生产管理人员考试试卷祝您顺利通过…

阅读更多...

5大公有公有云数据库厂商发展太猛！作为DBA的我，有点焦虑！

5大公有公有云数据库厂商发展太猛！作为DBA的我，有点焦虑！

未来数据库的战场主要是公有云，且公有云的比重确实也在逐年上升，那么是不是这么回事呢？我们来分别看下几个云厂商巨头的公有云营收和增速！ 全球公有云王者AWS 2022年半年报： 2023年半年报： 2024年半年报&a…

阅读更多...

Games101笔记-线性代数（一）

Games101笔记-线性代数（一）

1、图形学和计算机视觉的区别计算机视觉：一切需要猜测的都可以归类到计算机视觉图形学：光栅化、几何、光追、动画/模拟 2、向量向量表示2个东西：方向长度，向量与起始位置无关向量加法：得到1个三角形或者平行四边…

阅读更多...

分享一波中高级测试面试题（偏Java）

分享一波中高级测试面试题（偏Java）

dubbo协议介绍下 Dubbo是一款高性能、轻量级的开源RPC框架，支持多种协议，其中之一就是Dubbo协议。 Dubbo协议是一种基于TCP的高性能传输协议，它是Dubbo框架默认的传输协议。Dubbo协议采用了一种自定义的数据传输格式，采用简单的…

阅读更多...

java之认识异常

java之认识异常

在 Java 中，异常（Exception）用于处理程序运行时出现的错误或异常情况。Java 的异常处理机制基于 try, catch, finally 和 throw 关键字。 1.异常的分类： 1.1：检查型异常(CheckedException)： 定义:程序在…

阅读更多...

ChatGPT实战100例 - (21) 搞定汉字新解，o1-mini 在李继刚老师这扳回一局

ChatGPT实战100例 - (21) 搞定汉字新解，o1-mini 在李继刚老师这扳回一局

文章目录搞定汉字新解，o1-mini 在李继刚老师这扳回一局翻车开车飙车出图福利在这福利+1搞定汉字新解，o1-mini 在李继刚老师这扳回一局昨天朋友圈刷爆了李继刚老师的汉字新解，废话不说，上 prompt ;; 作者: 李继刚 ;; 版本: 0.1 ;; 模型: Claude Sonnet ;; 用途: 将一…

阅读更多...

【2025】基于PHP职业病健康管理系统（源码+论文+部署讲解等）

【2025】基于PHP职业病健康管理系统（源码+论文+部署讲解等）

博主介绍： ✌我是阿龙，一名专注于Java技术领域的程序员，全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师，我在计算机毕业设计开发方面积累了丰富的经验。同时，我也是掘金、华为云、阿里云、InfoQ等平台…

阅读更多...

参数传了报错没传参数识别不到参数传丢

参数传了报错没传参数识别不到参数传丢

【记一次参数传值了但报错未传值的问题解决历程】问题描述：同一个接口，用测试类调可以成功，用postman调用一直报错少参数，后又尝试了用idea自带的http调用，同样报错参数未传值。如图，传值了报错未传值。…

阅读更多...

怎样还原空白试卷？2024教你快速还原空白试卷的软件

怎样还原空白试卷？2024教你快速还原空白试卷的软件

怎样还原空白试卷？2024教你快速还原空白试卷的软件还原空白试卷是一项常见的需求，尤其是在教学、考试准备或练习时需要重新使用原有试卷时。通过使用AI技术或专业的图片编辑软件，能够快速去除试卷上的答案或标记，恢复原始空白状…

阅读更多...

卷积神经网络(二)CIFAR100类别分类

卷积神经网络(二)CIFAR100类别分类

一.数据介绍总共一百个类，每个类有600个图像。每类500个训练图像，100个测试图像。没填图像都带有一个"精细"标签（它所属的类）核一个粗糙标签（它所属的超类） 二.API使用用于构建CNN模型的API …

阅读更多...

构建全景企业画像，深度评估企业风险，保障商业利益！

构建全景企业画像，深度评估企业风险，保障商业利益！

战略投资、招商引资、融资贷款、市场合作等商业行为，都需要对目标企业进行尽调，评估企业的风险。依据评估结果，投资者可以识别并量化潜在投资风险，保障投资的安全性和收益性;招商工作可以甄别优质企业，确保引进高质量、…

阅读更多...

Android 内置应用裁剪

Android 内置应用裁剪

文章目录查询目标 APK 的 Android.mk（或 Android.bp）文件apk裁剪方式1.注释或删除.mk/.bp文件2.将 APK 名称加入“OVERRIDES”配置项中3.自定义“PRODUCT_PACKAGES_REMOVE”配置项查询目标 APK 的 Android.mk（或 Android.bp）文件…

阅读更多...

【YashanDB知识库】执行sql语句时报YAS-04401 data type - expected, but BLOB got异常

【YashanDB知识库】执行sql语句时报YAS-04401 data type - expected, but BLOB got异常

本文转载自YashanDB官方网站，具体链接为：执行sql语句时报YAS-04401 data type - expected, but BLOB got异常问题现象某客户的.net小程序在通过.net驱动执行业务时，报YAS-04401 data type - expected, but BLOB got异常： 问题…

阅读更多...

2024/9/13 数学20题

2024/9/13 数学20题

根的个数问题： 数列：

阅读更多...

OPENAIGC开发者大赛企业组银奖 | Gambit-AI智能合同审核助手

OPENAIGC开发者大赛企业组银奖 | Gambit-AI智能合同审核助手

在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您…

阅读更多...

推荐文章

最新文章