【AI论文精读4】RAG论文综述2(微软亚研院 2409)P2-问题定义

news2025/1/4 6:51:37

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI大项目】【AI应用】


P1

二、问题定义

数据增强的大语言模型(LLM)应用可以采取多种形式,从常见的基于领域特定数据的问答机器人,到复杂数据管道中的语义处理操作,甚至是处理多代理系统中特定步骤的代理。然而,通常来说,数据增强的LLM应用可以表述为以下形式:

f : Q D → A f : Q^{D} \rightarrow A f:QDA

其中, Q Q Q A A A D D D 分别代表用户的输入(查询)、期望的回答(答案)以及给定的数据。应用的任务 f f f 是基于 D D D 建立从 Q Q Q A A A 的映射关系。

与仅依赖现有知识的独立LLM系统相比,数据增强的LLM应用的特点是依赖外部数据 D D D 来准确处理所提出的查询 Q Q Q。外部数据 D D D 的引入可以显著增强LLM的能力,使其能够利用当前的领域特定知识并理解专家的推理。查询的复杂性可以根据其使用外部数据的广度和方式进行分层,反映了应对查询时所需的深度和参与度。


2.1 查询分层(Stratification of Queries)

在数据增强的大语言模型(LLM)应用中,查询可以根据其复杂性和所需的数据交互深度进行分层。这种分层有助于理解LLM在生成准确和相关的响应时必须执行的不同认知处理水平。从简单的事实检索到对隐性知识的细致解读,每个层次都代表着LLM处理任务复杂程度的逐步提升。以下是这些层次的详细说明:

1. 一级查询:显性事实(Explicit Facts)

  • 定义:这些查询涉及在给定数据中直接存在的显性事实,而不需要任何额外的推理。这是最简单的查询形式,模型的主要任务是定位并提取相关信息。
  • 现实示例:“2024年夏季奥运会将在哪里举办?”。这一问题的答案直接包含在外部数据中,只需检索出答案即可(例如,奥运会举办地为巴黎)。

2. 二级查询:隐性事实(Implicit Facts)

  • 定义:这些查询要求模型推断数据中不明显的事实,可能需要一定的常识推理或基本的逻辑推导。所需信息可能分布在多个片段中,模型需要将它们结合起来作出简单的推论。
  • 现实示例:“堪培拉所在的国家现在的多数党是什么?”。这一问题需要将堪培拉位于澳大利亚的事实与澳大利亚现执政党信息相结合来回答。

3. 三级查询:可解释的推理(Interpretable Rationales)

  • 定义:这类查询不仅需要掌握事实内容,还要求模型理解并应用数据上下文中特定领域的推理。通常,这些推理是外部资源提供的领域知识,在模型的预训练阶段可能没有遇到过。
  • 现实示例:在制药领域,LLM需要解读FDA指南来评估特定药物申请是否符合监管要求。同样,在客户支持场景中,LLM必须理解预定义的工作流程,以有效处理用户查询。在医疗领域,许多诊断手册提供了权威的标准化诊断标准,例如急性胸痛的管理指南【14】。通过有效遵循这些已有的外部推理,可以开发出一个用于管理胸痛的专业LLM专家系统。

4. 四级查询:隐藏的推理(Hidden Rationales)

  • 定义:这一类查询涉及更具挑战性的领域,在这里推理过程没有明确记录,但必须通过从外部数据中观察到的模式和结果进行推断。隐性推理不仅指隐含的推理链和逻辑关系,还包括识别和提取每个具体查询所需的外部推理的复杂任务。
  • 现实示例:在IT运营场景中,模型可能需要从过去解决的事件中推断出成功的隐性策略。在软件开发中,模型可能需要从调试历史中提取隐含的原则,尽管每次调试决策的逐步推理过程可能没有系统记录。

2.2 四种查询的比喻解释

这是我自己的补充解释,不是论文中的内容,只是为了更好的理解

下面通过一个找书的例子来解释这四种查询的区别:

1. 一级查询:显性事实(Explicit Facts)

  • 比喻:你走进图书馆,直接问图书管理员:“《哈利·波特》的作者是谁?”
  • 解释:管理员很快查找资料,告诉你:“J.K.罗琳。”这是显性事实,答案就直接在数据里,不需要任何推理。

2. 二级查询:隐性事实(Implicit Facts)

  • 比喻:你问图书管理员:“《哈利·波特》的作者是英国人吗?”
  • 解释:管理员需要知道《哈利·波特》的作者是J.K.罗琳,然后再推断出J.K.罗琳是英国人。这里需要一些基本推理,但信息可以通过多个步骤找到。

3. 三级查询:可解释的推理(Interpretable Rationales)

  • 比喻:你问图书管理员:“这本书符合儿童书籍的出版标准吗?”
  • 解释:管理员需要根据儿童书籍的出版标准来判断《哈利·波特》是否符合规定。这里不仅仅是查找事实,管理员还需要理解和应用出版标准这一领域特定的专业规则和逻辑(这些规则和逻辑是明确的和已知的)。

4. 四级查询:隐藏的推理(Hidden Rationales)

  • 比喻:你问图书管理员:“如何出版一本像《哈利·波特》一样畅销的书?”
  • 解释:这个问题没有一个明确的答案。管理员需要从过去的出版历史中,结合《哈利·波特》的成功经验,推测和总结出畅销书出版的策略。这需要从大量的历史数据中挖掘出隐含的模式和规律(不明确的或未知的)。

总结:

  • 一级显性事实是直接从数据中找答案,不需要推理;
  • 二级隐性事实需要一些简单的推理,将多个信息点结合起来得出结论;
  • 三级可解释推理需要掌握并应用领域特定的规则和逻辑;
  • 四级隐藏推理则需要从过往经验中提取隐含的智慧和策略。

2.3 图示与数据集分类

  • 图1和图2展示了这四种查询的图示,表1则根据这些标准分类了常见的事实查询数据集。这三张图表都很好理解,而且没啥有用的信息,稍微看一眼就好了,就不解释了。

图1

在这里插入图片描述

图2

在这里插入图片描述

表1

在这里插入图片描述

2.4 查询分层的意义

每个层次都带来了独特的挑战,因此需要量身定制的解决方案来有效应对它们。在接下来的章节中,我们将深入探讨这些层次的复杂性,探索使LLM能够在数据增强应用中驾驭这些不同查询类型的具体策略和方法。这种分层不仅有助于厘清现有LLM的能力,还能帮助发现未来改进的空间和潜在的发展方向。


P1和P2很简单,后面就开始丰富和复杂起来了,未完待续。。。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2212338.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AI工具在论文选题方面可以提供的帮助

学境思源,一键生成论文初稿: AcademicIdeas - 学境思源AI论文写作 在论文写作中,选题是决定研究质量和成果的关键步骤。随着人工智能技术的快速发展,AI工具在论文选题方面的应用逐渐受到关注。通过智能算法和大数据分析&#xff…

selenium安装

一、安装selenium 1,安装selenium -- 命令: pip install selenium -- 网络不稳的请换源安装: pip install selenium -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com 二、安装chrome webdriver 1.查看谷歌浏览器版本 …

Excel:vba实现合并工作表(表头相同)

这个代码应该也适用于一些表头相同的工作表的汇总,只需要修改想要遍历的表,适用于处理大量表头相同的表的合并 这里的汇总合并表 total 是我事先创建的,我觉得比用vba代码创建要容易一下,如果不事先创建汇总表就用下面的代码&…

二十一、浮动(1 文本)

<!DOCTYPE html> <html> <head> <meta charset"UTF-8"> <title></title> <style> img{ widows: 100px; float: left;/*脱离文档流*/ …

BUG调试记录:C++中有符号类型和无符号类型在自动补位时的差异

BUG调试记录&#xff1a;C中有符号类型和无符号类型在自动补位时的差异 昨天和同事一起干活的过程中&#xff0c;项目中一个函数的计算结果出现了问题&#xff0c;即使我们反复对照流程图并进行了一系列的手算也没有发现任何编码上的差错&#xff0c;在逻辑上整个函数的编写是完…

【C++入门(7)】string

一、与C语言的联系 C的string类其实是从C语言的字符串演变过来的&#xff0c;是STL中用于处理字符串的一个容器。 在C语言中&#xff0c;字符串是以 \0 为结尾的一串字符&#xff0c;为了便于操作&#xff0c;C语言标准库中也提供了不少str系列的库函数供人使用。但是这些库函…

Java生成图片_基于Spring AI

Spring AI 优势 过去&#xff0c;使用Java编写AI应用时面临的主要困境是没有统一且标准的封装库&#xff0c;开发者需自行对接各个AI服务提供商的接口&#xff0c;导致代码复杂度高、迁移成本大。如今&#xff0c;Spring AI Alibaba的出现极大地缓解了这一问题&#xff0c;它提…

vue3之生命周期钩子

Vue 组件实例生命周期 每个 Vue 组件实例在创建时都需要经历一系列的初始化步骤&#xff0c;比如设置好数据侦听&#xff0c;编译模板&#xff0c;挂载实例到 DOM&#xff0c;以及在数据改变时更新 DOM。在此过程中&#xff0c;它也会运行被称为生命周期钩子的函数&#xff0c…

基于Arduino的燃气泄漏检测系统与自动切断调节器

Arduino LPG燃气泄漏检测系统与自动切断调节器 引言 大家好&#xff0c;今天我要分享一个非常实用的项目——Arduino LPG燃气泄漏检测系统与自动切断调节器。这个项目的重要性不言而喻&#xff0c;因为燃气泄漏是一个严重的安全隐患。在厨房烹饪时&#xff0c;我们可能会忘记…

望繁信科技成功签约国显科技 流程挖掘助力制造业智造未来

近日&#xff0c;上海望繁信科技有限公司&#xff08;简称“望繁信科技”&#xff09;成功与深圳市国显科技有限公司&#xff08;简称“国显科技”&#xff09;达成合作。国显科技作为全球领先的TFT-LCD液晶显示及Mini/Micro LED显示产品供应商&#xff0c;致力于为笔记本、手机…

设计模式02-桥接模式(Java)

4.2 桥接模式 **1.定义&#xff1a;**将抽象与实现分离&#xff0c;使它们可以独立变化。它是用组合关系代替继承关系来实现&#xff0c;从而降低了抽象和实现这两个可变维度的耦合度。 2.结构&#xff1a; 抽象化角色 &#xff1a;定义抽象类&#xff0c;并包含一个对实现化…

Spring Security无脑使用

步骤1&#xff1a;添加Spring Security依赖 在你的Spring Boot项目的pom.xml文件中&#xff0c;添加Spring Security的依赖&#xff1a; <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-security</art…

数据库的特点

数据库是有组织的&#xff0c;规范的把数据保存起来的。 怎么个组织的&#xff0c;规范的&#xff1f; 数据库的特点&#xff1a; 1.将数据放到数据表格&#xff08;二维表&#xff09;中&#xff0c;在将表格放到库中。 2.一个数据库中可以有多张表&#xff0c;每个表都有一…

【OpenCV】(四)—— 边界填充

在OpenCV的图像处理中&#xff0c;边界填充主要用于在图像边缘添加额外的像素。这项技术在多种图像处理任务中都有重要的应用&#xff0c;包括但不限于卷积操作、图像缩放、形态学操作等。 opencv中边界填充的主要方法为copyMakeBorder&#xff0c;其函数原型如下&#xff1a;…

分享一道逻辑题

1、有一个水无限多的是水塘.只有两个水瓶.一个5升一个6升.如何从水塘里用这两个水瓶取出3升水?

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-13

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-13 目录 文章目录 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-13目录1. The Cognitive Capabilities of Generative AI: A Comparative Analysis with Human Benchmarks2. WALL-E: World Alig…

Postman 如何测试入参是文件类型(File)参数接口

Postman 如何测试 File 类型参数 前提背景测试步骤1、打开 Postman 选择 POST 方法输入调用地址2、参数选择 Body 下的 form-data3、KEY 选择 File 选项&#xff0c;并填写 file 前提背景 springboot 项目&#xff0c;接口的参数是 File 类型&#xff0c;需要通过 Postman 测试…

链表题, 反转链表 , 链表的中间结点 , 删除链表的倒数第 N 个结点 , 移除链表元素

文章目录 206. 反转链表203. 移除链表元素876. 链表的中间结点LCR 021. 删除链表的倒数第 N 个结点 206. 反转链表 题目链接 思路&#xff1a; 将原链表的结点&#xff0c;从头到尾一个个地拿下来头插到一个新链表中&#xff0c;这个新链表起始时为一个空链表。 class Solutio…

同三维T80001HK4 四路4K30HDMI H.264编码器

4路同时编码&#xff0c;带4路3.5外置音频 同三维T80001HK4四路4K30HDMI H.264编码器 同三维T80001HK4用于高清视频信号&#xff08;4K30Hz&#xff09;编码及网络传输的硬件设备&#xff0c;采用最新高效H.264高清数字视频压缩技术&#xff0c;具备稳定可靠、高清晰度、低码率…

408 14——42题

题目&#xff1a; 某网络中的路由器运行OSPF路由协议&#xff0c;题42表是路由器R1维护的主要链路状态信息(LSI)&#xff0c;题42图是根据题42表及R1的接口名构造出来的网络拓扑。 请回答下列问题。 1)本题中的网络可抽象为数据结构中的哪种逻辑结构? 2)针对题42表中的内容&am…