LLM应用实战:当图谱问答(KBQA)集成大模型(三)

news2025/1/4 17:12:49

1. 背景

最近比较忙(也有点茫),本qiang~想切入多模态大模型领域,所以一直在潜心研读中...

本次的更新内容主要是响应图谱问答集成LLM项目中反馈问题的优化总结,对KBQA集成LLM不熟悉的客官可以翻翻之前的文章《LLM应用实战:当KBQA集成LLM》、《LLM应用实战:当KBQA集成LLM(二)》。

针对KBQA集成LLM项目,该系列文章主要是通过大模型来代替传统KBQA的相关功能组件,实现知识图谱问答,以及如何针对问答效果、多轮对话、响应时间等优化工作总结,是妥妥的干货篇,感兴趣的客官可以持续关注!

本次的主要优化点在于如下:

1. 响应时间

项目的验收标准是流式首字的响应时间在3s内,而当前服务的平均响应时间在5s-7s之间,不符合项目验收标准。

2. 多轮对话

由于当前多轮对话中的指代消解、默认实体或概念对齐均由大模型处理,由于基座大模型的不稳定性,存在偶现的多轮对话中的对象指代错误的情况。

2. 响应时间优化

2.1 响应时间统计

基于前文展示的流程图,针对每个节点进行单次响应时间的统计,结果如下:

模块

耗时

图谱初始化

558ms(仅第一次会耗时)

候选schema召回

49ms

对齐prompt调用LLM完整响应时间

2800ms

对齐校准

15ms

对话prompt调用LLM首字响应时间

1800ms

可以发现两次调用大模型的响应时间耗时基本都在3s,因此重点对LLM调用环节进行优化。

优化方案包括三方面:prompt长度缩减、LLM输出结果简化、使用量化版LLM

2.2 prompt长度缩减

经过分析比对,不同文本长度,LLM的首字响应时间差别较大,尤其是增加安全机制的非公开LLM。

原因也众所周知,LLM推理过程是基于前文预测下一个token,纵然增加了KV缓存机制、FA2机制,较长的prompt首字响应时间必然大于较短prompt,因此可以针对prompt长度进行缩减,以提高LLM首字响应时间。

由于项目中对齐prompt的平均字符长度为5000字左右,且需要等待LLM全部输出结果后,方才进行后续流程,因此本次优化重点优化对齐prompt中的示例部分。

提供的fewshot示例大概40+条,且大部分示例和用户当前问题不相关,因此将fewshot示例向量化进行存储,当用户提问时,基于语义相似度将问题与fewshot示例进行pk,筛选出语义相似的10条示例作为对齐prompt中的fewshot,以达到缩减prompt长度的效果。

实验结果表明,将40条fewshot减小为10条,响应时间提高0.8s左右

对话prompt没有进行优化,因为对话prompt不需要等待全部结果输出,只需要首字响应并流式输出即可。

​​​​​​​2.3 LLM输出结果简化

LLM输出结果越长,输出全部结果的时间就越长,所以针对对齐prompt的输出长度也做了一些优化,虽然响应时间提升不高

原始对齐prompt调用LLM的输出如下:

(属性-等于-体重)且(属性值-等于-最大);(属性-等于-食性)且(属性值-等于-肉食性);(概念-等于-恐龙)

主要优化点在于:

  1. 属性、实体、概念、属性值分别用P, E, C, V表示
  2. 属性、实体、概念中三元组删除“等于”
  3. 属性值中的等于用eq代替
  4. 且、或分别用&, |表示

因此优化后的LLM输出结果如下:

(体重)&(V-eq-最大);(P-食性)&(V-eq-肉食性);(C-恐龙)

​​​​​​​2.4 大模型量化​​​​​​​

先前使用的非量化版的LLM,更换了INT 8量化版的LLM后,LLM的首响及完整响应时间有了质的提升。

其中对齐prompt完整输出结果由先前的2.8s提升至1.6s,对话prompt的首响时间由1.8s提升至0.6s

由于使用的是私有化部署的量化版,中间没有安全审核机制,再加上量化的有效推理,所以响应时间提升非常明显。

​​​​​​​2.5 思考

经过上述三方面的优化后,平均响应时间2.1s-2.9s之间,满足项目的验收标准。但引入的问题还是需要进一步验证。如prompt输入长度缩减、LLM输出结果长度缩减、切换量化版LLM是否引入问答准确性的降低呢?

针对该问题,基于先前整理的测试集,进行测试验证,准确率层面效果基本保持不变,说明以上优化方法有效!

3. 多轮对话效果优化

3.1 示例

怎么辨认慈母龙

它有啥能力

分布在那些地方?

海百合是百合么?

那它分布在哪里?

上述示例为多轮问答,在测试验证中,运行10次该多轮问答,其中会出现2次”那它分布在哪里?”中的”它”指代到了”慈母龙”,而非正确的”海百合”,因为对齐prompt调用LLM后,输出了“(E-慈母龙)&(P-分布区域)”原因当然可以归咎于LLM的基础能力不足,但如何进行优化呢?

尝试了两种方案:a. 对齐prompt中增加历史参考内容;b. 当前问题与历史问题通过LLM比较,判定是否二者存在关联性。

3.2 历史参考内容

想法也非常简单,LLM直接针对历史的问题和答案进行总结,大概率会存在指代不清的问题,那么如果将历史的问题以及对应指代的实体或概念作为参考项,提供给LLM,那么LLM就多了一层参考,进而可以提高指代的准确性。

历史参考内容引入到对齐prompt部分内容如下:

第一个问题prompt, 历史输入为空,ref也为空

历史输入:

```

```

现在回答:

in: 怎么辨认慈母龙

out:

第二个问题prompt, 存在第1个问题及实体,当前问题的参考ref为”慈母龙”

历史输入:

```

in: 怎么辨认慈母龙

ref: 慈母龙

```

现在回答:

in: 它有啥能力

ref: 慈母龙

out:

第三个问题prompt, 存在第1,2个问题及实体,当前问题的参考ref仍为”慈母龙”

历史输入:

```

in: 怎么辨认慈母龙

ref: 慈母龙

in: 它有啥能力

ref: 慈母龙

```

现在回答:

in: 分布在那些地方?

ref: 慈母龙

out:

第四个问题prompt, 存在第1,2,3个问题及实体,当前问题的参考ref也为”慈母龙”,即将之前的实体继续带入下一轮,大模型会根据当前问题,结合历史输入,进行实体抽取

历史输入:

```

in: 怎么辨认慈母龙

ref: 慈母龙

in: 它有啥能力

ref: 慈母龙

in: 分布在那些地方?

ref: 慈母龙

```

现在回答:

in: 海百合是百合么?

ref: 慈母龙

out:

第五个问题prompt, 存在前四个问题及实体,ref当前为”海百合”

历史输入:

```

in: 怎么辨认慈母龙

ref: 慈母龙

in: 它有啥能力

ref: 慈母龙

in: 分布在那些地方?

ref: 慈母龙

in: 海百合是百合么?

ref: 海百合

```

现在回答:

in: 那它分布在哪里?

ref: 海百合

out:

这样即使是20轮以上的问答,LLM也能根据当前ref进行分析比较,保障当前问题描述的实体或概念

3.3 当前问题与历史问题关联性分析

理论上通过引入历史参考内容可以有效解决多轮对话中的指代消解问题,但由于LLM本身泛化能力问题,偶尔会出现ref引入错误的情况,例如,上述第二个问题,当前的ref引入为”海百合、慈母龙”,如何针对该问题进行优化呢?

原因可能是历史问题存在多个时,大模型偶尔无法按照指令针对历史问题进行语义分析,因此可以将当前问题与历史中最后一次出现实体或概念的问题进行关联性分析,比较是否描述的是同一个对象,进而基于分析结果,将ref中的内容进一步约束。即,如果当前问题与历史最后一次出现的问题的实体相关时,则引入历史的实体,否则不引入历史实体。

举个例子说明下,”怎么辨认慈母龙”和”分布在那些地方?”存在关联性(默认第二个问题不存在实体,自动引用前一个问题的实体),则ref为”慈母龙”,而”怎么辨认慈母龙”和”海百合是百合么?”不相关,则ref中只保留”海百合”。

关联性分析也是通过prompt调用LLM实现,对应的prompt内容如下:

你是一个关于自然博物馆的多轮对话的识别器,主要用于识别当前问题与历史问题是否在讨论同一个或一组对象,以便进一步区分多轮对话的边界,请参考如下要求和示例进行输出:

1. 输出只能包含"是", "否",禁止输出其他内容;

2. 一定要结合历史的问题,与当前问题进行语义层面分析与比较,判断当前问题是否有历史的问题是否在讨论同一个或一组对象,如存在指代消解等;

3. 如果输出为"是",表示当前问题与历史问题存在关联性,则表示二者共同;

4. "q"表示问题,"a"表示输出;

5. 如果当前问题存在"它"或"它们",表示存在指代情况,则输出"是";

6. 如果当前问题没有明确任何询问的对象,表示默认使用历史讨论的对象,输出"是";

7. 如果当前问题存在具体的询问对象,且与历史问题不存在指代问题,则输出"否";

示例如下:

```

示例

q: 怎么辨认慈母龙

q: 有啥能力?

a: 是

示例

q: 怎么辨认慈母龙

q: 分布在那些地方?

a: 是

示例

q: 怎么辨认慈母龙

q: 海百合是百合么?

a: 否

示例

q: 海百合是百合么?

q: 那它分布在哪里?

a: 是

示例

q: 霸王龙的体长?

q: 梁龙有何生活习性?

a: 否

```

现在请根据上述要求及示例,针对以下问题进行关联性分析:

q: {}

q: {}

a:

4. 总结

一句话足矣~

本文主要是针对KBQA方案基于LLM实现存在的问题进行优化,主要涉及到响应时间提升优化以及多轮对话效果优化,提供了具体的优化方案以及相应的prompt

读者可以按照这套方案进行其他KBQA的构建尝试,如有问题,可私信沟通。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1814372.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android 14 系统启动流程 之 启动init进程、启动Zygote进程

Android 14 系统启动流程 之 启动init进程、启动Zygote进程 废话不多说,先上图,不清楚的可以在评论区留言。

计算机体系结构学习(一)

计算机体系结构的发展 20 世纪五六十年代, 由于工艺技术的限制, 计算机都做得很简单, 计算机体系结构主要研究怎么做加减乘除, Computer Architecture 基本上等于 Computer Arithmetic。 20 世纪七八十年代的时候, 以精简指令集 (Reduced Instruction Set Computer, 简称 RISC…

AI大模型战场:通用大模型与垂直大模型的角逐

随着人工智能技术的迅猛发展,AI大模型已成为推动科技进步的重要力量。然而,在AI大模型的战场上,通用大模型与垂直大模型之间的分化日益明显。两者各有其独特的优势和潜力,在不同的应用场景中发挥着重要作用。那么,在这…

SSM 离散数学线上考试系统-计算机毕业设计源码83059

摘 要 随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,高校当然也不例外。离散数学线上考试系统是以实际运用为开发背景,运用软件工程原理和开发方法,采…

centos下创建raid6磁盘阵列

在CentOS系统中创建RAID 6阵列,可以使用mdadm工具。 以下是创建RAID 6阵列的基本步骤和示例代码: 安装mdadm工具(如果尚未安装): sudo yum install mdadm 假设你有至少四个以上的磁盘设备(例如 /dev/sdi…

信创4.0|暴雨出席空间智能软件技术交流会

6月19日,由自然资源部地理信息系统技术创新中心、中国测绘学会软件与信息技术服务工委会、内蒙古自治区测绘学会共同主办的“空间智能软件技术交流会暨自然资源数字化治理交流会”在呼和浩特举办,500余位嘉宾汇聚一堂,就空间智能赋能数字经济…

MyBatis的配置文件,即:src->main->resources的配置

目录 1、properties 标签 1.1 mybatis-config.xml 1.2 db.properties 1.3 在SqlMapConfig.xml 中 引入数据库配置信息 2、typeAliases 标签 2.1 定义别名 2.2 使用别名 3、Mappers标签 作用:用来在核心配置文件中引入映射文件 引入方式,有以下…

vue生成二维码中间自定义logo并截图分享

需求描述&#xff1a;在公众号中&#xff0c;生成二维码&#xff0c;并在二维码中央添加自定义logo&#xff0c;然后生成一张分享给好友的 二维码图片。 一、用到的依赖包 npm install --save html2canvas <script srchttps://cdn.staticfile.org/jquery/2.1.1/jquery.min…

【APP移动端自动化测试】第一节.环境配置和adb调试工具

文章目录 前言一、Java环境搭建二、AndroidSDK环境搭建三、Android模拟器安装四、adb调试工具基本介绍 4.1 adb构成和基本原理 4.2 adb获取包名&#xff0c;界面名 4.3 adb文件传输 4.4 adb获取app启动时间 4.5 adb获取手机日志 4.6 adb其他有关…

室内、户外安防监控超低功耗24g人体雷达感应模块,智能门铃、灯光控制新体验

在当今这个智能科技日新月异的时代&#xff0c;雷达感应模块正逐渐成为智能家居领域的一颗璀璨新星。其超低功耗、无误触、无漏触等特性&#xff0c;以及在户外环境下能够智能过滤环境干扰的独特优势&#xff0c;使得雷达感应模块在智能门铃、灯光照明等方面的应用越来越广泛。…

【C++】list 容器的增删改查---模拟实现(图例超详细解析!!!)

目录 一、前言 二、 list 容器的模拟实现思 ✨ 模块分析 ✨ 作用分析 三、list的节点类设计 四、list 的迭代器类设计 ⭐ 迭代器类--存在的意义 ⭐ 迭代器类--模拟实现 &#x1f4a6; 模板参数 和 成员变量 &#x1f4a6; 构造函数 &#x1f4a6; 运算符的重载 &…

如何一键式完成等级logistic回归分析?

Logistic回归分析用于研究X对Y的影响&#xff0c;并且要求Y必须为分类数据&#xff0c;并且根据Y的分类不同&#xff0c;需要选用不同的模型。 如果Y为二分类&#xff0c;如患病和不患病&#xff0c;那么普通的二元logistic回归就可以解决问题;如果Y为有序多分类&#xff0c;如…

如何成为嵌入式系统工程师?

各位朋友&#xff0c;如果你们有意向投身于嵌入式开发领域&#xff0c;那么强烈建议你们在软件和硬件两个方面均展开深入且全面的学习。 嵌入式计算机作为嵌入式系统的核心技术支撑&#xff0c;其是直接面向用户、产品以及应用的&#xff0c;无论是软件还是硬件方面都能发挥重要…

Windows10安装配置Docker客户端和WSL2与Hyper-V虚拟机

一、需求说明 需要在Windows系统中安装配置Docker的客户端,方便直接管理配置docker镜像容器内容。 二、Windows10安装Docker客户端步骤 2.1、下载安装Docker客户端 对于Windows 10以下的用户,推荐使用Docker Toolbox Windows安装文件:http://mirrors.aliyun.com/docker-…

附件采集文件类型识别方案

背景 咱们做爬虫的或多或少都会遇到附件下载&#xff0c;一般情况站点提供的附件链接会直接声明文件的类型&#xff0c;但是有些提供的只是一个api&#xff0c;然后触发下载时再返回附件文本&#xff0c;这个时候我们是没法直接知道文件类型的&#xff0c;而我们使用requests下…

为了能够实现躺在家里办公,我发现了teamOS,免费搞定在线编辑,还能满足多人协同编辑,太香了

在快节奏的现代生活中&#xff0c;传统的办公室模式似乎变得越来越局限。 在出差途中&#xff0c;在一个个的临时会议上&#xff0c;我们都越来越需要一个更为灵活、高效的工作模式。 想要实现随时随地打开文件&#xff0c;与团队成员实时协作&#xff0c;共同编辑文档&…

on ethernetPacket事件函数接收报文时标准的处理流程

on ethernetPacket可以用来接收指定报文,并根据一些判断条件,比如目标MAC地址和IP地址判断报文是否是发给"我"的。 比如想通过on ethernetPacket *来接收发送给02:00:00:00:00:17和192.168.0.17的SYN报文。CAPL代码可以这样写: variables {ethernetPacket …

Vue.js结合ASP.NET Core构建用户登录与权限验证系统

1. 环境准备2. 创建项目3. Vue配置步骤一: 安装包步骤二: 配置文件步骤三: 页面文件 4. 后台配置 在本教程中&#xff0c;我将利用Visual Studio 2022的强大集成开发环境&#xff0c;结合Vue.js前端框架和ASP.NET Core后端框架&#xff0c;从头开始创建一个具备用户登录与权限验…

SwiftUI 中的自定义Shape

在SwiftUI中&#xff0c;Shape协议允许开发者定义可重用的图形&#xff0c;这些图形可以用于绘制界面元素&#xff0c;如按钮、背景、边框等。通过实现 Shape 协议&#xff0c;可以创建完全自定义的图形&#xff0c;并控制其绘制方式。本文将详细介绍如何在 SwiftUI 中创建自定…

Qt-Advanced-Docking-System的学习

Qt-Advanced-Docking-System使用说明_cdockmanager-CSDN博客 示例1&#xff1a; #ifndef MAINWINDOW_H #define MAINWINDOW_H#include <QMainWindow> #include "DockManager.h" #include "QtDock/DockAreaWidget.h" namespace Ui { class MainWind…