基于GPT的智能客服落地实践

news2024/10/26 20:56:07

📍前言

在日常生活中,「客服」这个角色几乎贯穿着我们生活的方方面面。比如,淘宝买东西时,需要客服帮你解答疑惑。快递丢失时,需要客服帮忙找回。报名参加培训课程时,需要客服帮忙解答更适合的课程……

基于此背景下,可以了解到客服在我们生活中的重要性。传统的客服更多是以「一对一人工回复」的方式,来帮我们解答疑惑。那在以GPT为例的各类大模型爆火之后,纷纷涌现出一些新奇的「智能客服」。那在下面的文章中,就将来聊聊,关于大模型在智能客服领域相关的一些落地方案。

以下文章整理自 稀土开发者大会2023·大模型与AIGC-掘金 第二部分,讲解关于 Think Academy 公司,基于GPT的智能客服落地实践方案。

一、💬项目背景

该公司想要做这个项目的背景如下:

  • 从业务场景出发:希望提供一个体验更好,响应更实时的智能客服。
  • 从技术层面出发:跟进新技术,以及验证大模型在生产环境下的可应用性和可塑性。

基于上面的背景信息,分析出即将要做的智能客服系统,要满足以下几个场景:

  • 回答教育机构的教学理念、如何上课等类似静态的相关咨询。
  • 当用户问到和入学测相关的问题时,会去引导用户去添加相关的教学主任,之后做相关的转化的动作。
  • 希望大模型只回答业务相关的问题。

image.png

有了上面的基本信息铺垫以后,接下来来介绍,关于智能客服系统的第一个版本。

二、💭问答客服V_1.0 — 基于企业专有知识库的客服系统

技术选型、方案设计、数据表现及缺陷

1、如果让大模型学会特定领域知识

(1)两种学习方式

首先在刚开始,我们调研到了有两种预训练方式:Fine-tuning LearningIn-context Learning

Fine-tuningIn-context Learning是机器学习中用于调整预训练模型的两种不同方法。它们之间的主要差异有:

Fine-tuning(微调)👇🏻:

  1. 定义:在预训练模型的基础上,用特定任务的数据集进行再训练,调整模型的参数以适应新任务。
  2. 数据需求:需要一定量的标记数据来进行微调。
  3. 训练时间:根据任务的复杂性和数据量的大小,微调可能需要一定的时间和计算资源。
  4. 泛化能力:微调后的模型在特定任务上表现很好,但可能在其他任务上表现不佳。
  5. 应用范围:适用于有足够数据的任务,并且希望模型在这个特定任务上达到最佳性能。
  6. 灵活性:一旦微调完成,模型就固定了,想要适应新任务需要再次微调。

In-context Learning(上下文学习)👇🏻:

  1. 定义:在不改变预训练模型的参数的情况下,通过向模型提供包含任务信息的上下文来使其执行特定任务。
  2. 数据需求:不需要额外的训练数据,但是需要为每个任务设计合适的上下文。
  3. 训练时间:不需要再训练,可以立即用于各种任务。
  4. 泛化能力:可以应用于多种任务,但性能可能不如微调后的模型。
  5. 应用范围:适用于数据稀缺和任务多样的场景。
  6. 灵活性:非常灵活,可以通过改变上下文来快速适应新任务。

总的来说,如果你有足够的标记数据,并且希望在特定任务上获得最佳性能,微调可能是更好的选择。而如果你需要模型适应多种任务,并且希望迅速部署,上下文学习可能更合适。

因此,基于上述两种学习方式的调研后,最终V1.0版本选择了 In-context Learning 的预训练方式。

(2)in-context learing

确定了上面这种预训练模式之后,接下来,就要思考,Prompt该怎么进行组织。可以理解为,给定一个题目,如何让大模型有相应的回答。

那在解决这个问题的过程中,就需要去攻克之后三个问题:

  • 语料要如何组织
  • 如何匹配到和用户问题相关的语料
  • token如何进行限制

2、V1.0系统设计

有了上面的问题,接下来就是攻克上面这三个问题。

(1)知识库的搭建

第一个是解决关于语料的问题。在V1.0版本中,采用的是人为清洗数据的方式。

可以看下图👇🏻,左边是原始语料,会先先人为地对这些数据先清洗一下,得到最后要使用的数据。

之后呢,就是把清洗后的数据,转换为右边的结构化语料

(2)全局流程图

接着是攻克第二和第三个问题,请看关于该系统 V1.0 版本的全局流程图:

3、线上数据表现

V1.0系统搭建完成了,下面来看看线上的数据表现。可以看下左边这张图,里面有关于相关问题回复评分不相关问题评分

最终得出的结论是:

  • 相关问题评分 → 1分2分的问题还是比较多,1分case基本算是一本正经地胡说八道了。
  • 不相关问题评分 → 整体表现还可以。

4、设计缺陷

在分析了线上数据之后,V1.0版本的设计总结出有以下缺陷:

  • 需要扩展更多的覆盖场景,如老师咨询、课程咨询等。
  • 动态信息的维护麻烦,给业务增加过多的维护成本。比如很多短期的活动、每学期的上课课程、上课时间等内容都会频繁地变动,这无形中给业务方带来了很大的麻烦。
  • 部分情况下,ChatGPT存在自由发挥的情况,不完全可控。

三、🗯问答客服V_2.0 — 基于指令识别的智能客服系统

技术选型、AutoGPT原理介绍、方案设计、数据表现

分析了设计缺陷之后,接下来就继续迭代了V2.0版本,可以说是从问答客服到智能客服的一个转变。

1、问答客服升级为智能客服

V2.0总结下来就是,基于指令识别的智能客服系统。

基于V1.0的设计缺陷,到了设计V2.0时,第一想法就是去扩展相关的语料库。以此让GPT回答公司更多的业务问题和更多的教学场景。

但在实践过程中发现,随着语料的数据量增加,会导致匹配准确率直线下降。又或者,如果语料的相似度很高,也会导致匹配的准确率直线下降。比如老师信息课程信息,有可能只是两个老师的名字不同,但其他内容都相同。这也就是下图提到的方案一。

就在烦于要用什么方案来解决时候,AutoGPT问世了,于是借助AutoGPT的设计思想,也就有了下面方案二的方案。

2、AutoGPT原理介绍

AutoGPT的原理是基于预训练语言模型,使用大量的语料库进行训练,从而学习到自然语言的规律和特征,进而生成符合语法和语义规则的文章。AutoGPTGPT的改进版,通过自动搜索算法来优化GPT的超参数,从而提高其在各种任务上的表现。

AutoGPT使用多层的自注意力机制前馈神经网络,可以有效地处理长文本序列,从而提高生成文章的质量和准确性。在生成文章时,AutoGPT会根据输入的文本内容,通过预训练模型进行编码,然后使用解码器生成符合语法和语义规则的文章。

3、AutoGPT 的 Prompt组织形式

AutoGPT也是基于Prompt来进行组织的,总结下来主要有三种组织形式:

  • 内置能力
  • 数据结构化
  • 记忆缓冲区

(1)内置能力

AutoGPT内置了很多工程上的能力,比如:

  • Google Search
  • 文件的读写
  • 类似github相关的代码拉取
  • 等等……

这些都定义在AutoGPT它内部的程序里面。

(2)数据结构化

第二个是数据结构化。相当于AutoGPT要求ChatGPT的返回必须是一个JSON结构。

(3)记忆缓冲区

AutoGPT的记忆缓冲区是指用于存储临时数据或信息的区域。在AutoGPT中,记忆缓冲区可能用于存储生成的文本片段、上下文信息或其他临时数据,以便在生成过程中使用。这样的缓冲区有助于AutoGPT在处理长文本序列时保持连贯性和一致性,从而提高生成文章的质量和准确性。

4、AutoGPT流程图

了解了上面AutoGPT的基本原理三种组织形式以后,下面来看AutoGPT的流程图。如下图所示👇🏻:

5、V_2.0 设计过程

(1)方案设计

该公司参考了上面AutoGPT的思想,就有了V2.0的方案设计。

如下图所示,最左边就是整个业务系统的提示词,其中内置了几种命令。比如:第一个是获取老师的命令、第二个是获取课程信息的命令、第三个是兜底的命令(如果走的逻辑不是前面两种类型的命令,那么就会去执行原来V1.0方案的命令,让GPT「基于知识库去回答用户问题」的命令。)

(2)整体流程

下面我们来看下V2.0的整体实现流程,如下图所示:

(3)调试数据

最后来分析下V2.0方案中,调试数据的整体过程表现。如下图所示:

四、📢总结

迭代过程中的一些心得和思考

1、思考与总结

经过上面两个版本的迭代,得到了一些总结。如下所示:

开发思维 —— 相信大模型很聪明,并尽量让它做更多的事情。

模型能力 —— 详细了解各模型和参数的使用,以及prompt组织形式的设计。

效果调优 —— 根据业务场景,明确调优方案和目标,做好预期管理。

2、讨论

  • AutoGPT在调用的过程中,会存在死循环

五、🐣彩蛋One More things

  • 稀土开发者大会2023·大模型与AIGC-掘金

  • 🎬 PPT下载&回放链接|2023稀土开发者大会大模型与 AIGC 分论坛

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2224180.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RTE 2024 隐藏攻略

大家好!想必今年 RTE 大会议程大家都了解得差不多了,这将是一场实时互动和多模态 AI builder 的年度大聚会。 大会开始前,我们邀请了参与大会策划的 RTE 开发者社区和超音速计划的成员们,分享了不同活动的亮点和隐藏攻略。 请收…

InnoDB 存储引擎<一>InnoDB简介与MySQL存储架构及相关数据结构

目录 回顾MySQL架构 InnoDB简介 ​MySQL存储结构 回顾MySQL架构 对MySQL架构图的总结: MySQL服务器是以网络服务的方式对外提供数据库服务的,我们使用的应用程序以及客户端统称为外部程序。 外部程序通过发送网络请求的方式来连接MySQL服务器,这时首先每…

SpringBoot启动报错java.nio.charset.MalformedInputException: Input length =1

启动springboot项目时,出现了以下报错: defaultPattern_IS_UNDEFINEDdefaultPattern_IS_UNDEFINEDdefaultPattern_IS_UNDEFINEDjava.lang.IllegalStateException: Failed to load property source from location classpath:/application-local.yamlat o…

使用pytest单元测试框架执行单元测试

Pytest 是一个功能强大且灵活的 Python 单元测试框架,它使编写、组织和运行测试变得更加简单。以下是 Pytest 的一些主要特点和优点: 简单易用:Pytest 提供了简洁而直观的语法,使编写测试用例变得非常容易。它支持使用 assert 语…

《皮革制作与环保科技》是什么级别的期刊?是正规期刊吗?能评职称吗?

​问题解答 问:《皮革制作与环保科技》是不是核心期刊? 答:不是,是知网收录的正规学术期刊。 问:《皮革制作与环保科技》级别? 答:国家级。主管单位:中国轻工业联合会 …

软考:CORBA架构

CORBA过时了吗 CORBA指南 个人小结: IPC,进程间通信,Socket应用在不同机器之间的通信 RPC是一种技术思想而非一种规范 但站在八九十年代的当口,简单来说,就是我在本地调用了一个函数,或者对象的方法&…

uvm_info、uvm_warning,uvm_error、uvm_fatal

1、warning/error/fatal调试语句 调试语句除了uvm_info,UVM内部根据问题的严重性(severity)由低到高,还引入了uvm_warning/uvm_error/uvm_fatal。 它们也是UVM预定义的宏,格式跟umv_info很像,只是不再需要…

int main(int argc,char* argv[])详解

#include <stdio.h> //argc 是指命令行输入参数的个数; //argv[]存储了所有的命令行参数, //arg[0]通常指向程序中的可执行文件的文件名。在有些版本的编译器中还包括程序文件所在的路径。 //如:"d:\Production\Software\VC_2005_Test\Win32控制台应用程序\Vc_T…

Kafka-Windows搭建全流程(环境,安装包,编译,消费案例,远程连接,服务自启,可视化工具)

目录 一. Kafka安装包获取 1. 官网地址 2. 百度网盘链接 二. 环境要求 1. Java 运行环境 (1) 对 java 环境变量进行配置 (2) 下载完毕之后进行解压 三. 启动Zookeeper 四. 启动Kafka (1) 修改Conf下的server.properties文件&#xff0c;修改kafka的日志文件路径 (2)…

软件分享丨Marktext 编辑器

Marktext是一款开源免费的Markdown编辑器&#xff0c;它具有简洁优雅的界面设计和强大的功能&#xff0c;支持多种Markdown语法&#xff0c;包括表格、流程图、甘特图、数学公式、代码高亮等。Marktext还支持导出HTML和PDF格式的文档&#xff0c;非常适合需要编写Markdown文档的…

sersync实时同步部署案例

目录 sersync介绍 案例信息 操作步骤 服务端部署 客户端部署 创建存储目录 安装sersync 修改配置文件 启动服务 停止服务 测试 sersync介绍 sersync是一个基于inotifyrsync的实时文件同步工具&#xff0c;通过监控目录的变动达到实时同步的目的。 案例信息 拓扑…

【微软商店平台】如何将exe打包上传微软商店

打开微软合作者中心&#xff1a;https://partner.microsoft.com/en-us/dashboard/home点击App and Games板块可以创建项目。 3. 重新生成包含私钥的自签名证书 运行以下命令&#xff0c;确保生成的证书包含私钥&#xff1a; New-SelfSignedCertificate -Type CodeSigning -Su…

Git的初次使用

一、下载git 找淘宝的镜像去下载比较快 点击这里 二、配置git 1.打开git命令框 2.设置配置 git config --global user.name "你的用名"git config --global user.email "你的邮箱qq.com" 3.制作本地仓库 新建一个文件夹即可&#xff0c;然后在文件夹…

从零开始:构建一个高效的开源管理系统——使用 React 和 Ruoyi-Vue-Plus 的实战指南

✅作者简介&#xff1a;2022年博客新星 第八。热爱国学的Java后端开发者&#xff0c;修心和技术同步精进。 &#x1f34e;个人主页&#xff1a;Java Fans的博客 &#x1f34a;个人信条&#xff1a;不迁怒&#xff0c;不贰过。小知识&#xff0c;大智慧。 &#x1f49e;当前专栏…

QT界面开发:图形化设计、资源文件添加

设计界面介绍 此时我们创建项目时就可以选择添加UI选项了。 添加完之后&#xff0c;我们可以看到&#xff0c;文件中多出了一个存放界面文件的目录&#xff0c;下面有个.ui的界面文件。甚至pro的项目文件中也会添加一项内容。 我们点击界面文件中的.ui文件&#xff0c;我们可以…

mono源码交叉编译 linux arm arm64全过程

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github&#xff1a;codetoys&#xff0c;所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的&#xff0c;可以在任何平台上使用。 源码指引&#xff1a;github源…

有道在线翻译外,这三款翻译工具值得一试!

在众多翻译工具中&#xff0c;有道在线翻译是很多小伙伴都会用的。而市场上当然也有很多好用的翻译工具&#xff0c;这里就来给大家介绍几个&#xff01; 福昕在线翻译 直达链接&#xff1a; fanyi.pdf365.cn/ 操作教程&#xff1a;立即获取 这也是一款在线翻译工具。它以…

解决 VScode 每次打开都是上次打开的文件问题

每次使用 VScode 打开总是上次的文件&#xff0c;可以简单设置即可&#xff0c;记录一下。 VScode Visual Studio Code&#xff08;简称VSCode&#xff09;是一个由微软开发的免费、开源的代码编辑器。它支持多种编程语言&#xff0c;并提供了代码高亮、智能代码补全、代码重构…

【分布式知识】分布式对象存储组件-Minio

文章目录 什么是minio核心特点&#xff1a;使用场景&#xff1a;开发者工具&#xff1a;社区和支持&#xff1a; 核心概念什么是对象存储&#xff1f;MinIO 如何确定对对象的访问权限&#xff1f;我可以在存储桶内按文件夹结构组织对象吗&#xff1f;如何备份和恢复 MinIO 上的…

【力扣 + 牛客 | SQL题 | 每日4题】牛客大厂笔试真题SQLW6, W7, W8

1. 牛客大厂笔试真题SQLW6&#xff1a;统计所有课程参加培训人次 1.1 题目&#xff1a; 描述 某公司员工培训信息数据如下&#xff1a; 员工培训信息表cultivate_tb(info_id-信息id,staff_id-员工id,course-培训课程)&#xff0c;如下所示&#xff1a; 注&#xff1a;该公…