大模型在银行业客服中心的应用

news2024/9/28 9:30:58

随着金融科技领域的不断发展,金融机构改变了传统方式,将更多服务从线下转移到线上,为了提升客户体验和效率,金融机构不断探索自然语言处理、机器学习等技术手段来优化客服服务,其中大模型技术被广泛应用,成为当前最热门的研究方向之一,是目前通往AGI的最佳实现方式。大模型最早的关注度源于NLP领域,随着多模态能力的演进,CV领域及多模态通用大模型也逐渐成为市场发展主流。

本报告主要针对当前最为热门的大模型进行研究和分析,重点关注了它们在自然语言处理领域中具有的突出表现以及客服中心未来的应用前景。同时,本报告还探讨了目前大语言模型所面临的挑战和限制,并提出了相应的优化建议,旨在为银行业客服中心大模型研究提供参考。

一、 大模型发展背景

(一) 大语言模型诞生阶段

• 2017 年谷歌推出用于处理自然语言任务的 Transformer 神经网络架构。

• 2018 年 OpenAI 发布GPT - 1 。

(二) 大语言模型探索阶段

• 2019 年 OpenAI 发布GPT - 2 部分开源模型。

• 2019 年谷歌推出BERT模型。

• 2020 年百度推出可理解语义的ERNINE2.0。

• 2021 年 OpenAI 推出能实现文本生成图像的DALL-E模型。

• FaceBooK 推出CLIP模型。

• 华为发布盘古大模型。

• OpenAI 推出Codex。

(三) 大语言模型爆发阶段

• 2022 年 OpenAI 推出 ChatGPT-3.5 。

• 2023 年 OpenAI 正式发布 GPT-4 预训练大模型, 实现图像视频。相比于GPT-3.5性能表现显著提升,在一些专业和学术领域上已经达到了人类水平。GPT-4具有一定的多模态能力,能够接收图文结合的输入,并输出文本回复,应用范围得到进一步拓展。

• 微软基于ChatGPT 发布 New Bing 。微软宣布将GPT-4接⼊Office全家桶。

• FaceBook 发布LLaMA - 13B。

• 谷歌更新Bard并推出PalM 2 模型。

• 复旦团队发布MOSS。

• 阿里发布大语言模型“通义千问”,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能,以及外部增强 API 。目前钉钉、天猫精灵等产品已率先接入通义千问测试,高德地图、饿了么、盒马、优酷、淘票票等产品也将有序接入通义千问大模型。阿里巴巴所有产品未来将接入大模型,同时将与OPPO、吉利、智己等企业展开合作。

• 商汤发布 “日日新SenseNova” 大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等大模型及能力 , 包括语言大模型 “商量SenseChat” 和一系列生成式AI应用。

• 华为推出的盘古大模型则聚焦AI for Industry,赋能千行百业应用落地,有望推动人工智能开发从 “作坊化” 到 “工业化”升级。自研ModelArts 2.0 AI开发平台、昇腾 910等算力芯片、兆瀚 A5900-A系列等AI 训练服务器 。昇腾AI产业生态已发展 20+家硬件合作伙伴,1000+家软件伙伴 。

• 腾讯混元AI大模型。HunYuan 协同腾讯预训练研发力量,旨在打造业界领先的AI 预训练大模型和解决方案 。腾讯大模型可接入微信、游戏、短视频、广告、TO B端等优势业务,腾讯在 SaaS 加速器、微信等业务均有大量合作伙伴 。

• 百度“文心一言”中文理解能力强,并且支持从文本生成图像、音频和视频,多模态能力。百度AI大底座可提升千卡并行加速比90%以上。目前已发布36个大模型以及 11个行业大模型,生态已凝聚500 万开发者。

二、 大模型发展历程和架构

(一) 大模型发展历程

从基于规则到基于人的意识,大型语言模型是技术进步的必然产物。自然语言处理发展到大型语言模型的历程可分为五个阶段:规则、统计机器学习、深度学习、预训练、大型语言模型。从1956年到1992年,基于规则的机器翻译系统在内部把各种功能的模块串到一起,由人先从数据中获取知识,归纳出规则后教给机器,然后由机器执行这套规则,该阶段为规则阶段;从1993年到2012年是统计机器学习阶段,机器翻译系统可拆成语言模型和翻译模型,该阶段相比上一阶段突变性较高,由人转述知识变成机器自动从数据中学习知识,当时人工标注数据量在百万级左右;从2013到2018年,进入深度学习阶段,其相比于上一阶段突变性较低,从离散匹配发展到连续匹配,模型变得更大,标注数据量提升到千万级;预训练阶段存在于2018年到2022年,跟之前比较,最大变化是加入了NLP自监督学习,将可利用数据从标注数据拓展到了非标注数据。

图-大模型发展阶段

大模型阶段在数据标注、算法、人机关系三方面的性能均有跨越式提升。从2023年起开始进入大模型阶段,该阶段的突变性很高,已经从专用任务转向通用任务或是以自然语言人机接口的方式呈现,旨在让机器遵循人的主观意志。在数据标注方面,大模型已经从原来需要大量标注数据进化到运用海量非标注数据,越来越多数据被利用起来,人的介入越来越少,未来会有更多文本数据、更多其它形态的数据被模型运用。在算法方面,大模型的表达能力越来越强、规模越来越大,自主学习能力越来越强,从专用向通用趋势显著。

(二) 大模型技术路线

大模型技术路线各有侧重,MaaS已成产业趋势。大型语言模型研究的发展有三条技术路线:Bert模式、GPT模式、混合模式。其中国内大多采用混合模式,多数主流大型语言模型走的是 GPT 技术路线,直到 2022 年底在 GPT-3.5的基础上产生了 ChatGPT。到 2019 年后,Bert路线基本没有标志性的新模型更新,而GPT技术路线则趋于繁荣。从 Bert 往 GPT 演化的过程中,模型越来越大,所实现的性能也越来越通用。

大模型未来发展将趋于通用化与专用化并行、平台化与简易化并进。同时,MaaS 模式将成为AI应用的全新形式且快速发展,重构AI产业的商业化结构生态,激发新的产业链分工和商业模式。未来,大模型将深入应用于用户生活和企业生产模式,释放创造力和生产力,活跃创造思维、重塑工作模式,助力企业的组织变革和经营效率,赋能产业变革。

(三) 大模型技术架构

以ChatGPT背后技术为代表的人工智能大语言模型正在催生新一轮人工智能浪潮,在全球范围掀起人工智能大语言模型科技竞赛,科技巨头加快布局,生成式AI领域风起云涌。AI大模型的技术架构分为基础层、技术层、能力层、应用层、用户层五大板块,基础层涉及硬件基础设施和数据、算力、算法模型三大核心要素。技术层主要涉及模型构建,目前 Transformer 架构在AI大模型领域占据主导地位,如 BERT 、GPT系列等。AI 大模型包括 NLP大模型、CV大模型、多模态大模型等。能力层拥有了文字、音频、图像、视频、代码、策略、多模态生成等能力,应用于多个领域,为客户提供产品和服务,架构图如下所示。

图-AI大模型技术架构

三、 大模型在客服中心应用

大模型在客服中心研发应用需具备数据资源、算法和模型、资金和资源三要素。当前 大模型在客服中心应用面临算力需求大、训练和推理成本高、数据质量不佳、跨场景适配效果弱,知识库构建成本高、隐私和安全问题等挑战。在客服中心应用主要存在如下问题:

  1. 数据问题

客服行业线上服务数据不足,数据的多样性无法保障;行业数据标注困难,限制了数据积累数量和质量。知识库知识泛化,条数和质量不高。

  1. 算法问题

对于客服线上服务新场景,初期存在语料少,知识库欠缺等情况。模型能力需要积累项目上的经验,行业模型需要系统性提升。大模型考验全栈大模型训练与研发能力,如数据管理经验、算力基础设施私有化建设能力及工程化运营能力、底层系统优化和算法设计能力等。

  1. 逻辑推理问题

复杂、严谨、灵活的逻辑推理和自学能力仍然是目前大部分大语言模型面临的核心挑战。目前所知的大语言模型的涌现能力决定了大语言模型在逻辑推理等方面的基本表现、目前大部分大语言模型可以对人类情感做出简单的判断,理解和情感需求的基础上创造内容是客服行业需求,在逻辑推理之上理解人类情感是智能客服更高思考方式。当前多数理财顾问只能提供一些基础的产品介绍和推荐,缺乏对规模庞大、维度多样、瞬息万变的金融市场数据开展全面、深入、灵活、有效的分析,投研效率不高。

  1. 时效性问题

以 ChatGPT 为基础模型,通常基于历史数据进行训练,并不具备实时获取和处理新数据的能力,难以即时更新模型中的知识储备。对于客户实时性较强的最新资讯或问题,模型可能会输出不准确或错误的信息,而要让训练数据囊括最新的客服信息,对训练的时间和成本消耗都非常大,更新速度会远慢于搜索引擎。

四、 大模型未来发展展望

随着客户数量的不断增加,客户对客服中心服务的期望也会不断提高,银行客户服务中心如何交付功能强大的客户服务支持变得尤为重要,需要大规模深度学习和迁移学习在一定的场景下用来提升AI助手水平,并集成客服中心现有的自然语言处理、计算机视觉、智能语音、知识图谱等多个AI核心技术能力,打造银行业客服中心AI大语言模型能力体系。并健全完善生成式AI安全应用相关制度。面对科技伦理风险,应通过建立有效的内容审核和监管机制,防止生成及传播不良和违法内容。强化大语言模型应用的技术监管和审查。探索大语言模型实际应用落地的具体风险防范措施和手段。

提升客服机器人意图理解能力。在客服中心大模型与专项数据结合,可提升客服机器人的意图理解能力,基于客服行业模型的意图解析,降低初期接入成本。利用大模型的知识图谱、自然语言处理技术和算法模型,将复杂的问题转化为简单易懂的指令,提供更准确的答案。

提升视频/虚拟人交互能力。随着生成式AI与大语言模型的打通,视频/虚拟人制作周期将大大缩短,创作流程简化。同时,鉴于大模型在用户语言逻辑理解上的深化,虚拟人在客服场景应用中的识别感知能力和分析决策能力将显著提高,提升沟通时的交互能力,更准确地满足用户个性化需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/712101.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python sorted函数多条件排序大量数据时出现错误排序

""" 求生日,我的理解是有四个排序条件,分别是,年月日,输入顺序 """ n int(input())person_list [[x for x in input().split()] for x in range(n)] print(person_list) # 给输入先后加入顺序 …

NSString 输出百分比 % 无法显示

通过 NSString 拼接显示半分比 % 符号的时候会遇到拼接了 % 但 UI 未能显示; 解决办法 在需要添加 % 处通过 %% 的表达方式即可成功输出. [NSString stringWithFormat:"%.f%%", deviceLevel * 100]; 以上便是此次分享的全部内容,希望能对大家有所帮助!

【TensorRT】基本介绍

TensorRT用于高效实现已经训练好的深度学习的模型的推理过程的SDK,能使DL模型有更快的推理速度和更高的吞吐量。官方提供Python和C两种接口,形式基本一致且相互对应。 1 ✨ TensorRT介绍 🍟1.1 TensorRT的工作 分为两个时期(构建…

flask socket版本问题

1、版本问题 问题解决 根据官方给定的兼容版本,从socket.io官网CDN下载最新的4.4.1版本js文件,https://cdn.socket.io/。 python-engineio使用版本。需要更新的javascript.socketio包,具体可对照官方文档Requirements部分末尾 https://flask-…

红帽宣布为RHEL 7延长4年生命周期

早前一段时间,红帽原本计划在2024年7月1日结束支持,但是Red Hat表示由于部分IT企业需要更长的时间部署和升级,宣布为Red Hat Enterprise Linux 7(RHEL 7)增加4年的扩展生命支持(ELS)。 据了解,RHEL 7于2014年发布,支持…

uniapp解决跨域问题

配置: "proxy": {"/api": {"target": "https://s2.lakala.com","changeOrigin": true,"pathRewrite": {"^/api": "/api"}}} 目标路径 https://s2.lakala.com/api/v3/labs/relat…

7.1.4 【Linux】与目录树的关系

每个文件(不管是一般文件还是目录文件)都会占用一个 inode , 且可依据文件内容的大小来分配多个 block 给该文件使用。道目录的内容在记录文件名, 一般文件才是实际记录数据内容的地方。 目录 当我们在 Linux 下的文件系统创建一…

STM32 创建工程(库函数)

1.新建CORE ,FWLIB,OBJ,SYSTEM,USER五个文件夹 2.新建工程选择软件包 3.OBJ文件用来存放编译中间文件 4.FWLIB官方固件库包 src 存放的是固件库的.c 文件,inc 存放的是对应的.h 文件 直接从模板中粘贴进即可 5.CORE 6.USER文件夹需要复制的6个文件 7. 加入上面加入…

爱玩粥的有福了,带图形界面的明日方舟皮肤的员工管理系统,数据结构期末实训满分。

💯 博客内容:复习数据结构 😀 作  者:陈大大陈 🚀 个人简介:一个正在努力学技术的准前端,专注基础和实战分享 ,欢迎私信! 💖 欢迎大家:这里是CS…

JavaEE学习的第三部分(重点在第四个知识点,SSM框架整合)

一、拦截器 Spring MVC的拦截器(Interceptor) 类似于Java Servlet的过滤器(Filter)。前面学习Java Web学过一点过滤器。 拦截器的作用 是拦截用户的请求,并做相应的处理 。例如在JSP提交表单数据给Controller,先是提交给拦截器的…

计算机毕业论文内容参考|基于Python的高校二手网络交易平台的设计与实现

文章目录 导文摘要前言绪论1课题背景2国内外现状与趋势3课题内容相关技术与方法介绍系统分析系统设计系统实现系统测试总结与展望1本文总结2后续工作展望导文 计算机毕业论文内容参考|基于Python的高校二手网络交易平台的设计与实现 摘要 本文设计并实现了一种基于Python的高校…

3、boostrap图片视频上传展示

boostrap图片视频上传展示 1、展示效果2、html代码 1、展示效果 项目目录结构 2、html代码 html <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title><!--<link rel"st…

免费使用!国产品牌JoySSL为中国高校网站(edu.cn)提供专属SSL证书

去年9月份&#xff0c;西北工业大学遭受境外网络攻击&#xff0c;目标就是为了窃取重要隐私信息。高校校园信息安全非常重要&#xff0c;因为高校网站是学校的重要门户之一&#xff0c;也是学生、教职工、家长等与学校沟通交流的重要平台。如果高校网站存在安全问题&#xff0c…

Python Dataframe-B更新Dataframe-A

假设现在有两个dataframe&#xff0c;分别是A和B&#xff0c;它们有相同的列text和label。现在想使用B的label来更新A的label&#xff0c;基于它们共同的text。 数据示例 import pandas as pd# Sample DataFrames A and B data_A {text: [text1, text2, text3, text4], labe…

【Nacos 学习记录】

Nacos学习 笔记记录 1. 什么是配置中心&#xff1f;2. 什么是Nacos3. Nacos两大特点3.1 配置管理3.2 服务发现 4. 安装Nacos Server4.1 启动服务器4.2 Java SDK拉取配置4.2.1 添加配置4.2.2 拉取配置4.1.1 OPEN API配置管理API 4.2 post发布配置4.3 get获得配置 1. 什么是配置中…

【C语言】杨辉三角和练习

前言 &#x1f388;大家好&#xff0c;我是何小侠&#x1f388; &#x1f343;大家可以叫我小何或者小侠&#x1f343; &#x1f490;希望能通过写博客加深自己对于学习内容的理解&#x1f490; &#x1f338;也能帮助更多人理解和学习&#x1f338; 君子慎独&#xff0c;不欺…

Echarts区域面积areaStyle用图片进行纹理填充

React DOM结构代码&#xff1a; import fillImg from xx/fillImg.png; // 填充纹理图片...... {/* 趋势图填充纹理图片 */} <img id"fillImg" src{fillImg} style{{ width: 0 }} /> <div id"line" style{{ width: 100%, height: 300 }}></…

2023年5月 少儿编程 中国电子学会图形化编程等级考试Scratch编程一级真题解析(判断题)

2023年5月scratch编程等级考试一级真题 判断题(共10题,每题2分,共20分) 26、默认小猫角色,运行下列程序后,可以看到小猫面向右边,先向右转了30度,又向左转了30度 答案:错 考点分析:考查积木综合使用,由于电脑计算的速度非常快,所以上面的程序看不到右转效果,…

Linux--设置目录或文件的默认权限:umask权限掩码

目录起始权限是从777&#xff0c;普通文件起始权限从666 为何我们创建一个目录或文件&#xff0c;默认权限是你所看到的样子&#xff1f; 因为凡是在umask中出现的权限&#xff0c;都不应该在最终权限中出现&#xff01; 最终权限起始权限&&#xff08;~umask&#xff09…

中间件——统一白名单配置

目录 背景 方案设计 技术点 代码实现 1.切面 2.配置类 3.切面 测试 总结 背景 上线初期提供可配置的白名单用户进行访问验证&#xff0c;把控整体运行风险。 解决痛点&#xff1a; APOLLO企业控制也可以&#xff0c;多个业务功能&#xff0c;要配置多个apollo&…