知识就是力量,图谱路在何方 | ChatGPT冲击下,招商银行如何“抢救”知识图谱?

news2024/10/6 23:16:07

“知识就是力量”我们耳熟能详,但培根的这句话其实还有后半句“更重要的是运用知识的技能”。对于人工智能来说,知识图谱就是其如何对知识进行运用的技能体现。在金融领域,如何运用这一技能更好地理解客户需求,提高业务效率和客户满意度,同时进行风险管理?招商银行给出了他们的答案。

作者 | 李金龙、贺瑶函、郑桂东

出品 |《新程序员》编辑部

 知识图谱是一种用于描述实体、属性和它们之间关系的结构化语义网络,通常以图形模型的形式呈现。知识图谱可以帮助机器理解信息,并支持自然语言处理、搜索引擎优化等领域的发展。应用在招商银行的业务场景中,我们自底向上将知识图谱主要分成三个概念:底层为基于图数据库的复杂网络分析算法;中间层是数据语义网络算法;上层形成专家知识表示,并通过认知计算在行内各个场景中综合应用。

招商银行知识图谱的三种内涵

我们通过搭建领域内知识图谱(见图1),将行内业务场景通过语义表示形式,形成新的知识赋能于各个场景。

 图1 知识图谱平台

复杂图分析

知识图谱在基于符号表示的基础上,也可以通过图分析算法学习图的特征,为图谱中的每一个实体和关系得到一个对应的向量表示。同时,利用向量、矩阵或张量间的计算,实现高效的知识推理计算。图数据库的高速发展为大规模的图查询和图计算提供技术保障,从而开展复杂网络分析任务,广泛应用于金融领域的营销、风控等场景。

语义网络

语义网络(Semantic Web)由蒂姆·伯纳斯-李于2001年在科学杂志率先提出,知识图谱也可以看成是一种数据语义网络。语义网络中的节点可以代表一个概念(concept)、一个属性(attribute)、一个事件(event)或者一个实体(entity),而弧则用来表示节点之间的关系,弧的标签则指明了关系的类型。知识图谱用图的形式表示知识,基于联邦式知识图谱,实现各个图谱知识之间的互联互通,从而实现图谱全局的推理和预测。

专家知识表示

知识图谱(Knowledge Graph)是图关联结构化的知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—属性—实体”的三元组形式,实体间通过关系相互联结,构成网状的知识结构。知识图谱通过图谱结构存储专家知识,可以服务于认知计算领域,在涉及文本信息获取与处理的场景提供了可解释性的判断准则,实现了信息获取的系统化和智能化(见图2)。

图2 图谱关系的分布式表示

金融领域实践

目前知识图谱在金融行业中使用广泛,其结构化的知识能够帮助银行更好地对复杂信息进行处理和理解。知识图谱在招商银行的构建是按照“3+1层”划分的:第一层是知识层,该层的工具和知识主要应用于认知计算领域,如知识中心、智能审核、AI质检等场景;第二层是数据语义网络,如联邦知识图谱的构建;第三层是图数据库,用于营销、风控和反洗钱等决策模型的效率提升;第四层是综合类应用,比如投研领域,可应用于面向客户的智能化在线投资顾问场景。

统一知识中心的建设和相关应用支持——智能审核、质检

银行业作为知识密集型领域,其各个业务场景每日能够产生大量的非结构化数据,将这些知识形成一套统一的规范、标注,从而方便全行各个机构进行生产工作、知识分享等任务,最终达到知识产生价值,一直是需要持续改善的痛点。为形成一套符合AI发展的知识规范,招行花了多年时间将行内多年积累的各种知识进行整理、分析和组织,形成一套统一知识管理中心,其应用AI技术进行融合知识管理、语言表示、语义算法、知识活用,最终有效地支持知识的智能化运用。

在底层数据的应用上,将各类业务文档、规章制度、专业知识、问答知识、资讯、内部论坛等数据统一在招行知识中心通过数据库、图谱等形式进行存储,在上层能力上,业务可以通过知识拆解、知识编辑、知识授权、知识搜索、场景部门个性化知识推荐等形式,通过招行各个渠道进行场景知识共享和智能化服务,并结合预训练语言模型等进行规则推理和发现,从而达到辅助业务进行智能化推理和应用。

招行依托于行内产品数据,整理设计知识图谱中的实体,通过产品和服务标准逻辑设计实体关系,构建了庞大数据量的知识图谱。我们构建的知识图谱被广泛地运用到行内各项业务中,不仅在网点服务的各场景用使用知识图谱来提高服务质量和效率,同时,知识图谱也作为招行服务质检的重要依据在客户咨询等场景中发挥着越来越重要的作用。

联邦知识图谱的建设和应用

联邦式知识图谱是知识图谱与开放生态的组合。在一般场景下,联邦知识图谱为银行内部各个部门业务方数据互联,并且引入了部分外部行业工商数据等,对开放协作提供了支撑,同时也是金融大脑的重要组成部分。在这种理念下,招行构建了一种联邦知识图谱,其能够支持社区发现、标签传播、PageRank等常见图分析算法。对外引进了全量工商数据,搭建了海量级实体关系图谱,对内融合行内零售数据、对公精品资产数据,赋能对公、零售等多个业务场景,进行优质服务输出(见图3)。 

图3 联邦知识图谱数据来源

复杂图分析和相关应用

传统的图分析主要基于特征工程的技术方案,通过统计图结构特征,结合下游机器学习模型,从而完成整体建模。随着GCN、GAT系列的图神经网络算法日趋成熟,工业界可以实现将实际业务领域知识图谱完成向量化表示,预测挖掘出原本未显示存在的关联关系,从而应用于后续的营销和风控场景。

在营销活动方面,利用知识图谱的节点向量化表示寻求由点及面的传播扩散效果。粉丝放大器基于LookLike的思路,将已转化客群作为种子客户,通过一定的评估算法挑选与种子客户极为相似的目标受众作为营销对象,从而达到转化放大效果,显著提升营销活动的平均成功率。

在风控领域的应用中,依托复杂关联关系,全面丰富零售和对公画像,将原来以个体视角看待问题改变为从客群角度解决问题,通过分析零售客户和对公企业之间存在的股权、交易、事件等关系,建立风控模型,挖掘潜在风险关联团,探索风险传导路径,从而有效辅助银行规避风险。

金融领域内的综合类应用

财富管理和对话客服是知识图谱能力在金融行业上层两个场景中的重要应用。招行面对不同客户的业务能力进行整合,以差异化、有针对性的技术服务有效覆盖处于不同阶段、不同行业、不同特征的客户。

财富管理是客户服务中的重要内容,需要了解客户实际诉求,寻找适合的资管供应产品,通过资产配置、持仓调优来实现价值最大化。其中,AI投研能力是财富管理的重要基础,招行的AI投研能力底层依据于大量图谱数据,集成舆情分析、研报分析、观点生成等各种AI技术能力,通过联邦知识图谱计算出个性化合理财富搭配,形成用户个性化画像标签,最终提供合理的用户资产配比。

对于对话客服引擎,招行于2021年推出的智能投顾助手——AI小招助理。技术上,通过领域分类和槽位识别进入智能理财顾问的预设服务,从而合理引导用户进行理财投顾任务回答。基于知识中心问答库知识训练金融客服语义理解引擎,形成语义分类和语义匹配类知识问答能力解决用户咨询类问题。并结合理财场景特点搭建了大量基金、理财、保险、黄金等产品知识图谱,搭建了实体识别、实体消气歧、语义分类等能力。最终形成了一个知识图谱+知识库问答+任务型问答的投顾机器人,辅助客户经理助力客户进行理财。

大模型对知识图谱工作范式的冲击

传统的知识图谱从构建到上层的应用都需要将文本任务切分成各个子任务场景来解决,例如知识发现、知识挖掘、知识表示、知识推理、知识应用等任务,涉及到非结构化数据清洗和抽取、分词、语义角色标注、实体抽取、关系分类、实体消歧、语义匹配、图谱查询和图谱推理等任务,其与人类完全端到端的知识网络构建流程有所出入。这种传统的方式注定需要耗费大量人力和时间去微调各类子任务,且每个任务流程都需要标注大量高质量的微调数据集,形成场景类的预训练小模型的微调任务,但子任务间的错误最终还是会传递影响最终应用的准确率。

而像ChatGPT类的大语言模型依靠大规模参数量,及高质量人类反馈机制学习能够很好地模拟人类,让模型初显AI的能力。让我们看到原本自然语言处理领域的传统范式和以Bert为代表的场景化微调方法已经不再适用。取而代之的,是大模型可以凭借其突现能力以及强大的常识、推理和交互能力,基于统一范式处理大部分的NLP下游应用,且生成效果逐步接近真实世界,非领域专业人士甚至很难辨明内容真伪。

大型语言模型有可能彻底改变我们处理知识图谱的方式。知识图谱是表示复杂知识结构和关系的强大工具,但需要大量的工作来构建和维护。大型语言模型可以自动化处理许多构建和维护知识图谱所需的任务,例如实体识别、关系提取和分类匹配等此类语义理解任务。在大模型的冲击下,我们不得不思考,知识图谱是否可能实现新的统一工作范式,将知识图谱中存储的知识关联有机融入到大模型中,教会大模型掌握图谱的知识和推理能力,从而实现下游应用统一端到端的工作范式?

为了应对这些挑战,我们需要开发新的技术和工具,将大型语言模型与知识图谱集成。一种方法是使用自然语言处理技术,从大型语言模型生成的无结构文本中提取结构化数据,这可以确保大型语言模型生成的信息在知识图谱中得到准确表达。另一种方法是通过开发技术,结合知识图谱来检测和纠正大型语言模型生成中的错误,将事实性结果融合进大语言模型,让大语言模型生成效果更具有可信度。

总之,应对大型语言模型对知识图谱的影响需要结合技术专业知识、领域知识和创造力。通过开发新的算法和工具,结合大型语言模型的力量创建更强大和准确的知识图谱,也可以利用知识图谱来提升大型语言模型在知识运用、推理方面的准确性。

结语

知识图谱是一种基于人工智能的技术,用于构建知识库,并将其表示为具有实体和关系的图形模型。在银行业务中,知识图谱有着重要的作用。通过建立银行业务领域的知识图谱,银行可以更好地了解客户需求、产品信息、市场趋势等,从而提高业务效率和客户满意度。

知识图谱可以帮助银行构建智能客服系统。在客户服务方面,知识图谱可以帮助银行构建自然语言处理系统,通过理解和分析客户的问题,提供更准确和及时的解决方案。

此外,知识图谱可以协助银行进行风险管理。银行业务的风险管理需要收集、整合和分析各种信息,包括市场信息、客户信息、资产负债信息等。知识图谱可以帮助银行将这些信息整合成一个全面的风险管理知识库,从而更好地识别和管理风险。

不仅如此,知识图谱还可以协助银行进行产品推荐和交叉销售。银行可以通过知识图谱对客户需求和历史交易数据进行分析,然后基于这些数据为客户推荐更适合的产品和服务,同时还可以通过交叉销售提高客户价值。

总之,知识图谱在银行业务中的应用前景非常广阔,它可以帮助银行更好地理解客户需求,提高业务效率和客户满意度,同时也有助于银行进行风险管理和产品推荐等方面的工作。而在目前如ChatGPT等生成式大语言模型的加持下,如何与传统知识图谱结合,以更好地服务客户,不断提高自身竞争力,也值得持续探索关注。

作者介绍

​ 李金龙,招商银行人工智能实验室主管

带领团队从事人工智能技术的研发以及在智能金融领域的应用。主持的科技项目荣获中国银保监会一等奖、中国人民银行科技发展二等奖两次、参与编写CF40《中国智能金融发展报告》各期编写、参与人工智能领域学术论文十余篇、国家专利数十项。

 贺瑶函,招商银行人工智能实验室智能科学研发工程师

毕业于清华大学自动化系。加入招商银行以来,主要研究方向包括自然语言处理、知识图谱的构建和应用等,打造产品招行智网,服务于全行的营销和风控应用。发表多篇英文论文。

郑桂东,招商银行人工智能实验室智能科学研发工程师

硕士毕业于哈尔滨工业大学,主要从事自然语言处理、语音识别、预训练语言模型等算法研究,参与招行知识图谱问答系统等智能对话引擎算法落地应用工作,在国内外会议上发表多篇论文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/517903.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

三层架构与MVC架构区别

三层架构 表示层:主要对用户的请求接受,以及数据的返回,为客户端提供应用程序的访问。 servlet层 业务逻辑层:对我们数据实现业务逻辑的封装 service层 数据访问层:对数据库访问操作 dao层 MVC架构 1.MVC全名是Model …

MATLAB 常用数学函数和数组和字符串、元胞数组和结构体,MATLAB 编程,关系运算符和逻辑变量

目录 MATLAB 零基础学习 简介 使用平台 一、MATLAB 界面 二、基础操作 使用方法 常用数学函数 初等函数 三角函数 指数和对数 复数 标点符号 常用操作 三、文件类型 数组 一、数组基础知识 二、数组创建与操作 创建 数组操作 字符串数组 字符串、元胞数组…

语义分割学习笔记(三)FCN网络结构详解

1.FCN网络概述 FCN网络(Fully Convolutional Networks):首个端对端的针对像素级预测的全卷积网络。 FCN网络思想:输入图像经过多次卷积,得到一个通道数为21的特征图,再经过上采样,得到一个与原图…

如何在 Mac 或 Windows 上将 PDF 转换为 Word 而不丢失格式

PDF 有无数的优点,但它不能像 Microsoft Word 文档那样容易编辑。如果您没有价格总是很高的 PDF 编辑器,您将无法根据需要编辑或使用 PDF 源。但是我们可以将PDF转成Word,方便编辑。 有很多解决方案可用于在 Mac 上将 PDF 转换为可编辑的 W…

纯手动搭建大数据集群架构_记录019_集群机器硬盘爆满了_从搭建虚拟机开始_做个200G的虚拟机---大数据之Hadoop3.x工作笔记0179

今天突然就发现,使用nifi的时候集群满了...气死了.. 而在vmware中给centos去扩容,给根目录扩容,做的时候,弄了一天...最后还是报错, 算了从头搭建一个200G的,希望这次够用吧.后面再研究一下扩容的问题. 2023-05-12 11:06:48 原来的集群的机器,硬盘太小了,扩容不知道怎么回事…

GBASE核心业务系统解决方案入围工信部“2022年信息技术应用创新典型解决方案”

日前,以“加快数字中国建设,推进中国式现代化”为主题的第六届数字中国建设峰会在福州盛大召开。作为本届峰会的一大看点,由工业和信息化部网络安全产业发展中心(工业和信息化部信息中心)牵头开展的2022年信息技术应用创新解决方案&#xff0…

利用ChatGPT变现有哪些方法?

ChatGPT是一个聊天机器人,它可以用于多种用途,例如: 1. 在网站或应用程序中提供客户支持:ChatGPT可以用于回答常见问题、提供技术支持或解决客户问题。这可以提高客户满意度,从而增加客户忠诚度和销售额。 2. 在社交…

Windows 事件日志审核

大多数关于 IT 安全最佳实践的文章都有一个共同的建议:企业应定期审核其日志数据。这尤其适用于 Windows 审核日志,因为它们携带有价值的安全信息。除了增强安全性之外,定期日志审核是满足合规性法规的重要组成部分。 许多组织都享受到了通过…

【企业信息化】第7集 免费开源ERP: Odoo 16 Maintenance设备与维护保养管理

文章目录 前言一、概览二、使用功能1.自动化、预防性维护2.组织您的维护请求3.提高设备总体效率4.仪表板&统计5.与其他Odoo应用程序完全集成 总结 前言 为现代化制造商,维护软件。 一、概览 二、使用功能 1.自动化、预防性维护 以保证您的在线运行。 Odoo 计…

Selenium3.0基础 —— 自动化测试概述

软件测试六大模块: 1、功能性测试: ATM机取钱不扣款。日期格式不正确。web页面的超链接无法打开。手机正在听音乐时来电不提示。地铁公交卡刷卡扣款不成功。手机APP无法正常启动注册。手机拨号后无法接通对方手机。 2、可用性测试(用户体验…

了解Gradle:轻松构建优秀的Java和Android应用程序

Gradle是什么 Gradle是一种基于Apache Maven和 Apache Ant的自动化构建工具,用于Java和Android应用程序的构建、测试和部署。它使用声明性构建语法(DSL)来定义项目和任务,并使得构建更容易,更快速和更灵活。相比于Mav…

使用 Kotlin 委托,拆分比较复杂的 ViewModel

需求背景 在实际的开发场景中,一个页面的数据,可能是由多个业务的数据来组成的。使用 MVVM 架构进行实现,在 ViewModel 中存放和处理多个业务的数据,通知 View 层刷新 UI。 传统实现 比如上面的例子,页面由3 个模块数…

Javascript学习- DOM获取属性操作

Web API 基本认知 作用和分类 作用: 就是使用 JS 去操作 html 和浏览器分类:DOM (文档对象模型)、BOM(浏览器对象模型) 什么是DOM DOM(Document Object Model——文档对象模型)是用来呈现以及与任意 HTML 或 XML文档交互的API 白话文:DOM是浏览器提供的一套专门用来操作网…

open3d-ml 读取SemanticKITTI Dataset

目录 1. 下载dataset 2. 读取并做可视化 3. 源码阅读 3.1 读取点云数据-bin格式 3.2 读取标注数据-.label文件 3.3 读取配置 3.4 test 3.5 train 1. 下载dataset 以SemanticKITTI为例。下载链接:http://semantic-kitti.org/dataset.html#download 把上面三…

如何编写有效的FAQ常见问题页面

FAQ(Frequently Asked Questions)常见问题页面是网站或应用程序中经常使用的一种页面类型。它为用户提供了一种便捷的方式来寻找解决问题的答案,同时也减轻了客服和支持团队的工作量。下面将介绍如何编写有效的FAQ常见问题页面。 明确受众 在…

网站域名历史记录批量查询-老域名建站历史快照数据查询

域名建站历史查询软件 域名建站历史查询软件是一种用于查询一个域名被使用的网站的历史记录的工具。它可以提供许多有用的信息,包括该网站的创建和修改日期、使用的网站建设平台、使用的CMS系统、网站的历史页面内容和页面结构等。 域名建站历史查询软件的作用是帮…

去阿里、百度、网易大厂的软件测试工程师都是什么人?卷起来...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 测试,…

CRA应用使用craco实现webpack配置+module.less+src别名配置

前言:总所周知,create-react-app 是目前最受欢迎的创建 React 应用的手脚架之一,下面简称CRA;CRA 最推荐更改 webpack 配置的当属使用 craco,下面我们一起来看看配置吧。 一、创建 cra 应用 npx create-react-app my…

全国标杆!3DCAT实时云渲染助力深圳移动5G+智慧校园建设

2023年2月27日,中国移动在陕西西安召开全国教育行业全年工作部署暨电子学生证专项调度会,来自全国各地的移动分公司、专家、合作伙伴等参加了会议。瑞云科技旗下3DCAT实时渲染云作为中国移动的重要合作伙伴之一,也受邀出席进行项目展示。 在会…

算法修炼之练气篇——练气五层

博主:命运之光 专栏:算法修炼之练气篇 前言:每天练习五道题,炼气篇大概会练习200道题左右,题目有C语言网上的题,也有洛谷上面的题,题目简单适合新手入门。(代码都是命运之光自己写的…