解决大模型“裸”奔,恒生打通落地金融“最后一公里”

news2024/11/16 22:39:29

cbca2ff1f3e0d48f4637d64ace660263.png

4e67d1227d4672c564913dbca3ed7f2d.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


在数字化的21世纪,技术的每一次进步都能引发行业的巨大变革。进入2023年,大模型无疑是金融数智化升级的关键变革力量。无论是高频交易、风险管理,还是金融咨询和客户服务,大模型都有广泛的应用前景。

10月19日,恒生电子公布了其金融大模型LightGPT的最新成果。基于LightGPT,恒生电子还推出了多款“光子系列”的大模型应用产品,并宣布这些产品正式进入公测阶段。

那么,恒生电子的金融大模型LightGPT以及其“光子”系列应用产品,有什么核心能力,又如何在实际金融业务场景中实现AI赋能呢?接下来将揭晓答案。

为什么要做金融行业大模型?

金融是一个以精确性和安全性为首要考量的领域,如果直接应用通用大模型,会存在明显的局限性。

首先,通用大模型对专业知识的理解不足。金融市场的变动常常受到多种因素的影响,如货币政策、地缘政治、市场心理等。对于这些复杂的因素,通用大模型可能只有表面的理解,而缺乏深入的、专业的洞察。例如,某国突然的货币贬值可能会引发连锁反应,一个通用模型,如果没有足够的经济和金融市场知识,将很难准确预测这种连锁反应。

通用大模型,由于其训练数据的广泛性,以及专业金融语料的缺失,可能难以满足金融监管的特定要求。例如,一个模型可能因为某些数据偏见而推荐某种歧视性的贷款决策。

此外,金融数据往往包含大量的敏感信息,如客户的财务状况、投资策略等。如果这些数据被泄露,可能会对金融机构和其客户造成巨大的损失。为了消除这些风险,需要能够私有化部署,而通用大模型很难满足这样的部署要求。从部署的角度看,金融机构往往有自己的硬件环境。通用大模型,由于其一般部署成本极高,可能并不完全适配私有化环境。

为了更好地满足金融业务的各种专业需求,我们需要一个既理解金融专业知识,又能够快速、合规接入各种本地数据和知识,同时满足金融机构部署轻量化要求的大模型。这样的模型不仅可以为金融机构提供更为精准的决策支持,还可以在合规、成本和私有化部署等方面带来实实在在的好处。

怎样算是优秀的金融行业大模型?

一个优秀的金融行业大模型,不仅能提升业务效率,更有可能改变金融业的运作模式。市场上不断涌现出金融大模型,那如何评判一个金融大模型的优劣呢?

为此,恒生电子与中国信通院联手,共同编写了金融大模型评测标准,并在原有基础进一步从资本市场特点,进行进一步的细分拆解,分别从“L0-L1-L2”三个层级进行能力评测。

464d0a05f9a5d8daac0c088ac669c0fe.png

有了合理的评估标准,接下来就是“按图索骥”,来打造一个优秀的金融大模型。

从恒生电子的LightGPT的实践经验来看,金融大模型需要在三个方面实现突破,分别是专业金融数据集、满足合规性要求,以及灵活的部署方式。

1、更专业的金融数据集,提升大模型的专业能力。

数据是AI的基石,特别是在高度专业化的金融领域,数据集的质量直接决定了金融行业大模型的表现。然而,构建专业的金融数据集是充满挑战的,金融数据的敏感性、多样性以及不断变化的金融环境,都对数据采集和处理提出了更高的要求。

在构建专业数据集方面,恒生电子的LightGPT,得益于其2000亿中文tokens的坚实数据基础。更为关键的是,这些数据经历了80+中文金融任务的精细打磨。

66d8a20caee8b3934b15b35bf791f9f3.png

为何我们要如此重视专业的金融任务打磨呢?金融不仅仅是关于数字和交易,更是关于市场心理、宏观经济政策、市场突发事件等众多因素的综合反应。这意味着,任何在金融场景中应用的AI模型,必须具备极其专业的领域知识结构和复杂金融场景的语义理解能力。而这,正是通过专业任务打磨所赋予模型的能力。

LightGPT经历的80+中文金融任务的精细打磨,可以视为是模型的“特训”过程,这让其能在具体的金融场景中,如投顾助手、投研辅助、知识库问答、运营、合规助手等,表现出更高的准确性和专业水准。可以说,海量的数据给予大模型强大的学习能力,而专业的数据集和金融任务打磨,则确保模型能够在实际金融场景中发挥出真正的业务价值。

2、满足金融机构的合规要求

因为金融行业涉及资金流动、投资决策以及国民经济健康运行,其对于业务合规的要求极为严格。这使得金融机构不仅要面对复杂的市场环境,还必须在法律和监管框架内稳妥行事。

在这种背景下,LightGPT展现了其在金融合规性上的卓越优势。例如,恒生电子确保LightGPT大模型处理的数据遵循了隐私法规,并确保输出结果符合金融监管相关法律法规的要求,不会生成“有害”和“越位”的内容,使大模型具备业务合规与价值观对齐的能力。而且,模型能够随着监管环境的变化进行及时调整和更新,确保其输出始终保持在合规范围内。

3、轻量化,可满足金融机构的私有化部署需求

正因为对安全和合规性的严苛要求,金融机构对大模型私有化部署有独特的需求,它不仅能增强金融数据的安全性,还可以针对特定的业务需求进行定制和优化。

恒生电子的LightGPT支持私有化和云部署两种模式,使得金融机构可以根据自身的业务需求和安全策略,选择最合适的部署方式。在私有化部署方面,LightGPT具备轻量化特点,使得它能够在相对较小的硬件配置上流畅运行,大大地降低了部署成本和复杂性。云部署方式下,LightGPT支持API调用,这进一步提供了与其他系统集成的便利,使得模型可以轻松地嵌入到金融机构的现有业务流程中。

总的来说,恒生电子发布的LightGPT,展现了金融大模型能力提升的完整蓝图。通过对数据的专业处理、对合规性的严格遵循以及对部署方式的灵活选择,它为金融行业提供了一个在技术与实际业务之间完美平衡的解决方案。

据恒生电子首席科学家白硕介绍,目前LightGPT在整体模型效果上提升15%,安全合规性上提升13%,推理速度上提升50%,并面向金融机构实现LightGPT-7B的开源,推理和训练全面适配华为昇腾系列。

建立应用对接大模型的“中控”

正如白硕所说,“如果是一个裸的大模型,在垂直领域几乎没有太多的生存空间,既体现不了专业的价值,也卖不出价钱。大模型只有跟其他专业的工具、插件和数据等资源结合,并融合成一个有机生态体系,才能体现它的价值。这一点在千模大战的背景下,显得尤为重要。”

基于这样的理念,恒生电子在LightGPT金融大模型基础上,创造性地构建并推出了“光子”平台,并将其作为金融应用对接大模型的核心“中控”部位。“光子”在构建智能应用服务系统时,选择了一种模块化的策略,成功地将“通用工具链+金融插件工具+金融数据+金融业务场景”串联起来,这种结构确保了服务系统的灵活性和专业性。

db3c45d130208c47766caf4d1bed5a74.png

通过整合通用工具链,“光子”确保了其在不同场景中的基础功能性和稳定性。这些通用工具为金融业务提供了一套标准化、高效的技术框架,从而使得服务系统能够快速响应各种需求变化和技术更新。

此外,通过与金融插件工具、金融数据紧密结合,使“光子”得以为特定的金融业务场景提供专业的能力支撑并与大模型共同构成相应的解决方案。这些插件工具是基于金融行业深入的知识和经验,满足其特定的业务需求;而金融数据则为“光子”提供了丰富的时效性和准确性均高于通用大模型的数据来源。

在这个体系中,“光子”平台不仅仅扮演着一个中介的角色,它本身融合了多种先进的AI技术和服务,如问答组件、文档组件、NL2X(自然语言指令映射)组件、技术中间件等。这种集成使得“光子”能够为各种具体的业务场景提供定制化的解决方案。通过这个设计,恒生电子构建了一个完整的技术生态,从底层的大模型研发到业务的具体实践实现了无缝衔接。

全方位发展,光子成为金融从业人员的智能助手

“光子”作为一款高度灵活的技术平台,为金融行业提供了多样化的产品模式选择,主要包括:嵌入模式、重构模式和原生模式。这三种模型各有特点,能够满足不同的应用需求和业务场景,打造金融人员的智能助手。

8e801c30e8354dc65a2aebafc8b3d80f.png

嵌入模式是指将“光子”平台能力嵌入到现有的系统或应用中,实现功能增强或提升。这种模式的主要优势在于其对现有系统的侵入性最小,允许金融机构在不进行大规模系统更改的前提下,迅速获得AI的驱动力。重构模式意味着基于“光子”平台,对现有的系统或应用进行部分或完全的重构,重塑业务流程和服务模式。原生模式是指完全基于“光子”平台从零开始构建的应用,这种模式可以充分发挥“光子”的全部潜能,为用户提供最为先进的金融服务。

在LightGPT大模型和光子平台基础上,恒生电子在投研算法、客户服务、营销分析等多个关键领域,计划持续推出一系列应用产品。

本次发布会上,恒生电子发布了数款大模型应用,包括定位智能投顾会话助手的光子·善策、面向投资顾问的一站式内容创作平台的光子·文曲,和定位资管与托管产品运营助手的光子·慧营。

接下来,我们以恒生电子的光子·善策产品为例,来说明大模型对金融业务的赋能作用。

9cae190f8d40562128d19c61695b1ec6.png

光子·善策

在金融投资服务中,投资顾问与客户的沟通与交流贯穿服务始终。为了提供更专业的投资顾问服务,需要每一个步骤、每一句对话,都必须准确无误,富有深度与专业性。这样的高标准交流,正是光子·善策力求实现的目标。

光子·善策基于大模型强大的语义理解能力,在与客户的每次交流中准确捕获其真实的需求与意图,为后续的咨询服务提供了坚实的基础。

而在洞察到客户的真实需求后,如何为其提供最适宜的金融产品或服务,则是投资顾问的首要任务。光子·善策为此提供了智能服务匹配功能,根据客户的投资风格、风险承受能力和投资目标,为投资顾问推荐一系列精选的金融产品或解决方案。与此同时,光子·善策通过智能话术生成功能,为投资顾问定制富有说服力、专业而又贴近客户需求的话术,确保每次沟通都能获得客户的信赖和认同。

更进一步,为确保每一次与客户的交流都能得到妥善的跟进和处理,光子·善策还提供了智能工单创建功能。每当与客户的对话结束,相关的工单就会自动生成,无需手动录入,大大提高了工作效率。

可以发现,光子·善策为投资顾问提供了一个完整的智能会话解决方案,从洞察客户意图,到提供专业建议,再到确保有效跟进,每一步都精确而高效。这种革新的方式不仅改变了投资顾问的工作模式,也为整个金融领域的未来发展提供了新的方向。

恒生电子董事长刘曙峰认为,随着“数据+算法+算力”大模型新范式三大基本要素的不断提升,大模型作为一种创新技术,将实现对金融领域业务形态和逻辑范式的革新。

例如,大模型通过对海量数据的快速处理和分析,大大提高决策的速度和准确性;通过对客户数据的深入挖掘和分析,金融机构可以更加精准地识别客户的需求和偏好,从而提供更加个性化和高效的服务,增强客户黏性和满意度;大模型能够对各种风险因素进行实时监控和预警,帮助金融机构更加及时地发现和应对潜在的风险,确保资金的安全和稳健运营。那些能够迅速适应和利用大模型的金融机构,无疑将在这场智能竞赛中走在前列。

更进一步,金融是数字经济的神经中枢,赋能金融也是对整个数字经济的赋能。我们有理由相信,金融大模型不仅会推动金融行业的进步,更会为整个数字经济注入新的活力,引领我们走向一个更加光明的未来。

e04e3ffebb030cfc42c17703aef3fd32.png

文:月满西楼 / 数据猿

e73962e206192dc2eb77ed052d2aae8e.jpeg

e22d4b1ac08fbd05245d58cfafa68681.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1142753.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux】虚拟机项目部署与发布

目录 一、Linux部署单机项目 1.1 优缺点 1.2 将项目共享到虚拟机 1.3 解压后将war包放入tomcat 1.4 数据库导入脚本 1.5 Tomcat启动项目 二、部署前后端分离项目 2.1 准备工作 2.2 部署SPA项目 2.2.1 nginx反向代理 2.2.2 SPA项目宿主机访问 一、Linux部署单机项目…

【Unity精华一记】特殊文件夹

👨‍💻个人主页:元宇宙-秩沅 👨‍💻 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍💻 本文由 秩沅 原创 👨‍💻 收录于专栏:uni…

CMMI/ASPICE认证咨询及工具服务

服务概述 质量专家戴明博士的名言“如果你不能描述做事情的过程,那么你不知道你在做什么”。过程是连接有能力的工程师和先进技术的纽带,因此产品开发过程直接决定了产品的质量和研发的效率。 经纬恒润可结合多体系要求,如IATF16949\ISO26262…

S7-200 SMART与ABB ACS580变频器进行MODBUS RTU通信的具体方法示例

S7-200 SMART与ABB ACS580变频器进行MODBUS RTU通信的具体方法示例 1. ABB ACS580变频器一侧的设置:

[17]JAVAEE-HTTP协议

目录 一、什么是HTTP协议 什么时候会用到HTTP协议? HTTP协议的工作流程 二、HTTP的报文格式 抓包 HTTP请求报文格式 1.首行 2.header 常见键值对: 3.空行 4.正文(body)(有的时候可以没有) HTTP…

数据挖掘神器Orange初步使用

文章目录 安装示例项目展示鸢尾花数据 安装 可以在官网下载,地址为Orange,如果已经装了Anaconda,则可在Anaconda Navigator中找到一个非常猥琐的图标,下面写着Orange3,可以点击Install,装完之后点Launch就…

软考系统架构师知识点集锦六:项目管理

一、考情分析 二、考点精讲 2.1进度管理(时间管理) 进度管理:为了确保项目按期完成所需要的管理过程。 2.1.1过程 [WBS分解的基本要求] WBS的工作包是可控和可管理的,不能过于复杂。任务分解也不能过细,一般原则WBS的树形结构不超过6层。每个工作包要…

文件上传预览下载

文件上传的表单必须满足三个条件: 1.表单组件标签只能用:<input type"file" value"xxx">会自动弹框让用户选择文件 2.请求方式只能用post 3.表单编码格式只能用:mutipart/form-data 根据HTTP协议规定,浏览器每次向后台提交参数,都会对参数进行统一…

selenium工作原理和反爬分析

一、 Selenium Selenium是最广泛使用的开源Web UI(用户界面)自动化测试套件之一&#xff0c;支持并行测试执行。Selenium通过使用特定于每种语言的驱动程序支持各种编程语言。Selenium支持的语言包括C#&#xff0c;Java&#xff0c;Perl&#xff0c;PHP&#xff0c;Python和Ru…

编程实例:多人同时计时计费管理系统软件,可适用于钓场计时等管理

编程实例&#xff1a;多人同时计时计费管理系统软件&#xff0c;可适用于钓场计时等管理 编程系统化课程总目录及明细&#xff0c;点击进入了解详情。https://blog.csdn.net/qq_29129627/article/details/134073098?spm1001.2014.3001.5502 1、使用该编程工具开发的多人计时计…

Kafka - 3.x 副本不完全指北

文章目录 kafka 副本的基本信息Leader选举过程Kafka Controllerkafka 分区副本Leader的选举流程实际演示① 查看first的详细信息&#xff0c;注意观察副本分布情况② 停掉hadoop103上的kafka进程③ 再次查看first的相信信息&#xff0c;观察副本分布④ 处理分区leader分布不均匀…

吴恩达《机器学习》1-4:无监督学习

一、无监督学习 无监督学习就像你拿到一堆未分类的东西&#xff0c;没有标签告诉你它们是什么&#xff0c;然后你的任务是自己找出它们之间的关系或者分成不同的组&#xff0c;而不依赖于任何人给你关于这些东西的指导。 以聚类为例&#xff0c;无监督学习算法可以将数据点分成…

第八节——Vue渲染列表+key作用

一、列表渲染 vue中使用v-for指令进行列表 <template><div><!-- item 代表 当前循环的每一项 --><!-- index 代表 当前循环的下标--><!-- 注意&#xff1a;必须要加key--><div v-for"(item, index) in arr" :key"index"…

vue源码分析(三)——new Vue 的过程(详解data定义值后如何获取的过程)

文章目录 零、准备工作1.创建vue2项目2.修改main.js 一、import Vue from vue引入的vue是哪里来的&#xff08;看导入node_modules包&#xff09;1&#xff1a; 通过node_modules包的package.json文件2&#xff1a; 通过配置中的main入口文件进入开发环境的源码&#xff08;1&a…

MySQL数据库——视图的更新、视图作用以及案例

目录 视图的更新 介绍 示例 视图作用 案例 视图的更新 介绍 要使视图可更新&#xff0c;视图中的行与基础表中的行之间必须存在一对一的关系。 如果视图包含以下任何一项&#xff0c;则该视图不可更新&#xff1a; 聚合函数或窗口函数&#xff08;SUM()、MIN()、MAX()…

体外循环手术中循环管路灌注流量精密自动控制解决方案

摘要&#xff1a;在目前的体外循环手术过程中&#xff0c;需要灌注师快速而精确地操作使得血液流速调节到期望的目标值。基于国外文献报道的血流量自动控制方法和装置&#xff0c;本文提出了技术改进且国产化解决方案。通过本解决方案中增加的国产系列电控夹管阀、电控针阀和具…

C++之特殊类的设计

目录 一、单例模式 1、设计模式 2、单例模式 1、饿汉模式 2、懒汉模式 3、单例对象的释放问题 二、设计一个不能被拷贝的类 三、设计一个只能在堆上创建对象的类 四、设计一个只能在栈上创建对象的类 五、设计一个不能被继承的类 一、单例模式 1、设计模式 概念&am…

RabbitMQ如何保证消息不丢失呢?

RabbitMQ 是一个流行的消息队列系统&#xff0c;用于在分布式应用程序之间传递消息。要确保消息不会丢失&#xff0c;可以采取以下一些措施&#xff1a; 持久化消息&#xff1a; RabbitMQ 允许你将消息标记为持久化的。这意味着消息将被写入磁盘&#xff0c;即使 RabbitMQ 服务…

王道p149 7.二叉树按二叉链表形式存储,写一个判别给定二叉树是否是完全二叉树的算法(c语言代码实现)

采用层次遍历算法&#xff0c;将所有结点加入队列(包括空结点)。 如果没有左孩子&#xff0c;就看有没有右孩子&#xff0c;如果有右孩子&#xff0c;那么不为完全二叉树。 如果有左孩子&#xff0c;且之前不存在缺孩子的结点&#xff0c;左孩子进队&#xff0c;如果有右孩子…

专家级数据恢复:UFS Explorer Professional Recovery Crack

UFS Explorer Professional Recovery - 一款功能强大且方便的数据恢复程序&#xff0c;支持检测大量文件系统、操作系统和各种类型的驱动器&#xff1a;从简单的闪存驱动器到复杂的复合存储&#xff08;各种级别的 RAID 阵列&#xff09;。 该程序由执业专家开发&#xff0c;并…