恒生电子探路金融大模型

news2024/11/17 5:48:05

34952285cdc2c0962589960e0d34cc00.png

7efd7de84ef8f959b48ac7e0a77ee4e1.png

719142a4eeee8084ddaf45e698281460.png




‍数据智能产业创新服务媒体

——聚焦数智 · 改变商业


近日,恒生电子和旗下子公司恒生聚源正式发布基于大语言模型技术打造的数智金融新品:金融智能助手光子和全新升级的智能投研平台WarrenQ。此外,恒生电子金融行业大模型LightGPT也首次对外亮相。

恒生电子董事长刘曙峰表示,大模型是信息技术的最新突破,刷新了人们对机器智能的认知,同时也在刷新行业应用传统AI模型的模式。

今年年初,以ChatGPT为代表的生成式AI掀起一阵席卷全球的热潮,大模型技术则正在重新定义各行各业,其中金融行业是数字化、智能化的先行者,也被视为大模型技术落地的最佳领域。

在大模型时代,具有通用能力的大模型成为基础设施,将对金融行业的智能化水平和数字化程度产生深刻影响。

作为服务金融行业的技术公司,恒生电子正在结合自身技术能力和对金融业务的深入理解, 持续打造金融行业大模型和基于大模型的全新数智产品,为金融行业应用大模型提供新动能。

技术进步推动行业变革

每一次技术的进步都会推动社会大的变革,大模型是信息技术领域中一次全新的突破。

从信息技术几十年的发展来看,可以清晰的看到“三浪”叠加形态,从最早的大型机、PC的信息化到互联网、网络化,移动互联网,整个地球连成了一个“村”。

大模型的诞生是这一轮信息技术的第三浪,来自5G、云计算,包括传统的AI所带来的冲击让外界感受到了AI带来的数字化浪潮,但是大模型把这个浪潮推到了新的高度。

其实,中国的金融科技的发展就伴随着“三浪”叠加的形态,在金融这样强监管的垂直领域,技术进步的浪潮带来的颠覆性可能并没有那么强,但是,每一次进步同样会催生新生的企业。

刘曙峰举例,信息化时代的招商银行以科技立行,抓住了信息化带来的力量而成长起来。互联网的发展,催生出了支付宝、余额宝这样新场景下的金融服务产品,也催生了蚂蚁金服、东方财富、众安保险等互联网原生的金融服务机构。

所以,大模型技术对于传统时代的更新是必然的,它意味着更高的技术门槛和更大的规模,大模型时代,“数据+算法+算力”构成了新范式的基本要素,而这些基本要素会进入通用、垂直领域中,不断去拓展。

基于基础大模型下,对于和垂直场景的连接,恒生电子看到了两种可能性:一种是连横,一种是合纵。连横就是通过行业插件作为外挂方式,向大语言模型中添加不同类型的知识模块,包括常识知识、领域知识、事件知识等,与大语言模型进行适配和集成,从而提升其在复杂任务中的表现。另外一种形态则是恒生电子正在探索的“合纵”模式。

刘曙峰表示,在金融领域,由大模型供应方主导的“连横”模式会碰到的很多问题,比如数据产权的归属等。在“连横模型”很难实现深度应用时,有必要建立一个“行业大模型”承接垂直领域“合纵”需求。

他同时提到,行业大模型也面临固有的挑战,比如算力协同、内外部数据协同、场景协同、机构间协同等等。“尤其是数据协同,这是非常具体也非常难以解决的问题,尤其是金融行业面临着大量的合规限制。”

从一定程度上来讲,大模型在商业应用上,聚焦于金融垂直领域,仍在领域知识时效性、数据安全与隐私保护、具体应用支持等方面存在局限性。合纵模式下,可以充分发挥大模型产业上下游的合作,提高金融领域AI应用的水平的同时解决数据安全和隐私保护等问题,为金融数智化提供更加强有力的支撑。

金融行业数智化从量变走向质变

“建设一个好的金融大模型,取决于高质量的数据、优秀的基础大模型、专业的大模型能力、充足的算力。”恒生研究院院长、恒生电子首席科学家白硕表示。

2014年开始,恒生电子正式启动了AI的研究工作,打造了NLP、OCR、CV、知识图谱等能力,同时将AI技术能力赋能到智能客服、智能投研、智能运营、智能营销、智能投顾以及数据与风险相关的业务系统。

截至目前,恒生电子已发布20+人工智能产品,服务机构包括银行、证券、基金、期货等金融机构,拥有超过500个客户案例,实现了AI产品“从可用到好用”的进步。

WarrenQ是恒生聚源推出的面向投研投资场景打造的专业一体化投研工具平台。在这次的发布会上,WarrenQ推出了两款AI工具产品——WarrenQ-Chat和ChatMiner。

WarrenQ-Chat是一款金融垂直领域的Chat产品,利用大模型叠加搜索和聚源金融数据库,通过对话指令,轻松获得金融行情、资讯和数据,且每一句生成的对话均支持原文溯源,确保消息出处可追溯,还可以生成金融专业报表,轻松实现“语控万数”。

ChatMiner是一款金融文档挖掘器,基于大模型和向量数据库构建,可以根据用户对话指令对指定文档进行快速解读,提供精准检索与定位,提取关键信息,还可以将信息进行有效的整合归纳和精炼或拓展,智能化处理海量文本数据。

恒生聚源副总经理、产品总监白雪提到,WarrenQ里有很多的场景、很多功能,包括无所不能的读取写器、引文和演算、演算版的模型。

比如ChatMiner可以收集一大段新闻事件的集锦,如果对其中一条比较感兴趣,就可以追溯新闻,查看原文当中的研报内容。如果看到中间一段想留存下来,则可以点住它,一键拖拽到笔记里。

站在产品经理的角度上,白雪表示,今年以来试用了很多产品,真切感受大模型正改变着软件产品,改变着软件交互,改变着软件行业。“大模型+数据+软件”的未来会长成什么样子是一个行业中会广泛讨论的话题。

在他们看来,最底层是数据层,和产生的数据层有一定的区别,传统数据层是帮助机构建一个数智化的平台,底层很多是公开的数据加上机构自有数据库,现在机构的数据库会加上金融基础语料、产品的语料、公开大模型的语料,一起构成新版大模型时代的数智化产品底层。

在模型层,通过将准备好的数据和语料结合在一起,做金融数据的预训练,同时也可以做监督的微调,调完之后就可以得到一个金融版的大模型。在金融领域的产品化上,还要持续训练插件。

如何构建更专业的金融大模型?

发布会上,由恒生电子打造的金融行业大模型LightGPT也首次对外亮相。作为专业面向金融行业的大模型,LightGPT较通用大模型更专业、更合规、更轻量。

恒生研究院院长、恒生电子首席科学家白硕表示,LightGPT拥有更专业的金融语料积累处理和更高效稳定的大模型训练方式,使用了超4000亿tokens的金融领域数据和超过400亿tokens的语种强化数据,并以之作为大模型的二次预训练语料,支持超过80+金融专属任务指令微调,使LightGPT具备金融领域的准确理解能力。LightGPT将于9月底完成新一轮的金融能力升级,并正式开放试用接口。

在白硕看来,现有大模型难以在金融特定领域实现落地的原因主要有三个方面:

第一,模型本身的质量。金融行业对回答的内容和服务的质量要求非常高,通用大模型基于公开数据的训练难以达到,效果距离金融行业的需求有明显的差距。

第二,合规监管方面,金融行业的监管对数据流动、身份(例如是否持牌经营)等有明确限制,现有的通用大模型难以满足。

第三,算力成本方面,结合前述两方面的要求,很多金融机构在使用大模型时明确要求私有部署、至少在行业可信的范围内部署,这样的部署方式下,如果参数体量不够大,质量可能会比较差,如果参数体量足够大,仅仅从推理来看,部署的算力成本也会比较高。

所以,恒生电子坚定地选择站在巨人的肩膀上,充分吸收现有基础大模型的高质量成果,持续去打磨行业所需要的金融大模型。

对此,白硕针对建设一个好的金融大模型,总结了四个关键因素。

第一,高质量的数据。金融有很高的专业化要求,数据上要反映行业的专业化,这是和通用大模型拉开距离的关键。LightGPT的数据来源包括聚源过去二十年超过4000亿tokens的文本数据及结构化数据,超过400亿tokens的金融教材、金融百科、政府报告、法规条例等数据,以及一些精调的数据集。

第二,优秀的基础大模型。以优秀的基础大模型为起点,面向专业领域时能够有更好的提升空间。恒生电子积极探索与国内外金融大模型的合作,使LightGPT有较高的起点。

第三,专业的大模型能力。训练大模型的专业能力,包括算法、人才以及外部合作等。在算法方面,要去学习和采纳较为先进的算法,包括参数冻结、领域相关的指令精调以及强化学习相关的算法。在人才储备方面,恒生电子拥有国家级博士后科研工作站,在外部合作上,恒生与复旦大学、浙江大学、中国科学院、中国科学技术大学等高校都达成了合作。

第四,充足的算力。一方面来自恒生与互联网厂商、云厂商在算力方面的合作,另一方面恒生也投入了一些自有算力来支持LightGPT的研发。

作为国内金融科技龙头公司,恒生电子为金融行业打造的能力正在逐步展现,面向市场的进一步深化,刘曙峰表示,预计到2030年,整个金融行业将完成数智化升级。而恒生电子作为其中的先行者,将与金融行业共同迈进数智化新时代。

文:周尧 / 数据猿

68748db46ef4203802c7c708d1191ed6.jpeg

723bf925ffa1e11b4873a3cfd29b6dbf.jpeg

40af2b947cb8bbe65be29c79f8426097.png

21edadcd789897c2c24f7d05ac935005.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/730481.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

硬件电路设计--运算放大器(三)应用一

文章目录 前言示例1示例2 一、反向比例反向比例改进版对平衡电阻R的讨论 二、同向比例三、电压跟随器四、加法运算电路4.1 反向加法电路4.2 同加法电路4.3 特殊应用 五、减法运算电路六、积分电路七、微分电路八、对数和指数运算电路8.1 对数8.2 指数 九、测量放大电路&#xf…

基于matlab根据一系列图像估计单个校准相机的轨迹(附源码)

一、前言 视觉里程计是通过分析一系列图像来确定相机的位置和方向的过程。视觉里程计用于各种应用,例如移动机器人、自动驾驶汽车和无人机。此示例说明如何根据一系列图像估计单个校准相机的轨迹。 此示例演示如何从一系列二维视图估计校准相机的轨迹。此示例使用…

常用字符串处理方法汇总--Pandas

字符串处理只能在Series上进行,不可以在DataFrame上操作,只能对字符串进行处理,不能对整数、日期进行处理 1. 元素统计 1.1 str.count() 1.1.1 函数功能 统计Series中每个元素中包含pat的次数 1.1.2 函数语法 Series.str.count(pat, fl…

美日韩限制光刻机供应,中国正式亮剑,外媒:轮到美芯被卡脖子了

这几年美国频频对中国芯片采取措施,今年以来美国更是变本加厉,联合荷兰和日本限制对中国出售光刻机等芯片设备,试图将中国的芯片工艺限制在45纳米以上,近日我国商务部联合海关等部门宣布对镓、锗等稀有金属实施出口限制&#xff0…

Python实现某只股票的MACD、KDJ指标的单双金叉点判定

金叉理论介绍 在股票K线图中,短期的收盘价均线向上穿越长期均线即为金叉,但如果长期均线向下或变缓,同时短期均线向上穿越就不能称之为金叉。 对于MACD指标,若差离值线由下向上突破移动平均线,即DIF值前一天小于DEA值…

MySQL库表操作的作业

1.创建数据库 create database Market; mysql> show databases; -------------------- | Database | -------------------- | information_schema | | Market | | db1 | | mysql | | performance_schema | | …

消息队列 - RocketMQ

1. 名词解释和概念 NameServer: 是一个无状态节点,可集群部署,节点之间无任何信息同步用于服务注册和发现,为 MQ 集群提供服务协调与治理记录并维护 Topic 和 Broker 的信息为生产者和消费者提供 Topic 的路由信息 无状态和有状…

On the Properties of Neural Machine Translation: Encoder–DecoderApproaches

摘要 Neural machine translation : 神经机器翻译。 神经机器翻译模型经常包含编码器和解码器:an encoder and a decoder. 编码器: 从一个变长输入序列中提取固定长度的表示。a fixed-length representation. 解码器:从表示中…

抖音SEO矩阵系统源码开发部署(二)技术搭建+二次开发

抖音SEO矩阵系统源码开发 是一项技术密集型工作,需要对大数据处理、人工智能等领域有深入了解。该系统开发过程中需要用到多种编程语言,如Java、Python等。同时,需要使用一些框架和技术,如Hadoop、Spark、PyTorch等,以…

第五章 运输层【计算机网络】

第五章 运输层【计算机网络】 前言推荐第五章 运输层5.1运输层协议概述5.1.1 进程之间的通信5.1.2运输层的两个主要协议5.1.3运输层的端口 5.2用户数据报协议UDP5.2.1UDP概述5.2.2UDP的首部格式 5.3传输控制协议TCP概述5.3.1TCP最主要的特点5.3.2TCP的连接 5.4可靠传输的工作原…

手写操作系统--进入保护模式的开篇

之前我们讲的主引导扇区以及内核加载器等内容。都是在实模式下运行的。在实模式下寻址范围仅有1M,是远远不够我们用的。我们想要更大的内存空间,就得进入保护模式,实模式是一个历史遗留问题,本身是没有这个名字的。是因为有了保护…

【算法集训之线性表篇】Day 01

文章目录 题目知识点补充思路分析代码实现运行结果 题目 01.从顺序表中删除具有最小值元素(假设唯一)并返回被删元素的值。空出位置由最后一个元素填补,若顺序表为空,则显示出错信息并退出运行。 知识点补充 顺序表的特点是逻辑…

CRM系统中AI如何进行销售线索评分?有什么好处(上)

每个公司的TOP销售都是精明的猎手。他们善于从大量潜在客户中挑出最可能购买的,把最好的时间、精力和资源给到高意向客户。意向度差一些的排在后面,在资源分配上也会降低。现在,您可以通过AI来进行线索评分,可以说CRM销售线索评分…

SIP 协议的主要流程

目录 SIP 协议的呼叫模型图 基本呼叫建立流程 基本呼叫拆除流程 经过代理的呼叫建立流程 经过代理的呼叫拆除流程 SIP 协议在软交换 SoftX3000(华为推出的一个支持sip协议的交换机设备) 流程图 SIP 协议的呼叫模型图 MGC 负责将 PSTN 前向信令映射…

ETHERNET/IP转MODBUS-TCP协议网关

远创智控YC-EIP-TCP 是自主研发的一款 ETHERNET/IP 从站功能的通讯网关。该产品主要功能是将各种 MODBUS-TCP 设备接入到 ETHERNET/IP 网络中。 本网关连接到 ETHERNET/IP 总线中做为从站使用,连接到 MODBUS-TCP 总线中做为主站(客户端)或从站…

淘上拼/拼上拼/抖上拼分别是什么意思(操作玩法是怎样的及数据采集代码举例)

拼多多店群玩法最常见的就是淘上拼、拼上拼、抖上拼这三种,但是很多的商家都不了解这三种玩法是什么意思,更别提操作了,本期小编就来为你们详细介绍一下。 淘上拼: 传统玩法:通过蓝海词,采集类目爆款商品数…

若依前端,菜单栏切换时刷新问题[页面菜单切换时,页面总是重新刷新,导致页面输入的查询参数重载清空]...

前端页面菜单切换时,页面总是重新刷新,导致页面输入的查询参数重载清空 这样切换时,页面就刷新了,解决方法在这里 1,页面代码,这里指定name name: "Item", 注意 name的首字母必须大写 2&#xff…

密盾科技即将推出同态加密隐私计算开源平台Pinsehub!

密盾科技预计将于8月底正式推出同态加密隐私计算平台Pinsehub-Platform。Pinsehub隐私计算平台将涵盖匿踪查询、隐私求交、联合建模、联合统计、算法容器管理、数据资源管理、数据确权与定价(开发中)、异构平台互联互通(开发中)等…

Spring中@Autowired和@Resource的区别:

文章目录 一、Autowired二、Resource三、Autowired和Resource的区别: 一、Autowired Autowired 这个注解呢,是由 Spring 提供的,它可以用来对构造方法、成员变量以及方法参数上进行标注,能够根据对象类型完成自动注入。 public …

Podman下载安装说明以及通过下载mysql镜像

Podman下载地址 Releases containers/podman GitHub csdn下载地址:https://download.csdn.net/download/u010479989/88010018 下载exe会自动添加到环境变量中,下载zip需要手动设置环境变量 初始化命令 podman machine init 这个时候会提示安装wsl&…