做实大模型的产业价值,度小满深耕“NLP+金融”

news2024/11/19 22:39:58

281c68c28334a2cd5452d7693194844e.jpeg

2023年的五月,称得上一句AI之夏。

大模型层出不穷、扎堆发布。

这一轮由大模型推动的AI热潮中, NLP(自然语言处理)技术与金融落地场景的结合备受期待。金融行业是数字化、智能化的先行者,也是大模型技术落地的最佳领域。如果将大模型的能力放在金融行业中去处理原有的任务,会对很多工作产生颠覆性的影响。

对科技企业来说,不仅要积极参与“训大模型”的技术竞赛,更重要的是,从场景出发,用最快速度完成大模型的业务落地、找到可行的产业逻辑。

255203dee28a95d133d858941b29e79a.png

这条“NLP+金融”的技术落地之路,度小满已经走了五年。作为源自百度的公司,度小满在NLP上的积累得天独厚。我们从度小满NLP开始,去看看NLP与金融的可能性,以及AI走向产业的应用落地是如何实现的。

大模型时代,

打开NLP+金融的想象力

1877c8a9e6354a4a6303be94669679f7.png

大模型的到来,让NLP技术在金融领域的应用,打开了想象空间。

几乎所有金融单位都要处理大量文本、文档,NLP技术有潜力贯穿金融业务的所有环节:

1.读。超大规模的预训练生成式大模型,能够对金融业务场景中的数据信息和隐藏知识进行更高效的挖掘和理解,“多快好省”从文档文本数据中抽取出相应的信息,包括文档智能信息抽取、OCR、舆情分析、暴雷事件分析、报警、风控等,提高决策能力。

比如信贷辅助决策,基于强大的语义理解能力,读懂非结构化数据,包括财务报告自动化解析、数据智能挖掘、信贷流水材料智能处理、宏观行业分析、风险事件传导分析等。

在金融领域,征信报告是识别个人信用的最重要风控手段,小微企业融资难,一个主要原因是个人征信报告中存在大量非结构化数据,很难用传统的数据处理方式进行分析。度小满“智能化征信解读中台”,将NLP、图算法应用在征信报告的解读上,能够将报告解读出40万维的风险变量,将银行风控模型的风险区分度提升了26%。

a7373ebeb4a4776a65bb8d6d3b32ffdb.png

2. 写。利用大模型的生成能力,自动化生成金融信息的抽取汇总、年报、行情预判、客户画像、营销方案等,成为金融从业人员的“全能助理”, 提升金融机构的效率。

3.说。基于自然语言的通用对话能力,更智能的任务式对话理解,打造全新的的智能客服、智能交互服务,例如 “超级金融顾问”,提供专业建议和方案辅助交流,快速高效低成本地响应用户需求,让金融更有温度。

e86edccfbbfa5d5d2451d2330c3c0f89.png

从“智能”到“致用”

度小满的NLP之路

自然语言处理是人工智能皇冠上的明珠,但在大语言模型展露出强大的通用能力之前,如何用这颗“明珠”洞察金融数据,没有现成的路可走,全世界专注做NLP公司都比较少。2018年的时候,金融科技公司成立专门的NLP团队的更是鲜见,NLP在金融领域的应用落地也相对有限。

度小满则走出了一条独特的NLP之路。2018年创立之初,度小满就看到了“NLP+金融”的潜力,开始进行相应的产业布局。

首先是人才。人才是创新的源头。作为源自百度的公司,度小满在NLP技术上的人才储备可为得天独厚。度小满CTO许冬亮,2005年从清华大学计算机系人工智能实验室毕业后加入百度,三年多时间成长为百度搜索算法领域的领军人物,在自然语言处理、搜索算法及架构、知识图谱、LBS、智能营销及反欺诈等领域屡破难关。度小满技术委员会执行主席杨青,曾任百度主任架构师,有着丰富的技术应用实践经验。

有了人才作为技术创新的驱动力,度小满在NLP前沿领域持续探索,并不断斩获成果。

2021年,在微软举办的MS MARCO 比赛中的文档排序Document Ranking(文档排序)任务中,度小满的AI-NLP团队排名第一并刷新纪录。2022年,团队研发的轩辕 (XuanYuan) 预训练模型也在中文语言理解领域最具权威性的测评基准之一CLUE分类任务中排名第一。度小满AI-Lab在预训练模型、用户表示、序列建模等NLP任务相关算法也取得了突破性进展,相关论文被收入NLP顶会。

更重要的是,度小满的NLP之路并没有止步于学术赛场和实验室,而是积极走向产业,推动NLP技术与金融场景紧密结合,典型的就是信贷风控场景的征信报告解读。

067da555c3e6bf8f165b0b6c81f7d46e.png

2023年,由度小满建设的“智能化征信解读中台”工程,将大型语言模型 LLM、图算法应用在征信报告的解读上,荣获了 “吴文俊人工智能科学技术奖”,度小满也凭借该工程成为唯一入选的金融科技公司。

今年以来,大语言模型的爆发,让NLP这一技术路线成为科技公司和大众关注的焦点。

2023年2月,度小满成为百度文心一言首批生态合作伙伴,推动对话式语言模型技术在国内金融场景的落地应用。

大语言模型掀起的AI热潮还在持续,大众的关注焦点,也从“训大模型”,扩展到了“用大模型”的长线故事。

度小满作为一支超前布局、技术前沿性强、与金融产业接轨十分成熟的NLP力量,有望跑通大模型从技术到产业应用的落地之路。

3eaffdb5dce9904c3b6757f1583082ca.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/542952.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

chatgpt赋能Python-python3h怎么操作

Python3 SEO操作指南 Python3语言已成为计算机编程领域的标准和主要工具之一。SEO(Search Engine Optimization)是一种促进网站在搜索引擎结果中排名的技术。Python3也可以用来执行SEO操作,本文将介绍如何使用Python3进行SEO操作&#xff0c…

替换字符串的关键字KeywordProcessor

【小白从小学Python、C、Java】 【等级考试500强双证书考研】 【Python-数据分析】 替换字符串的关键字 KeywordProcessor [太阳]选择题 以下说法错误的一项是: from flashtext import KeywordProcessor myKP KeywordProcessor() myKP.add_keyword(English, Math) …

别在碳排放问题上大搞双重标准!

* * * 原创:刘教链 * * * 隔夜比特币从26.5k一线奋力跃升,回升至27.5k一线。 最近美国有些人又要对比特币的碳排放搞双重标准了。说的是比特币挖矿烧掉了多少多少电力,折合多少多少碳排放,因此应当加征多少多少排放税&#xff0c…

springboot+java电影院售票订票选座推荐系统554c6

主页是注册,登录,搜索。 用户在注册之前可以进行搜索查询现在上映的和即将上映的影片信息,但是不能在线购票。购票需注册登录之后方可。 用户可以修改自己注册后的账户信息,注册成功后直接登录。退出网页后,取消登录信…

ChatGPT APP来了,还可以直接订阅Plus账号,操作流程都这篇里面

大家好,我是可夫小子,关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加:keeepdance,备注:chatgpt,拉你进群。 OpenAI宣布推出聊天机器人ChatGPT的APP,目前已上架苹果App Store&#xf…

三十八、流控效果、热点数据限流、熔断降级、push到配置中心nacos

1、流控效果 流控效果是指请求达到流控阈值时应该采取的措施,包括三种: 快速失败:达到阈值后,新的请求会被立即拒绝并抛出FlowException异常。是默认的处理方式。 warm up:预热模式,对超出阈值的请求同样是…

OpenAI的巨额捐款背后,马斯克到底捐了多少?

来源:Techcrunch 作者:Mark Harris 编译:巴比特 自 2018 年 2 月退出 OpenAI 董事会以来,埃隆马斯克(Elon Musk)一直对 OpenAI 深感失望,这已不是什么秘密,最终他在一封公开信中呼吁…

每日涨停个股增量加入股票池,持续跟踪走势!股票量化分析工具QTYX-V2.6.5

功能概述 目前A股市场的股票每天是有限制最大涨幅的,也就是涨停的概念。比如主板个股最大涨幅是10%,创业板个股最大涨幅是20%等。 对于个股而言并不是随随便便就能被推到涨停板的。或是因为股票发生了重大的利好(资产重组、政策利好、业绩暴增…

【Linux】——常见指令及权限理解

文章目录 1. 前言2. 用户管理3. 常见基本指令3.1 ls指令3.2 pwd指令3.3 cd指令3.4 touch指令3.5 mkdir指令3.6 rmdir指令和rm指令3.7 man指令3.8 cp指令3.9 mv指令3.10 cat指令3.11 more指令3.12 less指令3.13 head指令3.14 tail指令3.15 时间相关的指令3.16 cal指令3.17 find指…

价格战一触即发!阿里云、腾讯云、移动云“先降为敬”

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 5月16日,中国第三大云计算厂商腾讯云,宣布对多款核心云产品降价;随后,移动云也宣布了对多款云产品降价。如今,已有三家云厂商对产品进行降价。开第一枪的便是市场份…

MoJo:比Python快35000倍的全新编程语言!

大家注意:因为微信最近又改了推送机制,经常有小伙伴说错过了之前被删的文章,比如前阵子冒着风险写的爬虫,再比如一些限时福利,错过了就是错过了。 所以建议大家加个星标,就能第一时间收到推送。&#x1f44…

炼丹师,这是你的梦中情炉吗?

一, 炼丹之痛 无论是学术研究还是工业落地,pytorch几乎都是目前炼丹的首选框架。 pytorch的胜出不仅在于其简洁一致的api设计,更在于其生态中丰富和强大的模型库。 但是我们会发现不同的pytorch模型库提供的训练和验证代码非常不一样。 torchvision官方…

社区供稿 | 中文 LangChain 项目的实现开源工作

Chinese-LangChain 是 yanqiangmiffy 同学的开源项目https://hf.co/spaces/ChallengeHub/Chinese-LangChainhttps://github.com/yanqiangmiffy/Chinese-LangChain 中文 langchain 项目,基于 ChatGLM-6b langchain 实现本地化知识库检索与智能答案生成。 LangChain …

YOLOv5+姿态估计HRnet与SimDR检测视频中的人体关键点

一、前言 由于工程项目中需要对视频中的person进行关键点检测,我测试各个算法后,并没有采用比较应用化成熟的Openpose,决定采用检测精度更高的HRnet系列。但是由于官方给的算法只能测试数据集,需要自己根据算法模型编写实例化代码…

[网络安全]XSS之Cookie外带攻击姿势及例题详析

[网络安全]XSS之Cookie外带攻击姿势及例题详析 概念姿势及Payload启动HTTP协议 method1启动HTTP协议 method2 例题详析Payload1Payload2window.open 总结 本文仅分享XSS攻击知识,不承担任何法律责任。 本文涉及的软件等请读者自行安装,本文不再赘述。 概…

Node.js 学习系列(五)—— 文件系统

Node.js 提供一组类似 UNIX(POSIX) 标准的文件操作API。 Node 导入文件系统模块 (fs) 语法如下所示: var fs require("fs")异步和同步 Node.js 文件系统(fs 模块)模块中的方法均有异步和同步版本。 读取文…

异常体系与项目实践

程序式阴影:为什么不报错? 一、简介 在程序开发的过程中,异常处理从来都是一个复杂的维度,无论是新手还是经验老到的选手,在编码时都会面对各种异常情况; 程序中的异常可以反映系统的缺陷和待优化的点&am…

【STM32】基础知识 第十四课 看门狗 IWDG 深入理解与应用

【STM32】基础知识 第十四课 看门狗 IWDG 深入理解与应用 概述什么是独立看门狗 (IWDG)独立看门狗工作原理键寄存器状态寄存器 (IWDG_SR)寄存器配置操作步骤 案例总结 概述 STM32 系列单片机具有强大的内置功能, 其中之一就是独立看门口 (IWDG). 看门狗定时器是一种重要的硬件…

webpack Plugin Loader

本文作者为 360 奇舞团前端开发工程师 webpack是Javascript工具链的关键部分。webpack是个用于现代JavaScript应用程序的静态模块打包工具。它不仅可以支持ESM和CommonJS模块化编程,而且还可以支持或扩展支持许多不同的静态资源,例如:Files,I…

我将开始更新 强化学习

你好,我是zhenguo(郭震) 很久没有更新文章,从现在开始我将逐步恢复更新。在接下来的日子,我将系统更新强化学习文章,在期间,也会插播一些读博做科研的一些日常总结。如果你感兴趣,欢…