客户案例丨拓数派向量计算引擎PieCloudVector助力东吴证券AIGC应用升级

news2024/10/6 22:32:48

1.项目背景

随着人工智能技术的不断创新和应用,我们可以看到人工智能在各个领域的应用越来越广泛。深度学习技术在图像识别、语音识别、自然语言处理等领域表现出色。机器学习算法的改进将解决更多实际问题,如增强学习、迁移学习和联合学习等,以更有效地处理复杂的数据问题。自然语言处理技术的不断进步,有助于实现更自然的对话和交流方式,在智能客服、虚拟助手、智能翻译等方面有着广泛应用。数据与AI融合是不可阻挡的历史潮流,大数据和AI技术相互激发、相辅相成,共同推进彼此的发展,两把“金钥匙”握手会再次在金融行业掀起高潮。

AIGC类应用是数智融合的典型,底层基础是强大的数据治理能力,预训练语言大模型不断获得高质量数据进行训练、迭代和优化,从而带来远胜以往的智能应用理念。大模型将激活证券行业的非结构化数据,更高效地释放数据价值,应用将渗透到业务前中后段,带来新的生产力升级。大模型的爆发,将金融业带入到了一个全新时代,但同时也给行业带来了一些难题。

2.现状及痛点

2.1 数据安全问题

涉及敏感信息的业务应用,数据隐私是一个不可忽视的问题。部分场景中存在调用LLM API接口服务的情况,不能直接拿取业务数据,需要考虑数据泄露的风险。

2.2 私域数据问题

通用大模型在训练过程中并未接触过企业的私域数据和特定业务场景,因此,它们无法完全满足企业实际需求,也无法优化企业的具体业务流程,需要将其与企业内部的特定知识和数据进行整合。

2.3 实时性问题

大模型通常是基于历史的某个时间点及其以前的数据进行训练和优化的,缺失了部分实时的数据,假如有用户询问有关最新数据的问题,AIGC会生成错误的答案,这就是LLM幻觉问题。并且LLM计算并生成对应答案也需要一定的时间,一般都在3~5秒左右,用户交互时延较高。

2.4 长期记忆问题

LLM主要是处理数据,并能生成数据,但是本身却没有长期记忆能力, 这对于需要持续互动的AIGC场景是致命问题,长期记忆对于维持上下文理解至关重要,可以提供更自然、更个性化的用户体验。缺乏长期记忆,影响了LLM的性能和AIGC类应用的用户体验。

3.基于向量数据库的AIGC应用

3.1 整体架构

3.2 解决方案

  • 采用自研大模型东吴秀财GPT + LangChain开发框架 + PieCloudVector向量数据库构建了AIGC应用平台,接入了交易应用的结构化数据和非结构化数据,其中非结构化数据主要是文本类数据(如法律法规、金融资讯、产研报告等);

  • 东吴秀财GPT当前生产上线的参数为130亿,将于2024年4月中旬完成千亿参数大模型的训练,训练集包括2.235万亿Tokens的中英文语料,其中包括4000亿Tokens的金融语料,采用40台8卡H800训练;

  • 拓数派提供了分布式的向量数据库PieCloudVector,采用4节点部署,总数据量超4TB,单Collection最大近2亿条向量数据,支持多种索引类型和主流检索算法;

  • PieCloudVector配合东吴秀财GPT大模型,整体形成了RAG架构,PieCloudVector主要存储Embedding后的向量数据,同时也支持应用的标量数据存储,并提供LangChain的SDK,无缝集成到AIGC应用开发框架中;

  • PieCloudVector是拓数派国内自主研发产品,通过了信通院的向量数据库能力测试。本次在东吴证券中也基于国产海光服务器和国产麒麟操作系统部署,满足了自主可控的要求。

3.3 应用及收益

  • 东吴秀财GPT基于文本理解与生成、RAG增强搜索、企业智能中枢、智能BI四大应用范式,开发了N个AI证券行业应用场景。现有应用包括涨跌分析和盘后总结,企微AI客服助手,智能尽职调查、年报问答、基金问答、量化投资、内部培训等,并接入了东吴数字人;

  • PieCloudVector向量数据库支撑东吴秀财GPT训练阶段的海量数据的分类、去重和清洗,给大模型的训练降本增效;

  • 通过外挂基于PieCloudVector向量数据库的知识库,帮助大模型提升处理新问题的能力,突破预训练带来的知识时间限制,避免大模型出现幻觉;

  • 在推理阶段,通过PieCloudVector向量数据库本身的权限控制,能真正实现隐私数据可控不出域。同时减少重复计算,通过缓存避免反复进行大模型推理,提高响应速度和性能;

  • 在上下文限制方面,由于PieCloudVector具备历史数据持久化的能力,同时通过内置的KNN、ANN算法做相似性查询,返回最相关内容,从而突破大模型上下文限制,实现长期记忆。将大模型问答结果进行缓存,确保数据一致性,避免因模型更新或数据变化而引起的结果不一致问题,提升用户信任度;

  • PieCloudVector向量数据库具备万亿级大规模向量数据库快速查询的能力,支持单节点多线程的索引创建,可充分调度硬件所有计算能力,索引创建性能提升5倍,检索性能提升6倍,交互响应速度提升3倍。

4.PieCloudVector产品优势

5.PieCloudVector应用场景

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1566345.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一个瓶盖和电子工程师以及机械工程师能有什么联系?

过小的产品空间是一种罪 我也曾经是喜欢将东西做的小巧,其实这是不归路,特别是对于产品,一不小心,就会发生可怕的问题. 最近某厂供应的一批一体机,设计上有严重缺陷,外壳做小了,散热孔开的太小…

什么是智慧驿站?智慧驿站有哪些功能?创新型智慧公厕解说

近年来,随着智能科技的迅速发展,人们对于城市生活的期望也逐渐提升。作为城市基础设施的一部分,智慧驿站应运而生。它不仅是一座智慧公厕,更是集合了多种功能,给我们带来全新的城市生活体验。本文以智慧驿站智慧公厕源…

使用Vite创建一个vue3项目

一、vite是什么? vite 是一种新型前端构建工具,能够显著提升前端开发体验。它主要由两部分组成: 一个开发服务器,它基于原生 ES 模块提供了丰富的内建功能,如速度快到惊人的模块热更新(HMR)。 …

如何监控特权帐户,保护敏感数据

IT基础设施的增长导致员工可以访问的凭据和资源数量急剧增加。每个组织都存储关键信息,这些信息构成了做出关键业务决策的基石。与特权用户共享这些数据可以授予他们访问普通员工没有的凭据的权限。如果特权帐户凭证落入不法分子之手,它们可能被滥用&…

【随笔】Git 高级篇 -- 分离 HEAD(十一)

💌 所属专栏:【Git】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! 💖 欢迎大…

成都直播基地出租:天府新区兴隆湖天府锋巢直播产业基地

天府新区兴隆湖天府锋巢直播产业基地,作为成都乃至西部地区的一颗璀璨明珠,正以其独特的魅力和无限的潜力,吸引着越来越多的目光。这里不仅是成都直播产业的聚集地,更是传统企业转型升级的摇篮,是新媒体时代下的创新高…

v-text 和v-html

接下来&#xff0c;我讲介绍一下v-text和v-html的使用方式以及它们之间的区别。 使用方法 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-widt…

2024 ccfcsp认证打卡 2022 09 01 如此编码

2022 09 01 如此编码 题解1题解2 题解1 import java.util.Scanner;public class Main {public static void main(String[] args) {Scanner sc new Scanner(System.in);int n sc.nextInt(); // 天数int m sc.nextInt(); // 科目数int[] b new int[n 1]; // 存放结果的数…

【零基础学数据结构】顺序表

目录 1.了解数据结构 什么是数据结构&#xff1f; 为什么要进行数据管理&#xff1f; 2.顺序表 顺序表概要解析&#xff1a; ​编辑顺序表的分类&#xff1a; 差别和使用优先度&#xff1a; 1.创建顺序表 1.1顺序表分为静态顺序表和动态顺序表 1.2顺序表的初始化…

北方经贸经济类知网收录月刊投稿发表论文

《北方经贸》期刊是由国家新闻出版总署批准&#xff0c;黑龙江省教育厅主管&#xff0c;黑龙江省经济管理干部学院主办的经济类综合期刊。期刊融理论性、知识性、实践性于一体&#xff0c;立足龙江&#xff0c;辐射全国&#xff0c;面向世界&#xff0c;注重研究解决重大现实理…

安泰电子 :电压放大器的技术指标有哪些

电压放大器是电子设备中常见的一种电路&#xff0c;它的作用是将输入信号的电压放大到所需的输出电压。电压放大器的技术指标描述了其性能和特征&#xff0c;涵盖了许多方面。下面西安安泰将详细介绍一些电压放大器的技术指标。 增益&#xff1a;增益是电压放大器最基本的指标之…

百卓Smart管理平台 importexport.php SQL注入漏洞复现(CVE-2024-27718)

0x01 产品简介 百卓Smart管理平台是北京百卓网络技术有限公司(以下简称百卓网络)的一款安全网关产品,是一家致力于构建下一代安全互联网的高科技企业。 0x02 漏洞概述 百卓Smart管理平台 importexport.php 接口处存在SQL注入漏洞,攻击者除了可以利用 SQL 注入漏洞获取数据…

简单了解波 Mono-repo Multi-repo(Poly-repo)

Mono-repo 和 Multi-repo 是软件开发中代码管理的两个不同策略。Mono-repo & Multi-repo 孰优孰劣是个老生常谈得话题了&#xff0c;这里就不 PK 了&#xff0c;“略微”看下两者区别。 当我们使用 Git 作为版本控制系统管理项目的代码时&#xff0c;那么 monorepo 与 mul…

【Java】Thread详解

&#x1f352;前言 本文将从以下几方面来展开对Thread的介绍。 1.线程创建 2.线程中断 3.线程等待 4.线程休眠 在前面的文章中&#xff0c;已经总结了关于Thread的一些理解。 在阅读本文之前&#xff0c;最好对其有一些基础的了解。 文章链接: 【JavaSE】进程是什么&#xff1f…

Webpack部署本地服务器

Webpack部署本地服务器 目录 Webpack部署本地服务器目的认识模块热替换&#xff08;HMR&#xff09;什么是 HMRHMR 通过如下几种方式, 来提高开发的速度如何使用 HMRhost 配置 目的 完成自动编译 常用方式: webpack-dev-server webpack-dev-server 是一个用于开发环境的 Web 服…

一文读懂!企业怎样才能选择适合自己的生产管理系统?

怎么选择适合所在企业的生产管理系统呢&#xff1f;该从哪些方面对生产管理系统进行评估&#xff1f;又怎样实现高效的生产管理呢&#xff1f; 本文我将和大家一起解决这些有关生产管理系统的问题&#xff1f; 生产管理系统模板&#xff0c;可直接查看和使用&#xff1a;https…

Rredis缓存常见面试题

文章目录 1.什么是缓存穿透&#xff0c;怎么解决2.什么是缓存击穿&#xff0c;怎么解决3.什么是缓存雪崩&#xff0c;怎么解决4.双写一致性问题5.redisson添加的排他锁是如何保证读写、读读互斥的6.为什么不使用延迟双删7.redis做为缓存&#xff0c;数据的持久化是怎么做的8.re…

【零基础C语言】编译和链接

1.翻译环境和运行环境 翻译环境&#xff1a;将源代码转化为可执行的机器指令 运行环境&#xff1a;用于执行机器指令 1.1 翻译环境 翻译环境由编译和链接两大过程构建&#xff0c;编译又可以分为三大过程&#xff1a; 【1】预处理(预编译) 【2】编译 【3】汇编 不同的.c文件经…

【数据处理包Pandas】多级索引的创建及使用

目录 一、元组作为一级索引&#xff08;一&#xff09;示例1&#xff08;二&#xff09;示例2 二、引入多级索引&#xff08;一&#xff09;多级索引的创建&#xff08;二&#xff09;多级索引中的数学选取 首先&#xff0c;导入 NumPy 库和 Pandas 库。 import numpy as np i…

MTU/TCPMSS/VLAN/ACCESS/TRUNK/HYBRID

MTU RFC标准定义以太网的默认MTU值为1500 最小64字节是为了保证最极端的冲突能被检测到&#xff0c;64字节是能被检测到的最小值&#xff1b;最大不超过1518字节是为了防止过长的帧传输时间过长而占用共享链路太长时间导致其他业务阻塞。所以规定以太网帧大小为64~1518字节&am…