超融合承载 PostgreSQL 数据库和 AI 系统的性能评测|金融行业实践

news2025/1/11 7:04:02

随着人工智能技术的日渐成熟,不少金融用户也开发了自己的 AI 应用系统,协助实际业务中诸如文字识别、图像转换、信息录入等工作,提升业务效率。不过,AI 应用系统普遍依赖 GPU 提供强大算力,对底层存储的性能也有较高的要求,“选择什么样的 IT 基础设施支持 AI 应用场景”也成为很多用户关心的问题。

近期,某头部资产管理机构计划升级 IT 基础架构,为生产环境投资分析系统数据库(PostgreSQL)和自研人工智能分析系统(以下简称“AI 系统”)提供高性能、高可靠支持,因此测试了 SmartX 超融合对以上两个应用场景的支持能力。

测试结果
  • 投资分析系统 PostgreSQL 数据库场景:3 节点 SmartX 超融合运行投资分析系统,用时相比生产环境物理服务器增加 1 分钟(18.8%),符合用户预期,可满足业务使用需求。

  • AI 系统:通过 GPU 直通功能在 SmartX 超融合中运行 AI 系统,性能明显优于生产环境某公有云平台,多种模型下文件分析用时降低 15%-27%

更多金融行业场景探索与性能评测,欢迎点击下载《金融核心生产业务场景探索》系列电子书。

《金融核心生产业务场景探索》icon-default.png?t=O83Ahttps://mobile.smartx.com/p/756e0

测试背景

该资管用户生产环境投资分析系统以 PostgreSQL 提供数据库服务,运行在单机物理服务器中,由本地磁盘提供存储能力。同时,用户还自行搭建了人工智能分析系统,运行在某公有云环境的云服务器中(每年公有云的投入高达数十万,成本较高)。AI 系统使用的模型包括 whisper(large-v2) 和 cogvlm2(int4),主要用于对音频、PDF 和图片等业务材料进行文字识别和转换,以及后续的数据分析和存档备份,以减少手工录入、提升工作效率。

为了进一步开展 IT 基础设施现代化建设并实现降本增效,以更低的成本投入为以上两个应用场景提供高性能、高可靠、易运维的 IT 基础架构支持,用户测试了 SmartX 超融合对两个应用场景的支持能力,并与生产环境性能表现进行了对比。

环境与配置

投资分析系统 PostgreSQL 数据库场景

为了确保测试虚拟机系统环境与物理服务器系统环境相同,本次测试使用 SmartX 自研 P2V 迁移工具 SMTX CloudMove,将当前运行在物理服务器上的投资分析系统 PostgreSQL 数据库在线迁移至 SmartX 超融合平台的虚拟机中。

硬件配置

软件配置
  • 生产环境物理机操作系统:CentOS 7.9

  • 测试环境超融合软件:SMTX OS 6.0

AI 系统

生产环境中,AI 系统部署在某公有云云主机中。测试环境中,在 SmartX 超融合平台创建一个配置规格相同的虚拟机,通过 GPU 直通功能将 NVIDIA L20 GPU 卡挂载至虚拟机中,部署应用模型后进行测试。欲深入了解 SmartX 超融合 GPU 直通与 vGPU 支持功能,请阅读:GPU 直通 & vGPU:超融合为 GPU 应用场景提供高性能支持。

系统环境

GPU 卡信息 
* 在进行 AI 模型推理如 whisper 和 cogvlm 时,使用更多的是 GPU 内的 Tensor Core 进行 Transformer (whisper)与卷积网络矩阵运算(cogvlm),并非单纯依靠 CUDA Core。因此生产环境与测试环境使用的 GPU 在此次测试项目中综合表现基本持平,测试结果差异主要反映了两个平台虚拟机性能和存储性能的差异。

测试项目 

  • 投资分析系统数据库性能测试:通过测试脚本发起对不同资产产品进行分析的任务,获取每项产品的分析耗时,并与生产环境任务用时进行对比。

  • AI 系统性能测试:分别测试 whisper 模型和 cogvlm 模型下多种文件的分析用时(包含图像、音频和视频),并与生产环境分析用时进行对比。

测试结果

投资分析系统 PostgreSQL 数据库性能测试

测试时,SMTX OS 开启 RDMA,经过多次优化,将虚拟机配置调整为 8vCPU 和 256GB 内存,保持服务器超线程关闭和虚拟机处理器物理透传,并对虚拟机 vCPU 做物理核绑定。测试结果如下图所示。

可以看到, 在 SmartX 超融合中运行投资分析系统 PostgreSQL 数据库,测试总用时比裸金属环境慢 1 分钟左右(18.8%),用户表示结果符合预期,可满足用户的业务使用需求。更重要的是,这一测试结果是基于 8 个虚拟核(vCPU)对比生产环境的 32 个物理核得出的,在硬件资源仅有原环境约 1/8 的情况下(测试环境与原生产环境都使用二代 XEON,CPU 主频相差也仅为 0.1 GHz),实际性能差异只有不到 19%,超融合环境能更好地满足用户更为看重的整体拥有成本(TCO)以及运行效率方面的需求。

另外,我们在测试过程中通过 iostat / top 等工具对超融合节点性能进行持续监控,观察到存储间歇性压力为 30-50MB/s,iowait 持续为 0,内存用量约为 20G 左右,而 CPU 单核负载保持在 99%,因此性能方面的压力主要集中在 CPU 上。

AI 系统性能测试 

whisper 模型测试

cogvlm 模型测试 

可以看到,在两个模型测试中,SmartX 超融合支持 AI 系统进行多种文件分析任务(包括图像、音频、视频),相较生产环境公有云用时缩短了 15%-27%,用户对此性能表现十分满意。

总结

整体而言,SmartX 超融合平台能够为金融用户投资分析系统数据库(PostgreSQL)和人工智能分析系统提供高性能、高可靠的基础架构支持,尤其是在 AI 场景中,SmartX 超融合性能明显优于公有云环境,能更好地满足业务需求。此外,超融合架构简洁、灵活的特点,能够为用户带来更多收益:

  • 灵活扩展:支持最少 3 节点部署,按需扩展,带来媲美公有云的灵活性。

  • 简化运维:超融合架构简单,具备多种运维支持功能,降低运维难度。SMTX CloudMoveSMTX CloudMoveSMTX CloudMove 自研迁移工具支持用户高效、便捷地从物理机、公有云、虚拟化平台迁移至 SMTX OS 集群。

  • 多种 GPU 支持特性:支持 GPU 直通、vGPU 功能,以及 MIG、MPS 等技术,允许用户对 GPU 进行灵活切分。

  • 降本增效:避免高昂的公有云投入,以性价比更高的超融合平台提供更强大的性能支持。SmartX 超融合也支持 CPU、GPU 资源的灵活分配,提升资源利用率,且支持用户利旧既有服务器利旧既有服务器利旧既有服务器,进一步降低硬件成本。

欲深入了解 SmartX 超融合对 AI 应用场景的支持能力,请阅读:

  • 支持企业级 AI 应用,IT 基础架构应具备哪些能力?有哪些解决方案?

  • GPU 直通 & vGPU:超融合为 GPU 应用场景提供高性能支持

您还可下载《SmartX 产品在数据库场景下的测试与实践合集》,了解更多行业用户使用 SmartX 超融合和分布式存储支撑 Oracle、MySQL 和信创数据库的评测与实践。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2254908.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VBA信息获取与处理第四个专题第二节:将工作表数据写入VBA数组

《VBA信息获取与处理》教程(版权10178984)是我推出第六套教程,目前已经是第一版修订了。这套教程定位于最高级,是学完初级,中级后的教程。这部教程给大家讲解的内容有:跨应用程序信息获得、随机信息的利用、电子邮件的发送、VBA互…

汽车IVI中控开发入门及进阶(三十七):基于HFP协议的蓝牙电话

概述: HFP全称Hands-free Profile,是一款让蓝牙设备控制电话的软件,多用于汽车上。此类设备最常见的例子是车载免提装置与蜂窝电话或可穿戴无线耳机一起使用。该配置文件定义了支持免提配置文件的两个设备如何在点对点的基础上相互交互。免提模式的实现通常使耳机或嵌入式免…

声音克隆技术:探索与实践 —— 从GPT-SoVITS V2到未来趋势20241201

声音克隆技术:探索与实践 —— 从GPT-SoVITS V2到未来趋势 引言:AI与声音创作的完美碰撞 🎤✨ 声音克隆技术正以惊人的速度改变语音生成的方式。从文本到语音,从音色到情感,人工智能赋予了声音创作全新的可能性。 在这…

ip地址显示本地局域网什么意思?ip地址冲突怎么解决

在日常使用网络的过程中,我们可能会遇到IP地址显示“本地局域网”的情况,同时,局域网内IP地址冲突也是一个常见且令人头疼的问题。本文将首先解释IP地址显示本地局域网的含义,随后详细探讨局域网IP地址冲突的解决方法,…

MR30分布式IO模块赋能喷水织机

纺织行业作为我国传统支柱产业,历经数千年的演变,如今仍面临着诸多困境,在纺织行业中,每一次技术的飞跃都是对行业边界的勇敢探索。在纺织行业,喷水织机作为关键生产设备,其性能直接影响到产品质量和产能。…

自建服务器,数据安全有保障

在远程桌面工具的选择上,向日葵和TeamViewer功能强大,但都存在收费昂贵、依赖第三方服务器、数据隐私难以完全掌控等问题。相比之下,RustDesk 凭借开源免费、自建服务的特性脱颖而出!用户可以在自己的服务器上部署RustDesk服务端&…

html小白初学

语义化更易读,seo;搜索引擎优化 块级元素:独占一行,不管内容长度 内联元素:紧跟着排列 盒模型: 标准盒模型,内容即为长宽,内外边距,框都不算。 怪异盒模型&#xff0…

Python subprocess.run 使用注意事项,避免出现list index out of range

在执行iOS UI 自动化专项测试的时候,在运行第一遍的时候遇到了这样的错误: 2024-12-04 20:22:27 ERROR conftest pytest_runtest_makereport 106 Test test_open_stream.py::TestOpenStream::test_xxx_open_stream[iPhoneX-xxx-1-250] failed with err…

RTCMultiConnection 跨域问题解决

js套件地址 https://github.com/muaz-khan/RTCMultiConnection server套件地址 https://github.com/muaz-khan/RTCMultiConnection-Server 要解决的就是server代码的跨域问题 原装写法: 解决写法: // 喜欢组合语法的自己组 const io new ioServer.S…

即时通信系统项目总览

聊天室服务端项目总体介绍 本项目是一个全栈的即时通信系统, 前端使用QT实现聊天客户端, 后端采⽤微服务框架设计, 由网关子服务统一接收客户端的请求, 再分发到不同的子服务上处理并将结果返回给网关, 网关再将响应转发给客户端 拆分的微服务包含: 网关服务器&…

网络原理之 TCP 协议

目录 1. TCP 协议格式 2. TCP 原理 (1) 确认应答 (2) 超时重传 (3) 连接管理 a) 三次握手 b) 四次挥手 (4) 滑动窗口 (5) 流量控制 (6) 拥塞控制 (7) 延时应答 (8) 捎带应答 3. TCP 特性 4. 异常情况的处理 1) 进程崩溃 2) 主机关机 (正常流程) 3) 主机掉电 (…

从零开始的使用SpringBoot和WebSocket打造实时共享文本应用

在现代应用中,实时协作已经成为了非常重要的功能,尤其是在文档编辑、聊天系统和在线编程等场景中。通过实时共享文档,多个用户可以同时对同一份文档进行编辑,并能看到其他人的编辑内容。这种功能广泛应用于 Google Docs、Notion 等…

「Mac畅玩鸿蒙与硬件43」UI互动应用篇20 - 闪烁按钮效果

本篇将带你实现一个带有闪烁动画的按钮交互效果。通过动态改变按钮颜色,用户可以在视觉上感受到按钮的闪烁效果,提升界面互动体验。 关键词 UI互动应用闪烁动画动态按钮状态管理用户交互 一、功能说明 闪烁按钮效果应用实现了一个动态交互功能&#xf…

SSM报错:表现层方法应该返回字符串,但是返回页面

在进行SSM项目时,后端表现层应该返回给前端字符串,但是却跳转页面 1.首先检查是否使用ResponseBody注解 ResponseBody注解 作用:将java对象转为json格式的数据。将controller的方法返回的对象通过适当的转换器转换为指定的格式之后&#xff0…

重生之我在异世界学编程之C语言:深入结构体篇(上)

大家好,这里是小编的博客频道 小编的博客:就爱学编程 很高兴在CSDN这个大家庭与大家相识,希望能在这里与大家共同进步,共同收获更好的自己!!! 本文目录 引言正文《1》 结构体的两种声明一、结构…

Diffusion中guidance_scale 的理解

guidance_scale 是一个控制生成图像引导程度的参数。它的含义和使用与论文 Imagen: Photorealistic Text-to-Image Diffusion Models with Composable Conditions 中的公式 (2) 的引导权重 类似。 1. Classifier-Free Guidance 的背景 Classifier-Free Guidance 是一种在扩散…

【kettle】mysql数据抽取至kafka/消费kafka数据存入mysql

目录 一、mysql数据抽取至kafka1、表输入2、json output3、kafka producer4、启动转换,查看是否可以消费 二、消费kafka数据存入mysql1、Kafka consumer2、Get records from stream3、字段选择4、JSON input5、表输出 一、mysql数据抽取至kafka 1、表输入 点击新建…

新书速览|循序渐进Node.js企业级开发实践

《循序渐进Node.js企业级开发实践》 1 本书内容 《循序渐进Node.js企业级开发实践》结合作者多年一线开发实践,系统地介绍了Node.js技术栈及其在企业级开发中的应用。全书共分5部分,第1部分基础知识(第1~3章)&#xf…

基于大模型的图像重命名工具ai-renamer

文章目录 基础使用语言问题命名风格 基础使用 ai-renamer是一款自动为图片重命名的工具,由于需要调用基于本地大模型,在使用之前需要用Ollama或者LM Studio配置好至少一个大模型,比如Llava, Gemma, Llamad等。如果想要为视频重命名&#xff…

element Cascader级联选择器 点文字即可选中,去掉radio按钮

需求 将示例的点击radio和点击文字功能结合在一起。可以选择任意一级的内容,直接点击文字即可选中,同时如果有下一级就展示,去掉radio标签。 实现方法 通过css将radio标签做成文字框一样大小并且透明覆盖在整个文字上方,点击文…