大模型性能测试报告

大模型性能测试报告

news2025/4/11 18:59:09

性能测试背景

满足大模型在初期1万用户的正常使用

性能测试名词解释

术语	释义
VU	并发用户数
RT	响应时间
TPS	吞吐量的一种，指每秒处理的事务数，每个事务可以是一个接口或者多个接口
QPS	吞吐量的一种,指每秒服务器处理的请求数量（就是服务器的接口）可以理解为就是一个接口

环境信息

网络:Chery-wifi

服务:python的Flask开发

压测工具

工具	版本
jmeter	5.6.3

测试场景

分析:查询历史聊天和用户会话聊天这两个场景是产品的核心也是用户用的比较多的

历史聊天场景

AI角色有小奇和小瑞，历史聊天记录有置顶和非置顶

查询会话角色设置50%的流量走小奇，50%的流量走小瑞，每个角色下20%的流量走置顶，80%的流量走非置顶

并发压测结果

设置100并发量, 压测20分钟。样本总量124675，响应时间:400ms左右(在没有产品特别说明情况下一般不超过500ms就可以)，错误率:0.02% 。错误统一是连接被拒绝(网络问题)

历史消查询api的资源占用

压测过程中cpu占用率11%左右，内存占用率19%左右

数据库的资源占用

cpu占用率16%左右，数据库内存占用1%左右较少

聊天场景

按照角色50%的流量走小奇，50%的流量走小瑞。压测过重中整理一批query不停地发送

并发压测结果

压测20分钟0~10分钟并发量50,10~20分钟并发量100。除显卡占用量比较高达到几乎达到100%。无其他明显异常。

GPU的占用

并发量150

由于流式接口同样情况下，比非流式接口性能要求更高些(因为在流式返回过程中用户可能更集中，所以继续加到150的VU量)

并发量直接达到150,异常率达到98%,报错如下图

大模型压测脚本

详见绑定资源大模型性能压测脚本

问题汇总

问题描述	解决结果	解决措施
聊天场景VU量达到150时大量报错	未解决	/

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1909438.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

HTML5新增的input元素属性：placeholder、required、autofocus、min、max等

HTML5新增的input元素属性：placeholder、required、autofocus、min、max等

HTML5 大幅度地增加与改良了 input 元素的属性，可以简单地使用这些属性来实现 HTML5 之前需要使用 JavaScript 才能实现的许多功能。下面将详细介绍这些新增的 input 元素的属性。属性说明属性说明placeholder在输入框显示描述性或提示性文本list为文本框添加选…

阅读更多...

摸鱼大数据——Spark SQL——Spark SQL函数定义一

摸鱼大数据——Spark SQL——Spark SQL函数定义一

Spark SQL函数定义 1、窗口函数回顾之前学习过的窗口函数： 分析函数 over(partition by xxx order by xxx [asc|desc] [rows between xxx and xxx])分析函数可以大致分成如下3类：1- 第一类: 聚合函数 sum() count() avg() max() min()2- 第二类: 排…

阅读更多...

Python酷库之旅-第三方库Pandas(011)

Python酷库之旅-第三方库Pandas(011)

目录一、用法精讲 25、pandas.HDFStore.get函数 25-1、语法 25-2、参数 25-3、功能 25-4、返回值 25-5、说明 25-6、用法 25-6-1、数据准备 25-6-2、代码示例 25-6-3、结果输出 26、pandas.HDFStore.select函数 26-1、语法 26-2、参数 26-3、功能 26-4、返回值…

阅读更多...

3D模型格式转换工具HOOPS Exchange如何访问产品制造信息（PMI）？

在当今的制造和设计领域，产品制造信息（PMI）在确保零件和产品满足精确规格方面发挥着至关重要的作用。PMI，特别是几何尺寸和公差（GD&T），提供了制造过程中必须遵循的详细指导。随着技术的进…

阅读更多...

centos7停服之后换阿里云的源

centos7停服之后换阿里云的源

原因： Centos7停止维护 CentOS 7 官方支持在2024年6月30日结束。如果您正在使用CentOS 7，建议迁移到另一个仍在维护的Linux发行版，如CentOS Stream、AlmaLinux、Rocky Linux或者转换到使用Debian或Ubuntu。国产的华为的：openEule…

阅读更多...

数据恢复篇：如何从硬盘中恢复照片

数据恢复篇：如何从硬盘中恢复照片

如何从计算机硬盘恢复图片？ 和所有电子和机械设备一样，硬盘也可能因任何原因而损坏。如果您系统的硬盘停止工作，或者您在启动系统时听到振动声，则硬盘可能已损坏。如果是这样，硬盘上的数据怎么办？ 不要惊…

阅读更多...

Python开源工具库使用之离线翻译软件Argos-Translate

Python开源工具库使用之离线翻译软件Argos-Translate

文章目录一、软件介绍二、软件使用2.1 命令行使用2.2 Python代码调用2.3 GUI使用三、软件获取一、软件介绍 Argos-Translate 是一款基于 OpenNMT（Open source Neural Machine Translation）的离线翻译库，不需要联网就可以实现翻译功能&…

阅读更多...

唐山养老院哪家好---养老！用哪种方式更合适？

唐山养老院哪家好---养老！用哪种方式更合适？

人生旅途中，每个阶段都伴随着不同的挑战和难题。老年阶段尤其如此，随着岁月的流逝，人的身体机能逐渐衰退，自理能力也会随之减弱。面对这些挑战，老人及其家属需要找到合适的方法来保证老年的生活质量。居家养老在中…

阅读更多...

7月学术会议：7月可投的EI国际会议

7月学术会议：7月可投的EI国际会议

随着科技的迅猛发展，学术交流与研讨成为了推动科研进步的重要途径。进入7月，众多高质量的EI国际会议纷纷拉开帷幕，为全球的科研工作者提供了一个展示研究成果、交流学术思想的平台。以下，我们将详细介绍一些在7月可投的EI国际会议…

阅读更多...

暑假提升(3)[平衡二叉树之二--红黑树]

暑假提升(3)[平衡二叉树之二--红黑树]

命为志存。 —— 朱熹红黑树RBTree 1、诞生原因2、红黑树的概念3、红黑树的性质4、红黑树的设计4、1、节点设计4、2、插入操作的设计 5、总结 1、诞生原因由于二叉树的局限性，进一步出现平衡二叉树，来帮助我们来进一步提升我们对数据的处理&#xff0…

阅读更多...

模电基础 - 信号的运算和处理

模电基础 - 信号的运算和处理

目录一. 简介二. 加法三. 减法四. 乘法五. 除法六. 总结一. 简介在模电基础中，信号的运算和处理是非常重要的内容。信号的运算包括加法、减法、乘法、除法等。通过使用集成运放，可以很容易地实现这些运算。例如，利用反相输入…

阅读更多...

【工具分享】I-Wanna-Get-All——主流OA漏洞检测利用工具

【工具分享】I-Wanna-Get-All——主流OA漏洞检测利用工具

声明：本文档或演示材料仅供教育和教学目的使用，任何个人或组织使用本文档中的信息进行非法活动，均与本文档的作者或发布者无关。文章目录 I-Wanna-Get-All安装方式功能介绍 GitHub项目地址：https://github.com/R4gd0ll/I-Wanna-G…

阅读更多...

如何使用HTML和JavaScript读取文件夹中的所有图片并显示RGB范围

如何使用HTML和JavaScript读取文件夹中的所有图片并显示RGB范围

如何使用HTML和JavaScript读取文件夹中的所有图片并显示RGB范围在这篇博客中，我将介绍如何使用HTML和JavaScript读取文件夹中的所有图片，并显示这些图片以及它们的RGB范围。这个项目使用现代浏览器提供的<input type"file" webkitdirecto…

阅读更多...

生产力工具|Endnote X9如何自动更新文件信息

生产力工具|Endnote X9如何自动更新文件信息

一、以EndNote X9.2版本为例，打开EndNote文献管理软件。二、在菜单栏找到“Edit→Preferences...”，点击打开，弹出一个“EndNote Preferences”窗口。三、进行设置在打开的窗口左侧选择“PDF Handing”，右边会出现自动导入文献…

阅读更多...

科普文：spring boot中常用的接口、工具栏、注解整理

科普文：spring boot中常用的接口、工具栏、注解整理

1.springboot 常用接口 1.1 Aware接口 Spring IOC容器中 Bean是感知不到容器的存在，Aware(意识到的)接口就是帮助Bean感知到IOC容器的存在，即获取当前Bean对应的Spring的一些组件，如当前Bean对应的ApplicationContext等。 1.1.1 Applicati…

阅读更多...

顶刊文献阅读及代码复现

顶刊文献阅读及代码复现

前提：每个无人机都有 (i)自己的机载计算机，用于执行控制其自身动作所需的计算（ii）自己的传感器系统，用于测量相对位置和速度，（iii）自己的通信设备，用于与相邻代理进行数据交换。模型：短期的排斥力、中间范围的速度一致性和长距离的吸引力

阅读更多...

开发工具之十一详解 OpenOCD 源码、构建、配合各仿真器使用示例

开发工具之十一详解 OpenOCD 源码、构建、配合各仿真器使用示例

OpenOCD OpenOCD（Open On-Chip Debugger）是一个开源的跨平台的片上调试器，旨在提供针对嵌入式设备的调试、系统编程和边界扫描功能。其工作方式就是代替了原有那些调试适配器提供的相关工具和驱动，直接通过普通的 USB 驱动访问适配器，进而访问目标硬件。 OpenOCD 是由 D…

阅读更多...

【前端】使用chrom浏览器Network，查看前后台数据传输请求

【前端】使用chrom浏览器Network，查看前后台数据传输请求

使用chrom浏览器Network查看前后台数据传输请求写在最前面查看前后台数据传输请求① 首先，打开开发者工具（F12）打开控制台，切换到Network面板。Network面板右键界面copy ②清空请求log ctrle两次或者点击clear图标案例展示&…

阅读更多...

MySQL日常运维手册

MySQL日常运维手册

对象创建DDL查询 -- 获取创建 database 的 DDL show create database_name; -- 获取创建表的 DDL show create table table_name; -- 获取创建视图的 DDL show create view index_name; -- 获取创建触发器的 DDL show create trigger trigger_name; -- 获取创建用…

阅读更多...

软件架构之计算机网络

软件架构之计算机网络

软件架构之计算机网络第 4 章计算机网络4.1 网络架构与协议4.1.1 网络互联模型4.1.2 常见的网络协议4.1.3 IPv6 4.2 局域网与广域网4.2.2 无线局域网4.2.3 广域网技术4.2.4 网络接入技术 4.3 网络互连与常用设备4.4 网络工程4.4.1 网络规划4.4.2 网络设计4.4.3 网络实施 4.5 …

阅读更多...

推荐文章

最新文章