milvus资源限制 benchmarker压测 qps优化

news2024/11/24 21:05:03

在这里插入图片描述
根据milvus 资源限制的官网,我们得出百万数据资源限制。

1.dev 环境 对接不同的配置最大的qps 如下(dev的机器内存很小)
在这里插入图片描述
2.于是认为当前的性能是匹配的,然后加上资源限制,配置
在这里插入图片描述
压测结果如下

{
    "run_id": "13292982fee74f64a6352886bd2e48c1",
    "task_label": "13292982fee74f64a6352886bd2e48c1",
    "results": [{
            "metrics": {
                "max_load_count": 0,
                "load_duration": 1921.7745,
                "qps": 1562.3437,
                "serial_latency_p99": 0.0059,
                "recall": 0.5972,
                "ndcg": 0.6318,
                "conc_num_list": [1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100],
                "conc_qps_list": [195.3319, 790.9781, 1080.3159, 1373.9811, 1432.1278, 1440.8132, 1433.1897, 1491.7838, 1493.107, 1481.4041, 1502.0799, 1508.3413, 1530.3134, 1521.0524, 1547.9447, 1549.8126, 1555.2589, 1562.3437, 1544.5287, 1552.6871, 1545.3059],
                "conc_latency_p99_list": [0.004279492217302322, 0.004500870367884636, 0.004731282425113022, 0.005114195805042982, 0.005836073917336762, 0.006389325391501189, 0.006925125846266747, 0.008031808454543352, 0.006713001053780317, 0.007038204529695212, 0.008382701979205012, 0.005965838904678822, 0.006431116539426148, 0.010065575167536735, 0.007617924952134489, 0.007334843980520961, 0.009211420500651001, 0.00817261971924454, 0.006796466001681981, 0.006674074270576239, 0.00732990248594433]
            },
            "task_config": {
                "db": "Milvus",
                "db_config": {
                    "db_label": "2024-08-20T10:48:40.903270",
                    "uri": "**********"
                },
                "db_case_config": {
                    "index": "IVF_FLAT",
                    "metric_type": "COSINE",
                    "nlist": 1024,
                    "nprobe": 5
                },
                "case_config": {
                    "case_id": 50,
                    "custom_case": null,
                    "k": 100,
                    "concurrency_search_config": {
                        "num_concurrency": [1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100],
                        "concurrency_duration": 30
                    }
                },
                "stages": ["drop_old", "load", "search_serial", "search_concurrent"]
            },
            "label": ":)"
        }
    ],
    "file_fmt": "result_{}_{}_{}.json"
}

很诧异,开始排查问题的所在:
1.第一先考虑的是不是obs 的问题
于是又在dev环境加上资源限制,得到的结果:
在这里插入图片描述
那就不是obs 的问题
2.考虑一下是不是pulsar 的问题,在这个过程,要感谢一下社区,问了得到明确的结论是pulsar 只落盘,不参与数据的查询操作。但是得出结论
还是保持质疑,刚好dev 环境没有资源,不能限制pulsar ,发现性能还是很差,所有排除pulsar问题

3.后来运维同学通过监控发现queryNode CPU 涨的很快,就将资源改成
6c 8g ,果然性能提高到无资源限制的qps 维度。
在这里插入图片描述
4.扩展一下:再最终到生产环境上线发现,资源并没有达到预期的qps (需要关上认证才能压测哦)
如下图
在这里插入图片描述
这个时候就非常诧异,随机就对比sit 环境资源配置和grafana 资源消耗情况
在这里插入图片描述
最终同时发现 proxy pod 资源消耗和queryNode pod 是正相关关系,然后看了一下sit 环境的资源配置,不知道在哪次的修改中将资源改为8c 16g。
故将生产环境改为proxy 8c16g .queryNode:8 core 16 GB 副本数为1
压测结果如下
在这里插入图片描述
qps 达到7400+!!!

然后逐渐扩容querynode 为3 ,性能如下

在这里插入图片描述
性能并没有提高多少!
最后逐渐扩容querynode 为5 ,性能如下
在这里插入图片描述
性能并没有提高多少!

额外的例子:3 proxy 1querynode

在这里插入图片描述
性能并没有提高多少!
总结:1。官网提供的资源配置,应该是以数据为主的,但是如果对milvus 有性能要求,应该提高 proxy 和 queryNode 的资源。它们的资源是呈正相关的,单纯扩容其中某一个是不能实现qps 性能的提升的。同时修改的核心是CPU,其实是开启线程,进行I/O。友情提示:还是看各位看官,场景实际的数据量 和 并发数,动态更改

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2091281.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于springboot+vue的民族文化推广系统设计与实现---附源码92323

摘 要 在全球化和信息化日益加深的当下,保护和推广民族文化显得尤为重要。民族文化不仅是一个国家或地区的独特标识,更是其历史、传统和智慧的结晶。然而,随着现代社会的快速发展,许多传统文化和习俗面临着被遗忘和消失的风险。因…

ssh---配置密钥对验证

1.在客户端创建密钥对 ssh-keygen -t ecdsa秘钥存放位置(生成密钥时的用户的工作目录下) 2.将公钥文件上传至服务器 3.在服务器中导入公钥文本 4.在客户机设置ssh代理功能,实现免交互登录 5.测试

Python自适应光学模态星形小波分析和像差算法

🎯要点 🎯星形小波分析像差测量 | 🎯对比傅里叶和小波分析 | 🎯定义多尺度图像质量度量,矩阵数据 | 🎯像差校正算法 | 🎯受激发射损耗显微镜布局 | 🎯干涉仪分支校准,求…

Java 虚方法表(虚函数)

虚方法表 Java 中的虚方法表(Virtual Method Table, VMT)是实现动态方法分派和多态的重要机制。它帮助 Java 运行时系统(JVM)决定在继承体系中调用哪一个方法的具体实现。 什么是虚方法表? 虚方法表是一个类的内部数…

Linux学习笔记(4)----通过网口灯判断网速是千兆还是百兆

网卡PHY 移植注意事项 注意RTL8211F的LED0,LED1,LED2,软件是可以自定义的,比如百兆,千兆,是亮哪个灯,黄灯或者绿灯,还有传输时是闪烁哪个灯,要注意硬件上是怎么驱动灯的…

获取当前计算机的处理器架构platform.machine()

【小白从小学Python、C、Java】 【考研初试复试毕业设计】 【Python基础AI数据分析】 获取当前计算机的处理器架构 platform.machine() 选择题 关于以下代码的输出结果说法正确的是? import platform print("【执行】print(platform.machine())") prin…

Websocket测试工具,在线调试 - 在线工具

WebSocket 测试工具是用于测试 WebSocket 连接、发送和接收消息的工具。它们通常提供一个简单的用户界面,使开发人员能够快速验证 WebSocket 服务器的功能和性能。 在线Websocket测试工具体验地址:https://ewbang.com/websocket/index.html 什么是 WebSo…

具身智能(Embodied Intelligence)概述

目录 一、引言 二、具身感知 三、具身交互 四、具身智能体 五、虚拟到现实 一、引言 最近无论是斯坦福机器人炒虾,还是特斯拉官宣机器人进厂,都赚足了眼球,实力证明了具身智能(Embodied Intelligence)的火爆。…

SEO之网站结构优化(十四-内部链接及权重分配2)

初创企业搭建网站的朋友看1号文章;想学习云计算,怎么入门看2号文章谢谢支持: 1、我给不会敲代码又想搭建网站的人建议 2、“新手上云”能够为你开启探索云世界的第一步 博客:阿幸SEO~探索搜索排名之道 4、翻页过多 稍大型的商务…

无心剑中译莎士比亚《无君相伴浸寒冬》

莎士比亚十四行诗第98首 Sonnet 98 无君相伴浸寒冬 From you have I been absent in the spring, When proud pied April, dressed in all his trim, Hath put a spirit of youth in every thing, That heavy Saturn laughed and leapt with him. Yet nor the lays of birds,…

Python | Leetcode Python题解之第385题迷你语法分析器

题目: 题解: class Solution:def deserialize(self, s: str) -> NestedInteger:index 0def dfs() -> NestedInteger:nonlocal indexif s[index] [:index 1ni NestedInteger()while s[index] ! ]:ni.add(dfs())if s[index] ,:index 1index …

Vue3项目开发——新闻发布管理系统(四)

文章目录 七、登录&注册页面设计开发2、登录&注册页面设计3、表单校验规则设置七、登录&注册页面设计开发 2、登录&注册页面设计 登录页面如下: 点击“注册 →”,切换到注册页面: 点击“← 返回”,又可以切换回登录页面。 页面布局是这么设计的: 1…

保姆级Maven安装、配置、版本查询教程(包含配置本地仓库、阿里云私服、环境变量)

文章目录 一、Maven安装1. 下载zip包2. 解压 zip包 二、配置1. 配置本地仓库2. 配置阿里云私服3. 配置环境变量 三、Maven验证 此教程摘选自我的笔记:黑马JavaWeb开发笔记11——Maven介绍、详细安装、环境配置步骤教程,想要了解Maven组成和作用可以移步此…

中国各地区数字经济发展对环境污染的影响数据(2011-2021年)

关于中国各地区数字经济发展对环境污染的影响数据(2011-2021年),可以从以下几个方面获取相关信息: 数字经济水平:可以通过熵值法衡量的数字经济水平指标来评估各地区的数字经济发展情况。 环境污染物排放量&#xff1…

桥梁在线监测解决方案:科技赋能,守护桥梁安全

在现代社会,桥梁作为连接城市与乡村、跨越河流与峡谷的重要交通设施,其安全性和稳定性直接关系到人民生命财产的安全以及经济社会的正常运转。然而,桥梁在长期使用过程中,会受到自然环境、车辆荷载、材料老化等多种因素的影响&…

中国各地区-城市创新和产业创新指数(2001-2021年)

数据及指标 年份、行业代码、行业名称、大类行业、产业创新指数、城市代码、城市、省份、城市创新指数。 2001-2021年 中国各地区-城市创新和产业创新指数https://download.csdn.net/download/2401_84585615/89504735 中国各地区在城市创新和产业创新指数方面有显著的发展和…

制作效果图常用的软件和渲染器介绍

我们用于效果图制作与渲染的软件主要有3ds Max、Sketchup、Rhino、V-Ray、Corona、Enscape、Lumion和D5 渲染器等。用于制作效果图的软件很多,作为初学者,我们没必要都学习,只需选择一个设计软件和一个渲染器学习就可以了,等都彻底…

设计模式-UML建模语言面向对象的SOLIDLC

一、设计模式概述和UML 1.设计模式概述 1.序言 把软件开发当做修炼武功的话,那么可以分为招式和内功心法。 招式:C,C, java, python等编程语言;jsp等开发技术,qt, spring等开发框架。这些是…

使用.gitignore文件忽略文件

一 .gitignore文件的作用 有些情况,你需要把一些文件放到Git工作目录中,但无需提交,比如本地配置,自动生成的文件等。.gitignore文件可以帮助你实现这样的需要。 二 .gitignore文件的创建和编辑 在git根目录或任意子目录创建名…

springbootmybatis中数组和字符串数据类型的转换

需求 前端(VUE)页面上有一个可多选的select控件,前端以数组形式存储被选中的数据,但是数据库中不想新建表来存储,希望在主表中用以逗号为分隔符的字符串来存。 于是在存储和读取数据的时候就涉及到数据类型转换的问题…