吞吐量 和 延时的关系

news2025/1/12 18:58:02

关于吞吐量/吞吐率、延时,你可以通过 Jmeter中的”聚合报告“和”用表格查看报告“来获取。

  • Throughput 越大,Latency 越差:因为请求过多,系统繁忙导致响应速度降低。
  • Latency 的值越小说明能支持的 Throughput 越高:Latency 数值小说明系统处理速度快,自然便可以处理更多的请求。
  • Throughput "不用" 通过降低 latency 的方式来提高,排查性能问题的时候,勿在降低 Latency 值上消耗过多时间。

常见系统瓶颈

  • 类型转换:除了装箱拆箱外,还要着重看下 JSON 的一些转换类库,如 newtown,fastJson 等等,可能会引起 CPU 维持在高位。
  • 异步操作:有些异步操作会非常影响性能,尤其是在网络较差的情况下,很可能阻塞业务。
    • 如异步下的状态通知通常会影响性能。通常而言,异步操作会让”吞吐率“提升,但会牺牲 延时(latency)。

定位性能瓶颈

定位的方式不一定是程序级别的,一开始可以先从操作系统的 CPU 使用率,内存使用率,系统 IO 和 网络 IO,网络连接数 着手分析。

  • CPU 使用率不高,但是 throughtput 和 latency 上不去: 说明程序没有忙于计算,可能问题在 I/O 上。
    • 一般 CPU 和 IO 是反着来的: CPU 没问题,问题可能在 IO,反之亦然。
  • 如果 CPU、IO、内存、网络带宽使用都不高,但是系统性能上不去: 说明程序有问题,可能是为资源被锁,存在锁竞争关系,程序被阻塞;或者是在上下文切换等等。
  • 关于 IO,要看 3 个方面:磁盘IO,网络IO 以及 内存换页率。
  • 程序级别的性能瓶颈定位:
    • 分段注释代码 / 让一些函数空转 / 做一些硬编码的 Mock,然后再测试下 Throughput 和 latency,看是否有好转,如果有,说明函数是瓶颈,再进一步在这个函数体内注释代码,直到找到最耗性能的语句。
  • 分析内存:需要用到的计数器:Memory 类别 和 Physical Disk 类别的计数器,步骤如下:
    1. 查看 Memory:Available Mbytes 指标:如果该指标的数据较小,系统可能出现了内存方面的问题,需要继续下面步骤进一步分析。
    2. 注意 Memory:Pages/sec、Pages Read/sec 和 Page Faults/sec 的值:操作系统会利用磁盘较好的方式提高系统可用内存量或者提高内存的使用效率。这 3 个指标直接反映了 OS 进行磁盘交换的频度。
      • Pages/sec 值 持续高于几百,可能内存有问题。Pages/sec 值大不一定就表明内存有问题,可能是运行使用内存映射文件的应用导致。
      • Page Faults/sec 越高说明每秒发生页面次数越多,说明 OS 向内存读取的次数越多。此时需要查看 Pages Read/sec 的计数值,该值阈值是 5,超过 5,则可以判断存在内存方面的问题。
    3. 根据 Physical Disk 计数器的值分析性能瓶颈:需要分析 Page Reads/sec 和 %Disk Time 及 Average Disk Queue Length 的分析。如果 Pages Read/sec 很低,同时 %Disk Time 和 Average Disk Queue Length 的值很高,则可能有磁盘瓶颈。但是,如果队列长度增加的同时 Pages Read/sec 并未降低,则是内存不足
  • 分析处理器:
    1. 排查 System:%Total Processor Time 计数器的数值:该值体现的是服务器 CPU 的整体利用率,对于多核系统而言,该值体现的是所有 CPU 的平均利用率。
      • 如果该值持续超过 90%,说明整个系统面临着处理器方面的瓶颈,需要增加处理器来提高性能。
      • P.S.:多核下,如果该数据不大,但是各个 CPU 的 负载不均衡,也可以认为是 CPU 产生了瓶颈。
    2. 排查每个 CPU 的 Processor:%Processor Time 和 %User Time 和 %Privileged Time:
      • %Processor Time 很高时,一般 CPU 都阻塞着,但是反之并不亦然。
      • %User Time:非系统内核操作消耗的 CPU 时间(如调用系统本身资源--网络、IO等),若该值较大,可以考虑优化代码、优化算法;如果该服务器是数据库 Server,则该值较大的话可能是数据库的”排序“或是”函数操作“消耗了过多的 CPU 时间,此时可考虑对 DB 进行优化。
      • %Privileged Time:系统内核操作消耗的 CPU 时间
    3. 验证是否系统 CPU 瓶颈:
      • 查看 System:Processor Queue Length 计数器:如果该值大于 CPU 数量的总数 + 1 的时候,说明产生了处理器阻塞。
  • 分析磁盘I/O:
    1. 如果计算得出每个磁盘的I/O 超过了磁盘本身的I/O能力,则可以确认磁盘是引起瓶颈的因素之一。
    2. 与 Processor:%Privileged Time 联合分析:如果 Physical Disk:%Disk Time 较大,其他值比较适中,则硬盘可能是瓶颈,若几个值都比较大,且持续超过 80%,则可能是内存泄漏。
    3. 分析 Disk sec/Transfer:一般来说,该值小于 15ms 为最佳,15~30ms 为良好,30~60ms 为可接受,超过 60ms 则需要考虑更换硬盘或者更换 raid 方式了。
  • 分析进程:
    • 查看 Process:%Processor Time的值:每个进程的该值反映的是进程消耗 CPU 的时间。
    • 查看 Process:%Page Failures/sec 和 Memory:%Page Failures/sec 的比值,过滤出是哪个进程产生的最多的页错误,一般这个进程是需要大量内存的进程,或者是非常活跃的进程(即在压测情况下,就是你要压测的进程)
    • Process:%Private Bytes:该计数器指进程所占有的私有数据(单位字节),即无法与其他进程共享的数据量,可以利用该值来判断应用是否存在内存泄漏。
      • 对于 IIS 进程,可以重点监控下 INetInfo进程的 Private Bytes,如果在压测过程中,该值不断增加,或是在压测结束后,该值仍然处于一个高水平,则说明应用存在内存泄漏
  • 分析网络:
    • Network Interface:Bytes Total/sec 为发送和接收字节的速率,可以通过该计数器值来判断网络链接速度是否是瓶颈,具体操作方法是用该计数器的值和目前网络的带宽进行比较。
    • 联合 Processor:%Privileged Time 进行分析:如果 Physical Disk:%Disk Time比较大,其他值比较适中,则硬盘可能是瓶颈,若几个值都比较大,且持续超过 80%,则可能存在内存泄漏。

性能优化的几个策略

  • 应用层面:
    • 善用 CDN,缓存,冗余数据,SLB。
    • 如果瓶颈在网络传输,那么需要对传输数据进行压缩(需要注意,压缩算法是很耗时的,只在瓶颈是网络传输的时候再考虑,你需要根据测试数据自行权衡。)。
    • 并行处理的时候需要注意下宿主机是否是多核。如果宿主机是单核的,而程序代码是多进程、多线程的,那么对于高计算密集型的应用会适得其反,反而更慢。
  • 优化代码:
    • 减少循环层数、减少递归。
    • 在循环体中少做声明变量、分配 / 释放内存的操作:把循环体内的表达式抽离到循环体外。
    • 注意函数调用在栈上的开销。
    • 合理使用 try-catch:不要用抛异常作为常规业务的失败流程(如进行业务报错)。
    • 字符串处理需注意:减少不必要的声明实例(.net core 出了一个 Span 类型,可以用来替代 Substring。)
    • 不同的语言和代码库,对于复杂度是不一样的,这个需要注意:如应该用 List.Count==0 来代替List.Any() 来判断是否有数据。
      • 关于这点,你可以使用计数器来判断、测试自己写的代码在”耗时、Cpu Cycle,0/1/2代 GC回收“等数据的差异,择优而定。
  • 算法调优:
    • 哈希算法并不高效,使用时候还需注意。
    • 善用预处理和分量分次分批处理:像月报表之类的执行频率低,但每次执行都很耗资源的,你可以尝试预先每天/每周处理,不用等到每月才执行。
  • 多线程调优:
    • 多线程的瓶颈主要在互斥和同步锁上,以及线程上下文切换的成本上:你应尽量少用甚至不用锁,或者用乐观锁替代现有直接用 Lock 的锁。
  • 内存分配:当内存出现碎片时,会相当耗时。
    • 在编码的时候,意识上尽可能少的进行内存的分配。
  • 池化技术对于一些短作业来说相当有效:如 HttpClientFactory 就是用了 http 池,可以用来减少对象创建、线程创建的开销。
  • 网络调优:
    • TCP 很耗资源,对系统开销很大:你可以搜索关键字:TCP Tuning 进行相关调优
    • TCP 和 HTTP 要配置下 Keep-Alive,尤其是像 http 这样的短连接,这也可以在一定程度上防止 DDoS攻击。
    • 对于 TCP 的 TIME_WAIT,这个状态默认会持续 4 分钟(持续 2 个 MSL--Max Segment Lifetime),TIME_WAIT 状态下的资源不能回收,有大量 TIME_WAIT 连接的情况一般是在 HTTP 服务器上。
      • 你可以在注册表中新建、设置 TCP 的 TcpTimedWaitDelay 和 MaxUserPort 项,来增加 TCP 连接释放时间和临时端口数。
    • TCP 一旦发生丢包,TCP 的带宽使用率会受到影响(盲目减半),再丢包,再减半;什么时候不丢包了,就会逐步恢复。
  • CPU 调优:
    • CPU0 很关键, 它一般担任着调节功能(如内核和非内核操作,上下文切换等),如果 0 号 CPU 被用得过狠的话,别的 CPU 性能也会下降。
      • windows 下可在“任务管理器”中,右键“进程”选择“设置相关性”来设置该进程可以运行在哪些核上。
      • linux:使用 taskset 命令来设置(可以通过安装 schedutils 来安装这个命令) 。

性能监视器

在服务器上最直观监视性能的方式就是直接使用系统自带的”性能监视器“。

>perfmon #直接在 "运行" 中输入 perfmon 即可打开

若要进一步监控内存,可结合使用 RAMMap 和 VMMap 。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1678159.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pdfMake,xlsx-js-style,elementTable表格导出大量数据的pdf和xslx表格

使用渲染dom传递给xlsx或将dom转canvas在传给jspdf数据量大都会造成页面负载过大 所以导pdf和xlsx都使用数据传递给pdfMake,xlsx-js-style,pdf涉及分页与合并单元格 一.pdf npm并引入pdfMake和其字体包(记录时使用版本0.2.10 import pdfMake from &qu…

仅1年!荣登中科院1区经济类SSCI宝座!影响因子3连涨,创刊时间不长但口碑飙升!

【SciencePub学术】今天小编给大家带来了一本经济学领域的高分优刊解读,创刊时间不长,但影响因子3连涨现已高达8.5,JCR1区,中科院1区,领域相符的学者可考虑! Oeconomia Copernicana 1 期刊概况 【期刊简介…

大龄程序员是否要入职嵌入式python岗位?

在开始前我有一些资料,是我根据网友给的问题精心整理了一份「Python的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!!! 是否要做嵌入式 Python 取决于…

vue(九) 生命周期 v3.0和v2.0对比,父子组件生命周期的执行顺序

文章目录 生命周期vue2.0生命周期1.图示2.生命周期解释说明3.代码示例 vue3.0生命周期1.图示2.生命周期解释说明3.代码示例 父子组件中生命周期执行顺序v.3和v2.0生命周期对比 生命周期 每个 Vue 组件实例在创建时都需要经历一系列的初始化步骤,比如设置好数据侦听…

批量下载huggingface的仓库全部权重文件

下载huggingface的仓库全部权重文件 配置和下载git-lfs **ubuntu:**sudo apt-get install git-lfs 其他: 下载git-lfs Releases git-lfs/git-lfs (github.com) 配置: export PATH$PATH://home/software/lfs/git-lfs-3.5.1/ # 其中目录为你文件夹的目…

tomcat启动闪退解决办法

tomcat启动闪退解决办法 1. 端口号被占用2. 检查电脑环境配置2.1 如何配置电脑的环境变量? windows系统下,tomcat安装好以后,双击bin文件下startup.bat后,tomcat没能按照预期打开,反而闪退了。 导致这种情况发生&…

python高级爱心代码

python高级爱心代码实现: import turtle import random # 设置画布 screen turtle.Screen() screen.bgcolor("black") # 创建画笔 pen turtle.Turtle() pen.speed(0) pen.color("red") pen.penup() # 移动画笔到起始位置 pen.goto(0, -20…

刘邦痛恨的叛徒雍齿,为何后来还被封了侯?

雍齿,原是沛县的世族出身,家庭往上追溯几代,也曾经显赫过。 虽然比不上先祖世代为楚将的项梁、项羽,但雍齿这个没落的世族后代,身上多多少少也还讲究点贵族遗风。 战国时期,以秦国的军功爵制为代表&#…

YOLOV8从环境部署(GPU版本)

一、安装cuda和cudnn 1、安装cuda之前先打开英伟达控制面板查看自己的显卡信息 2、“帮助”—>“系统信息”—>“组件”,然后看第三行的信息“Nvidia …

Franz Electron + React 源码启动运行填坑指南

环境要求 安装miniconda python 环境electron/rebuild用得着,miniconda 默认自带的 python 是 3.11 版本,比较新; 安装virsual studio 2019 要把C桌面相关的都安装了,大概需要20G,不要安装到 C 盘,都安装到…

什么是Serverless ?

目录: 1、服务器发展阶段 2、Serverless定义 3、Serverless理解

AI图像生成-基本步骤

模型板块 1、新建采样器:新建节点-》采样器-》K采样器 2、拖动模型节点后放开,选择checkpoint加载器(简易),模型新建成功 提示词板块 1、拖动正面条件节点后放开,选择CLIP文本编码器,模型新建…

《Fundamentals of Power Electronics》——转换器的传递函数

转换器的工程设计过程主要由以下几个主要步骤组成: 1. 定义了规范和其他设计目标。 2. 提出了一种电路。这是一个创造性的过程,利用了工程师的物理洞察力和经验。 3. 对电路进行了建模。组件和系统的其他部分适当建模,通常使用供应商提供的…

校园科普气象站的工作原理

TH-XQ3校园科普气象站是学校为了进行气象科普教育而设立的一种特殊设施。它不仅是一个能够实时监测和记录各种气象参数的气象站,更是一个促进学生对气象科学兴趣和理解的重要平台。 校园科普气象站通常包括一系列的气象观测设备和相关的科普设施。这些设备包括但不限…

【Git教程】(十八)拆分大项目 — 概述及使用要求,执行过程及其实现,替代解决方案 ~

Git教程 拆分大项目 1️⃣ 概述2️⃣ 使用要求3️⃣ 执行过程及其实现3.1 拆分模块版本库3.2 将拆分出的模块作为外部版本库集成 4️⃣ 替代解决方案 通常软件项目都是由单体小型系统开始的,在开发过程中项目规模和团队人员不断扩大, 将项目模块化会显得…

【保姆级】生成式网络模型基础知识(图像合成/语音合成/GPT)

生成式模型基础知识 初步接触生成任务 生成任务,顾名思义就是要去生成一个东西,比如生成图片/音频/文字等等。 大家接触最多比如chatGPT、stable diffusion、还有一些语音合成相关的东西。 那么问题来了,具体生成步骤是什么样的&#xff…

【Kibana】快速上手Kibana平台(KQL)

文章目录 快速使用Kibana平台常用查询语句KQL基本查询覆合查询模糊查询 目前市面上大部分的公司的日志系统都是使用ELK系统,因此我们进行工作必须得掌握Kibana平台的基本使用,这里主要说明怎么“快速使用Kibana平台”以及记录一些常用的“KQL语言”。 快…

数字化应用标杆 | 又两家成套厂效率翻倍,利用率高达93%以上!

利驰 联能 & 利驰 俊郎 近日,利驰数字科技(苏州)有限公司(简称利驰软件)成功与俊郎电气有限公司(简称俊郎电气)、浙江联能电气有限公司(简称联能电气)成功确立了数字…

Elasticsearch_sql插件安装+使用

一、安装 前提是你先安装好了elasticseach,安装过程在我上一篇博客有说,可以看一下。 在elasticsearch容器启动的情况下,进入到elasticsearch容器,Elasticsearch_sql仓库,比如我的版本是8.11.2,那么我就选…

618值得入手的数码有哪些?数码好物清单推荐|款款实用闭眼冲

每年的618购物节都是消费者们翘首以盼的盛宴,这一天,各大品牌和电商平台都会推出极具吸引力的优惠活动,让消费者们能够以更优惠的价格购买到心仪的数码好物,为了帮助大家在这个购物狂欢节中挑选到真正实用、性价比高的数码产品&am…