系统RDSCPU打满问题分析报告

news2024/11/14 3:46:45

作者:琉璃

1. 问题概述

在2023年9月01日09点13分,玳数运维组侧接收到业务侧反馈系统响应缓慢,与此同时运维群内新系统RDS 发出CPU打满的告警,告警通知如下:
请添加图片描述

2. 问题分析

a. 数据库会话管理核查

玳数运维组侧登录阿里云控制台查看数据库会话管理,通过数据库自治服务的一键诊断功能,核实到活跃会话较多,现象为CPU使用率打满。

b. kill查询会话

玳数运维组侧接收业务反馈,拍地业务比较紧急,可以迅速kill查询会话,保障数据库系统稳定运行。从9:00-9:30时间段内连接数迅速上升,波动较高至730左右。
请添加图片描述

慢SQL该时间段内迅速增长,单SQL执行次数较多,如下图:

请添加图片描述

该慢SQL单次执行耗时在1.233秒左右,主要为执行次数影响。

请添加图片描述

同业务侧拿到数据库账号信息,Kill查询会话后,CPU使用率逐步下降,拍地之前恢复至正常水位。

请添加图片描述

c. 核查会话增长原因

玳数运维组侧进一步核实程序侧是否有异常调用,导致数据库侧访问频次增加。程序访问通过WAF接入,再到后端SLB,由于WAF侧未开启访问日志,查看SLB访问日志,业务侧反馈对应SQL的业务访问接口:查询异常时间段内该接口的日志条数,30分钟内该接口个接口被调用了2970次。

对比昨天同时间段内该接口的调用频次,昨天同时间段30min内日志是1,397条,如下图:

请添加图片描述
请添加图片描述

可以看到今天异常时间段内调用次数明显增多。导出该时间段内日志明细,查看访问来源IP,统计访问最多的来源ip,访问次数:102次,该来源地址在上城区,计算访问频次:一分钟内调用在三次左右。与此同时其他来源IP也在发起调用,导致总体并发量比较高,业务接口调用频繁。

3. 问题总结

结合RDS慢SQL日志、程序侧服务日志及业务侧反馈情况定位问题的根本原因在于单位时间内相应接口调用频次较高,数据库CPU打满。

a. 改进措施

为了防止类似问题再次发生,玳数科技运维组提出了以下改进措施:

1、程序侧做好对接口访问的相关限制,单位时间内限制对接口的访问频次,避免大并发下CPU资源使用完毕,导致数据库服务异常。

2、对数据库进行读写业务分离,实现读取能力的弹性扩展,分担数据库压力。

3、新系统RDS开启SQL洞察和审计,更好地获取SQL语句的具体信息、排查性能问题、识别高危风险来。

4、WAF侧开启日志功能,方便业务异常时刻能快速对采集到的日志数据进行查询与分析,定位问题原因。

更多技术信息请查看云掣官网https://yunche.pro/?t=yrgw

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1942853.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

动态规划之三—— 从暴力递归到动态规划_数字字符串转字母字符串

题目: 规定1 和A 对应,2 和B对应,3 和C 对应 ... 那么一个数字字符串,比如“111” 就可以转化为:“AAA” 、“KA”、“AK” 。要求:给定一个只有数字字符组成的字符串str, 返回有多少种转化结果…

AV1技术学习:Transform Coding

对预测残差进行变换编码,去除潜在的空间相关性。VP9 采用统一的变换块大小设计,编码块中的所有的块共享相同的变换大小。VP9 支持 4 4、8 8、16 16、32 32 四种正方形变换大小。根据预测模式选择由一维离散余弦变换 (DCT) 和非对称离散正弦变换 (ADS…

只需三步申请 OV HTTPS证书

申请OV HTTPS证书的步骤主要包括申请、验证、安装三步。下面将详细展开分析每个步骤的具体操作和注意事项: 一、申请 选择证书供应商:一个可信赖且知名的证书供应商对于确保SSL证书质量和后续服务至关重要。市场上有多个知名品牌提供OV SSL证书&#xf…

运维上云/直播上云EasyNVS视频上云管理平台配置域名时的注意事项

EasyNVS视频上云管理平台拥有完整的视频流媒体服务能力和运维管理服务能力,不仅可以通过平台对EasyNVR、EasyGBS进行统一管理,还能解决设备现场没有固定公网IP却需要在公网直播的需求。 有用户反馈,在项目现场配置了EasyNVS的HTTPS证书&#…

Linux发展史

📑打牌 : da pai ge的个人主页 🌤️个人专栏 : da pai ge的博客专栏 ☁️宝剑锋从磨砺出,梅花香自苦寒来 ☁️运维工程师的职责:监…

PCI设备BAR寄存器和PCI桥Base、Limit寄存器的初始化

初始化PCI设备的BAR(Base Address Register)寄存器和PCI桥的Base、Limit寄存器是配置PCI总线地址空间的关键步骤,这些寄存器的设置影响了系统中PCI设备和桥接器对地址空间的使用和访问。下面详细解释它们的初始化过程: PCI设备的…

【MySQL进阶之路 | 高级篇】ER模型

1. 概述 数据库设计是牵一发而动全身的。那么有没有什么办法可以提前看到数据库的全貌呢?比如需要哪些数据表,数据表中应该有哪些字段,通过什么字段进行连接等等。这样我们才能进行整体的梳理和设计。 其实,ER模型就是一个这样的…

Linux cd 和 pwd 命令

目录 1. 更改工作目录 cd 2. 查看当前工作目录 pwd 1. 更改工作目录 cd 打开虚拟机终端的时候,以用户的家目录为默认工作目录; 更多时候需要更改当前的工作目录(Change Directory), 语法:cd 【Linux路径】 没有参数…

宏信超市净利率微薄:门店过于集中一地收入承压,近年来多次被罚

《港湾商业观察》廖紫雯 日前,江苏宏信超市连锁股份有限公司(以下简称:宏信超市)递表港交所,保荐机构为绰耀资本。 宏信超市为一家总部设于扬州的超市及便利店连锁运营商,以“宏信龙”品牌经营零售业务及…

短视频矩阵新选择,一键智能成片,效率翻倍!

在数字时代浪潮的推动下,短视频已成为人们生活中不可或缺的一部分。从社交娱乐到营销推广,短视频的身影无处不在,其影响力日益扩大。然而,对于内容创作者而言,如何在海量视频中脱颖而出,如何高效、高质量地…

SD 换脸局部重绘 + ipadapter

图生图,局部重绘 2. 配置ipadapter 3. 可以配置ADetailer 最后生成出来 真实丑哭了,完全不像

【保姆级讲解Docker容器 ! ! !】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

文档解析效果全维度测评标准

TextIn文档解析测评工具,全面评测文档解析产品能力 关注TechLead,复旦AI博士,分享AI领域全维度知识与研究。拥有10年AI领域研究经验、复旦机器人智能实验室成员,国家级大学生赛事评审专家,发表多篇SCI核心期刊学术论文…

【AI-10】PPO算法

强化学习中的PPO(Proximal Policy Optimization)是一种流行的策略优化算法,旨在改进和稳定策略梯度方法。PPO由OpenAI提出,因其简单性和良好的性能,在许多强化学习任务中被广泛应用。 PPO框架简介 PPO是一种基于策略…

【算法专题】链表算法题

1. 链表常用操作 相信大家在学习数据结构的过程中已经接触过许多链表相关的题目了,在正式开始刷题之前,我想让大家先回顾一下过去处理链表相关问题时的一些常见操作。 首先肯定就是创建新节点了,如果使用C语言编写代码,我…

MySQL第一阶段:表关系

表关系 表关系分为一对多、多对多、一对一 表关系之一对一 一对一比如用户和用户的详细内容 一对一关系多用于表拆分,将一个实体中经常要用的字段放在一张表,不经常使用的字段放到另一张表,用于提升查询性能。 实现方式:在任…

你了解你的GD32 MCU系统主频是多少吗 ?

系统时钟是GD32 MCU的时基,可以理解为系统的心跳,片上所有的外设以及CPU最原始的时钟都来自于系统时钟,因而明确当前系统时钟是多少非常重要,只有明确了系统时钟,才能够实现准确的定时、准确的采样间隔以及准确的通信速…

【Git】(基础篇七)—— IntelliJIDEA集成Git

InteliJ IDEA集成Git 现在有很多的集成工具帮助我们写代码,使用这些工具可以帮助我们加速写代码,很多工具也可以集成git,使用图形工具管理git,相信了解了底层运行逻辑的你能够很快地上手使用这些工具,本文以InteliJ I…

嘉立创 | 将所有元件属性中间放置

单击元件属性,按鼠标右键,点击查找 点击查找全部,便选中了所有元件属性 点击布局--属性位置 便可以将属性位置改为中间

销量不振,却逆风提价,出尔反尔的宝马在作茧自缚吗?

撰稿|行星 来源|贝多财经 传统豪华汽车品牌宝马,宣布主动退出价格战。 近日,社交平台上有关宝马涨价的传闻不胫而走,引发众多网友关注。相关报道称,有业内人士在社交平台透露,因价格战导致门店亏损严重,…