JAVA开发运维(云基础设备监控)

news2024/9/21 2:43:06

在大型的商用系统中,经常需要监控云设备的健康状态,性能情况,流量数据等。及时发现系统问题,及时修复,以确保系统的高可用。检查云资源的工作内容主要包括基础监控、主动拨测、用户体验、APM监控、指标体系、业务分析、智能警告 等。

一、基础监控

主机监控 提供操作系统的CPU、内存、磁盘、文件系统、网络的监控;同时提供进程级的监控;支持容器和进程的纵向调用,支持进程和组件的关联分析。

组件监控 支持Nginx、Apache、Redis、RabbitMQ、ActiveMQ、Zookeeper、Kafka、MySQL、Oracle、PostgreSQL、SQLServer、MongoDB、Elasticsearch等组件的指标监控,同时关联进程、主机、容器、APM提供纵向关联分析。

容器监控 支持Docker、Kubernetes的监控,自动发现容器进程,监控容器的CPU、内存、磁盘、网络;自动发现容器下运行的关键进程并与之关联,快速查看进程和容器的调用关系。

内网监控 从外部对应用或主机提供服务监控,支持ICMP监控、TCP监控、HTTP(s)监控。帮助用户监测局域网内网络的联通性和延迟。

二、主动拨测

拨测从用户视角,依托全球高质量布点网络,模拟用户的访问路径与习惯,能够让企业了解自身用户,无论何时何地,使用何种设备,能否顺畅进行访问,实时掌握用户体验,确保企业的数字化业务平稳运营。

移动应用拨测是基于自研自动化测试引擎和独一无二部署技术,模拟用户操作将核心业务流程脚本化并持续运行在生产环境中,实时采集业务性能数据,自动进行汇总分析的全方位自动化平台。能够让企业了解自身业务在用户视角下的实际情况:何时何地、使用何种设备、能否顺畅进行访问,实时掌握用户体验,确保企业的数字化业务平稳运营。

三、用户体验

采用SDK方式实现对App的崩溃、卡顿、超时等性能问题进行采集,并能对真实用户体验进行量化,实现版本迭代过程中的用户体验优化。

提供Web前端性能的监控与分析,量化前端用户体验指标,采集网页JS错误及网络请求错误,快速定位Web前端的性能问题,辅助进行Web前端性能优化。

提供对微信小程序、支付宝小程序的性能监控能力,并能够对小程序接口及小程序访问路径进行追踪,帮助开发人员有效进行小程序性能优化。 

 

四、APM监控

全栈拓扑

自动发现业务系统之间、应用与业务系统之间、应用与服务组件之间的关联关系。通过拓扑可快速梳理业务调用逻辑,快速发现与定位问题。

业务接口分析

对业务系统中完成某一业务操作的动作事件进行相关事务级别的监控与分析,这也是应用性能管理的最小监控单元,帮助用户细粒度定位问题。

代码级别定位

针对某事务实例,对其进行代码级别的堆栈分析,精确定位到某一行业务逻辑代码,观察其因为什么报错或是由于什么原因导致执行缓慢,帮助研发和运维人员快速定位问题。

异常分析

统计当前系统内所有应用错误、代码异常、数据库错误类型等,对业务的影响分析,包括影响的用户数、影响的业务指标等,帮助研发、运维、业务人员分析系统性能影响范围。

故障主动预警

支持多维度、灵活的配置预警策略,提供7*24小时主动预警能力,主动运维,VIP用户保障,第一时间发现性能问题,降低异常时长,减少运维人力投入

五、指标体系

指标管理可以接入自有系列产品监控的指标,以及诸如Zabbix、Prometheus等多个数据源、多种协议的外部指标数据,贯穿业务到IT系统的全方位立体化可观测能力。 

 

重要指标:

业务层

通用指标:业务可用性、业务错误数、完成业务数、报错业务数、活跃用户数、错误影响用户数、业务流可用性、完成业务流、报错业务流、在途业务流、活跃用户数、错误影响用户数、平均执行周期、操作可用性、操作成功次数、操作失败次数、同比环比 自定义指标:交易金额、订单总数、top10商家销售排名、top10热销商品等。

用户层

重要指标: 可用性:崩溃、卡顿、请求错误、操作可用性 网络性能:响应时间、网络时间、 用户体验性能:应用启动时间、页面可交互时间、页面首屏时间、操作时间。

网络层

重要指标: 页面监控:首屏时间、总下载时间、DNS时间、建连时间、首包时间、可用性等 文件监控:平均下载速度、DNS时间、建连时间、首包时间 Ping监测:延迟、丢包 事务:总下载时间、可用性、总下载字节数。

应用层

重要指标: 追踪:响应时间、执行时间、独占时间、投影时间、数据库响应时间 服务组件-数据库:吞吐率、响应时间、调用次数、异常次数、追踪次数 连接池:最大连接数、初始连接数、最小连接数、最大连接数、连接数使用率、连接数空闲率、平均连接时间 实例:吞吐率、响应时间、错误率、堆内存使用、非堆内存使用、GC time、GC count、线程数 应用:吞吐率、响应时间、错误率、错误数。

基础组件层

重要指标: 数据库:QPS、TPS、连接数、打开文件数、表容量、表行数、主从延迟、主从同步状态、SGA、PGA、表空间等 进程:CPU使用率、内存使用量、磁盘吞吐、网络吞吐,打开文件数、进程数等 容器:CPU使用率、内存使用量、磁盘吞吐、网络吞吐 主机:CPU使用率、内存使用率、磁盘分区使用率、磁盘读写吞吐量、磁盘读写IOPS、磁盘读写延迟、磁盘IOutil、网络吞吐率,网络错误等 网络或安全设备:CPU、内存、风扇、温度、电源等。

六、业务分析

 

七、智能告警

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/448737.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java运行时内存管理

一、前言 希望能在我们平时开发写代码的时候,能够知道当前写的这段代码,内存方面是如何分配的。 我们深知,一个Java程序员在很多时候根本不用操心内存的释放,而是依靠JVM去管理,以前写C代码的时候,却要时刻…

SAP 自定义生产订单状态

1、生产订单通常系统有一整套订单状态,做PP的各位同学都应该知道。 CRTD状态 REL已下达 CNF已报工 DLV已入库 TECO技术性完成 等等状态这里就不在罗列了,可以自行在生产订单中看到 2、这篇文章主要是在生产订单系统外,在自定义一套状态。这个…

Spring更简单的读取和存储Bean(基于注解)

目录 ①从Maven中央仓库获取spring-context和spring-beans的依赖,将依赖引入到pom.xml中 ②配置扫描路径 ③添加注解存储Bean对象(可以使用5大类注解和方法注解) 类注解(写在类上,作用于类上) Contro…

【致敬未来的攻城狮计划】— 连续打卡第十一天:FSP固件库开发点亮第一个灯。

系列文章目录 1.连续打卡第一天:提前对CPK_RA2E1是瑞萨RA系列开发板的初体验,了解一下 2.开发环境的选择和调试(从零开始,加油) 3.欲速则不达,今天是对RA2E1 基础知识的补充学习。 4.e2 studio 使用教程 5.…

leetcode刷题--辅助工具

idea插件 插件商店搜索leetcode,可以让你利用idea调试leetcode的题目 插件首先需要填写用户名密码登录,登录上就可以在idea搜题、做题、提交等 注意: 一些版本登录可能登录失败,解决方法是换leetcode地址为leetcode.cn。 有些可…

通过用户名密码认证保障 MQTT 接入安全

认证是一种安全措施,用于识别用户并验证他们是否有权访问系统或服务器。它能够保护系统免受未经授权的访问,确保只有经过验证的用户才能使用系统。 物联网连接万物,对试图访问基础设施的用户进行认证至关重要。未经授权的访问存在重大的安全…

数据保管库的数据质量错误

数据保管库的数据质量错误 在过去的几年里,数据仓库发生了巨大的变化,但这并不意味着支撑健全数据架构的基本原理需要被抛在窗外。事实上,随着GDPR等数据法规的日益严格以及对优化技术成本的重新重视,我们现在看到了“Data Vault…

设计模式之备忘录模式(C++)

作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 一、备忘录模式是什么? 备忘录模式是一种行为型的软件设计模式,在不破坏封装的前提下,获取一个…

OpenCV实例(八)行人跟踪

OpenCV实例(八)行人跟踪 1.目标跟踪概述2.基于背景差分检测运动物体2.1 实现基本背景差分器2.2 使用MOG背景差分器2.3 使用卡尔曼滤波器寻找运动趋势 3.跟踪行人 作者:Xiou 1.目标跟踪概述 目标跟踪是对摄像头视频中的移动目标进行定位的过…

数据结构与算法基础-学习-20-查找之散列表(HASH TABLE)

目录 目录 一、基本思想 二、术语 1、散列方法 2、散列函数 3、散列表 4、冲突 5、同义词 三、如何减少哈希冲突 四、构造散列函数需考虑的情况 五、散列函数的构造方法 1、直接定址法 2、除留余数法 六、如何处理哈希冲突 1、开地址法 2、拉链法 七、散列表查…

【微服务笔记16】微服务组件之Gateway服务网关基础环境搭建、高可用网关环境搭建

这篇文章,主要介绍微服务组件之Gateway服务网关基础环境搭建、高可用网关环境搭建。 目录 一、Gateway服务网关 1.1、什么是Gateway 1.2、Gateway基础环境搭建 (1)基础环境介绍 (2)引入依赖 (3&#…

快速上手Navicat~

众所周知, Navicat是一款轻量级的用于MySQL连接和管理的工具,非常好用,使用起来方便快捷,简洁。下面我会简单的讲一下其安装以及使用的方法。并且会附带相关的永久安装教程。 简介 一般我们在开发过程中是离不开数据库的&#xf…

【Unity VR开发】结合VRTK4.0:添加对象追随器

语录: 我已经准备好了足够挡雨的伞,可是却迟迟没有等到雨的到来,这样的尴尬只是我漫长人生中的小插曲罢了。 前言: 对象追随器的目的是让一个或多个游戏对象跟随场景中的另一个对象,而无需将游戏对象嵌套在彼此之下。 …

『pyqt5 从0基础开始项目实战』13. 打包生成exe(保姆级图文)

目录 项目源码打包exe打开闪退需要db文件夹总结 欢迎关注 『pyqt5 从0基础开始项目实战』 专栏,持续更新中 欢迎关注 『pyqt5 从0基础开始项目实战』 专栏,持续更新中 项目源码 请查阅专栏上文获取源码 ## 安装库包 python pip install pyinstaller ![…

Stable Diffusion的原理

CSDN-markdown语法之怎样使用LaTeX语法编写数学公式 参考视频:【diffusion】扩散模型详解!原理代码! 用一颗桃树为你讲清楚 知识点:AI绘图原理 Diffusion扩散模型 Windows深度学习环境搭建:Windows深度学习环境搭建 …

FFmpeg开发笔记(三)FFmpeg的可执行程序介绍

外界对于FFmpeg主要有两种使用途径,一种是在命令行运行FFmpeg的可执行程序,该方式适合没什么特殊要求的普通场景;另一种是通过代码调用FFmpeg的动态链接库,由于开发者可以在C代码中编排个性化的逻辑,因此该方式适合厂商…

一篇文章介绍分布式事务

1、事务的基本概念 事务 事务指的就是一个操作单元,在这个操作单元中的所有操作最终要保持一致的行为,要么所有操作都成功,要么所有的操作都被撤销。简单地说,事务提供一种“要么什么都不做,要么做全套”机制。 本地…

【越早知道越好】的道理——能够大大提升效率的【快捷键】

文章目录 1️⃣虚拟桌面第一步:打开任务视图第二步:创建桌面第三步:桌面切换第四步:桌面删除 2️⃣窗口切换3️⃣桌面分屏如何分屏 前言🧑‍🎤:作为程序员👨‍💻&#xf…

scratch足球射门练习 中国电子学会图形化编程 少儿编程 scratch编程等级考试一级真题和答案解析2023年3月

目录 scratch足球射门练习 一、题目要求 1、准备工作 2、功能实现 二、案例分析

基于Java+SpringBoot+Vue前后端分离仓库管理系统设计实现

基于JavaSpringBootVue前后端分离仓库管理系统设计实现 博主介绍:5年java开发经验,专注Java开发、定制、远程、指导等,csdn特邀作者、专注于Java技术领域 作者主页 超级帅帅吴 Java项目精品实战案例《500套》 欢迎点赞 收藏 ⭐留言 文末获取源码联系方式…