Skywalking仪表盘使用
1 仪表盘
作用:查看被监控服务的运行状态。
1)监控面板
1.1 APM
APM:应用性能管理,通过各种探针采集数据,收集关键指标,同时搭配数据呈现以实现对应用程序性能管理和故障管理的系统化解决方案。
1.1.1 Global全局维度
板块描述:
Services load:服务每分钟请求数
Slow Services:慢响应服务,单位ms
Un-Health services(Apdex):Apdex性能指标,1为满分。
Show Endpoints:慢响应端点,单面ms
Global Response Latency:百分比响应延时,不同百分比的延时时间,单位ms
Global Heatmap:服务响应时间热力分布图,根据时间段内不同响应时间的数量显示颜色深度
底部栏:展示数据的时间区间,点击可以调整
1.1.2 Service服务维度
属性描述:
Service Apdex(数字):当前服务的评分
Service Apdex(折线图):不同时间的Apdex评分
Service Avg Response Times:平均响应延时,单位ms
Global Response Time Percentile:百分比响应延时
Successful Rate(数字):请求成功率
Successful Rate(折线图):不同时间的请求成功率
Servce Load(数字):每分钟请求数
Servce Load(折线图):不同时间的每分钟请求数
Servce Instances Load:每个服务实例的每分钟请求数
Show Service Instance:每个服务实例的最大延时
Service Instance Successful Rate:每个服务实例的请求成功率
1.1.3 Instance实例维度
属性描述:
Service Instance Load:当前实例的每分钟请求数
Service Instance Successful Rate:当前实例的请求成功率
Service Instance Latency:当前实例的响应延时
JVM CPU:jvm占用CPU的百分比
JVM Memory:JVM内存占用大小,单位m
JVM GC Time:JVM垃圾回收时间,包含YGC和OGC
JVM GC Count:JVM垃圾回收次数,包含YGC和OGC
JVM Thread Count (Java Service):JVM创建线程数量
CLR xx:类似JVM虚拟机(可以直接理解成虚拟机)
1.1.4 Endpoint端点(API)维度
属性描述:
Endpoint Load in Current Service:每个端点的每分钟请求数
Slow Endpoints in Current Service:每个端点的最慢请求时间,单位ms
Successful Rate in Current Service:每个端点的请求成功率
Endpoint Load:当前端点每个时间段的请求数据
Endpoint Avg Response Time:当前端点每个时间段的请求行响应时间
Endpoint Response Time Percentile:当前端点每个时间段的响应时间占比
Endpoint Successful Rate:当前端点每个时间段的请求成功率
1.2 DataSource展示栏
属性描述:
当前数据库:选择查看数据库指标
Database Avg Response Time:当前数据库事件平均响应时间,单位ms
Database Access Successful Rate:当前数据库访问成功率
Database Traffic:CPM,当前数据库每分钟请求数
Database Access Latency Percentile:数据库不同比例的响应时间,单位ms
Slow Statements:前N个慢查询,单位ms
All Database Loads:所有数据库中CPM排名
Un-Health Databases:所有数据库健康排名,请求成功率排名
注意:
Istio:适配容器/k8s,采集容器信息并呈现。 https://istio.io/latest/zh/docs/reference/config/policy-and-telemetry/adapters/apache-skywalking/
SelfObservability:自监控,监控Skywalking自身信息。
Web Browser:SkyWalking 8.2.0 拓展了核心功能,并将其监控边界拓展到浏览器端。使用者不仅可以像以前一样监控浏览器发送给后端服务的与请求,还能看到前端的渲染速度、错误日志等信息。
1.3 编辑仪表盘
指标:
read the single value in the duration:读取持续时间内的单个值
read all values in the duration:读取持续时间内的所有值
get sorted top N values:排序前N个值
选择器(确定指定服务):
Common selectors:通用选择器
Self selectors:自定义选择器
数据计算:
Plus +(加)
Minus -(减)
Multiplication *(乘)
Division ÷(除法)
Convert Unix Timestamp(时间转换)
2 拓扑图
3 追踪
属性描述:
左侧:api接口列表,红色-异常请求,蓝色-正常请求
右侧:api追踪列表,api请求连接各端点的先后顺序和时间
操作详情:
4 性能剖析
创建性能剖析采集清单:
新建性能剖析属性描述:
服务:需要分析的服务
端点:链路监控中端点的名称,可以再链路追踪中查看端点名称
监控时间:采集数据的开始时间
监控持续时间:监控采集多长时间
起始监控时间:多少秒后进行采集
监控间隔:多少秒采集一次
最大采集数:最大采集多少样本
5 告警
不同维度告警列表,可分为服务、端点和实例。日志收集只在8.4支持,8.4目前出来太晚了,我们暂时不关注该功能。