prometheus监控Nacos

news2025/1/21 1:51:01

Nacos监控

📚概述

Nacos 0.8.0版本完善了监控系统,支持通过暴露metrics数据接入第三方监控系统监控Nacos运行状态,目前支持prometheuselastic searchinfluxdb,下面结合prometheus和grafana如何监控Nacos,官网grafana监控页面。

🌂搭建Nacos并暴露metrics数据

  1. 搭建Nacos环境
  2. 配置application.properties文件,暴露metrics数据,如果仅暴露prometheus只配置prometheus即可,所有的都需要暴露,直接配置*
management.endpoints.web.exposure.include=prometheus
  1. 访问http://ip:8848/nacos/actuator/prometheus,看能否访问当metrics数据,获取到数据即正常。

Nacos暴露metrics数据

🎁Prometheus采集Nacos metrics数据

  1. 安装prometheus。
  2. 修改配置文件prometheus.yml采集Nacos metrics数据
# 静态文件配置
 - job_name: 'NACOS监控'
    metrics_path: '/nacos/actuator/prometheus'
    static_configs:
      - targets: ['{ip1}:8848','{ip2}:8848','{ip3}:8848']
      
# 动态文件发现机制
 - job_name: 'NACOS监控'
    metrics_path: '/nacos/actuator/prometheus'
    file_sd_configs:
      - files:
        - './nacos_config/*.json' #文件路径
        refresh_interval: 15s  #刷新时间
  1. 访问prometheus地址http://127.0.0.1:9090/graph,可以看到nacos相关的数据说明采集数据成功。或者可以查看http://127.0.0.1:9090/targets,查看Endpoint的状态。

image.png
image.png

🌯grafana图形化展示

  1. 搭建grafana环境
  2. 导入nacos面板信息。

面板地址:https://grafana.com/grafana/dashboards/13221
ID :13221

image.png
image.png

🎉Nacos监控分为三个模块

  • nacos monitor展示核心监控项

image.png

  • nacos detail展示指标的变化曲线

image.png

  • nacos alert为告警项

image.png

🔨指标含义(官方)

jvm metrics

指标含义
system_cpu_usageCPU使用率
system_load_average_1mload
jvm_memory_used_bytes内存使用字节,包含各种内存区
jvm_memory_max_bytes内存最大字节,包含各种内存区
jvm_gc_pause_seconds_countgc次数,包含各种gc
jvm_gc_pause_seconds_sumgc耗时,包含各种gc
jvm_threads_daemon线程数

Nacos 监控指标

指标含义
http_server_requests_seconds_counthttp请求次数,包括多种(url,方法,code)
http_server_requests_seconds_sumhttp请求总耗时,包括多种(url,方法,code)
nacos_timer_seconds_sumNacos config水平通知耗时
nacos_timer_seconds_countNacos config水平通知次数
nacos_monitor{name=‘longPolling’}Nacos config长连接数
nacos_monitor{name=‘configCount’}Nacos config配置个数
nacos_monitor{name=‘dumpTask’}Nacos config配置落盘任务堆积数
nacos_monitor{name=‘notifyTask’}Nacos config配置水平通知任务堆积数
nacos_monitor{name=‘getConfig’}Nacos config读配置统计数
nacos_monitor{name=‘publish’}Nacos config写配置统计数
nacos_monitor{name=‘ipCount’}Nacos naming ip个数
nacos_monitor{name=‘domCount’}Nacos naming域名个数(1.x 版本)
nacos_monitor{name=‘serviceCount’}Nacos naming域名个数(2.x 版本)
nacos_monitor{name=‘failedPush’}Nacos naming推送失败数
nacos_monitor{name=‘avgPushCost’}Nacos naming平均推送耗时
nacos_monitor{name=‘leaderStatus’}Nacos naming角色状态
nacos_monitor{name=‘maxPushCost’}Nacos naming最大推送耗时
nacos_monitor{name=‘mysqlhealthCheck’}Nacos naming mysql健康检查次数
nacos_monitor{name=‘httpHealthCheck’}Nacos naming http健康检查次数
nacos_monitor{name=‘tcpHealthCheck’}Nacos naming tcp健康检查次数

nacos 异常指标

指标含义
nacos_exception_total{name=‘db’}数据库异常
nacos_exception_total{name=‘configNotify’}Nacos config水平通知失败
nacos_exception_total{name=‘unhealth’}Nacos config server之间健康检查异常
nacos_exception_total{name=‘disk’}Nacos naming写磁盘异常
nacos_exception_total{name=‘leaderSendBeatFailed’}Nacos naming leader发送心跳异常
nacos_exception_total{name=‘illegalArgument’}请求参数不合法
nacos_exception_total{name=‘nacos’}Nacos请求响应内部错误异常(读写失败,没权限,参数错误)

client metrics

指标含义
nacos_monitor{name=‘subServiceCount’}订阅的服务数
nacos_monitor{name=‘pubServiceCount’}发布的服务数
nacos_monitor{name=‘configListenSize’}监听的配置数
nacos_client_request_seconds_count请求的次数,包括多种(url,方法,code)
nacos_client_request_seconds_sum请求的总耗时,包括多种(url,方法,code)

自定义修改面板

面板样式

image.png

📖参考资料

  1. Nacos 监控手册

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/738079.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java设计模式之创建型-单例模式(UML类图+案例分析)

目录 一、基础概念 二、UML类图 三、角色分析 四、案例分析 1、饿汉模式 2、懒汉模式(线程不安全) 3、懒汉模式(线程安全) 4、双重检索模式 5、静态内部类 6、枚举 五、总结 一、基础概念 单例模式确保一个类只有一个…

工厂能源管控系统

随着现代工业的发展,工厂能源消耗不断增加,能源成本成为企业生产经营的重要组成部分。为了降低能源消耗、提高生产效率和降低成本,越来越多的企业开始采用工厂能源管控系统。本文将从多个方面介绍工厂能源管控系统的全面内容。 一、工厂能源管…

增值税高,怎么办?节省税款的小技巧必知!

增值税高,怎么办?节省税款的小技巧必知! 《税筹顾问》专注于园区招商、企业税务筹划,合理合规助力企业节税! 增值税是所有企业必须要去缴纳的一种税种,它对于企业来说十分熟悉。而企业增值税高的问题也不是…

两部搞定Pytorch 安装与配置(小白也能搞定!!!)

Pytorch 安装与配置 NVIDIA系统管理界面查看 nvidia-smi 进入NVIDIA系统管理界面 对应的详细解释看下图 参考博文 (53条消息) nvidia-smi命令详解和一些高阶技巧介绍_Chaos_Wang_的博客-CSDN博客 CUDA 查看 CUDA 有两类:其中一类是驱动API(Driver API)&#xff…

拥抱“Zero ETL”未来,亚马逊云科技助力乐城堡加速数据分析

获得全球三千五百多万用户的认可的移动游戏企业乐城堡希望通过数据分析为游戏业务提供更好的决策支撑。乐城堡在亚马逊云科技上利用Amazon Redshift等服务构建属于自己的云上游戏数据分析平台,实现复杂查询,保证游戏运营人员能快速、近实时地获取所需的数…

Python-opcua 编程(3)历史数据读写

历史数据就是将opcua 信息模型中的某一些变量保存起来,以便Client 端程序能够读取历史数据,作各种数据处理。 Opcua 标准指出历史数据的读写,主要包括: 属性 Historizing 当设置为True 时,该变量支持历史数据读写 …

kafka主题支持路由功能

背景: 我们知道rabbitmq是支持消息路由的功能的,但是当我们统一消息中间件到kafka后,有一些旧的应用依然想要使用消息路由的功能时,我们可以怎么让kafka也支持消息路由的功能呢? 技术实现: 为了不影响ka…

web实现小米商城首页选择内容

一、需求&#xff1a;实现如下图所示的web内容 二、实现结果 三、代码展示 <!DOCTYPE html> <html> <head><title>小米商场</title><style>body {display: flex;flex-direction: column;align-items: center;justify-content: center;he…

阿里云轻量应用服务器使用教程(以建站为例)

阿里云轻量应用服务器怎么使用&#xff1f;阿里云轻量应用服务器使用教程&#xff1a;轻量应用服务器购买、重置密码、远程连接、宝塔面板的Web环境搭建、WordPress网站程序安装到网站上线&#xff0c;阿里云服务器网分享轻量应用服务器从购买、配置建站环境、轻量服务器应用服…

【SLAM】Ceres优化库超详细解析

Ceres是由Google开发的开源C通用非线性优化库&#xff0c;与g2o并列为目前视觉SLAM中应用最广泛的优化算法库。 对于任何一个优化问题&#xff0c;我们首先需要对问题进行建模&#xff0c;之后采用合适的优化方法&#xff0c;进行求解。在求解的过程中&#xff0c;往往需要进行…

用 Nginx 禁止国外 IP 访问我的网站...

先来说说为啥要写这篇文章&#xff0c;之前看了下 Nginx 的访问日志&#xff0c;发现每天有好多国外的 IP 地址来访问我的网站&#xff0c;并且访问的内容基本上都是恶意的。因此我决定禁止国外 IP 来访问我的网站。 想要实现这个功能有很多方法&#xff0c;下面我就来介绍基于…

(动态规划) 132. 分割回文串 II ——【Leetcode每日一题】

❓ 132. 分割回文串 II 难度&#xff1a;困难 给你一个字符串 s&#xff0c;请你将 s 分割成一些子串&#xff0c;使每个子串都是回文。 返回符合要求的 最少分割次数 。 示例 1&#xff1a; 输入&#xff1a;s “aab” 输出&#xff1a;1 解释&#xff1a;只需一次分割就…

Vision Transformer (ViT)介绍

paper&#xff1a;An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale 摘要 把transformer直接应用于图像块序列&#xff0c;也可以在图像分类任务上表现很好。通过在大数据集上预训练&#xff0c;然后迁移到中等规模和小规模数据集上&#xff0c;…

Android之签字板

文章目录 前言一、效果图二、实现步骤1.GestureSignatureView类2.xml布局3.Activity类(kotlin)4.Activity类(Java)5.动态申请权限(kotlin)6.动态申请权限(Java) 总结 前言 随着公司发展需求&#xff0c;很多金融APP都会涉及到需要用户签字的环节&#xff0c;所以在此贴出代码以…

软考高级架构师笔记-9系统架构

目录 1. 前文回顾 & 考情分析2. 软件架构概述3. 软件架构风格3.1 层次架构风格3.2 面向服务架构风格4. 软件架构复用5. 特定领域软件体系结构DSSA6. ABSD7. 质量属性8. 架构评估9 结语1. 前文回顾 & 考情分析 前文回顾: 软考高级架构师笔记-1计算机硬件软考高级架构师…

TCP 协议(三)十种核心机制

1.确认应答&#xff08;可靠机制&#xff09; 2.超时重传&#xff08;可靠机制&#xff09; 3.连接管理&#xff08;可靠机制&#xff09; 4.滑动窗口&#xff08;效率机制&#xff09; 5.流量控制&#xff08;效率机制&#xff09; 6.拥塞控制&#xff08;效率机制&#xff09…

优维低代码实践:权限设置

优维低代码技术专栏&#xff0c;是一个全新的、技术为主的专栏&#xff0c;由优维技术委员会成员执笔&#xff0c;基于优维7年低代码技术研发及运维成果&#xff0c;主要介绍低代码相关的技术原理及架构逻辑&#xff0c;目的是给广大运维人提供一个技术交流与学习的平台。 优维…

js两种对象混合写,返回的是哪一个

<script>function jiafa() {this.name "xuhaitao";this.age 36;var obj {};obj.xx "hunkxu";obj.yy "88";return obj;}var aa new jiafa();console.log(aa);</script> 打印&#xff1a; FR&#xff1a;徐海涛(hunk xu)

3D引擎龙头Unity:元宇宙和AI活跃玩家

Unity是用于创建和操作交互式实时3D内容的世界领先平台。凭借灵活的编辑器、友好的开发环境、丰富的工具套件&#xff0c;Unity吸引了大量开发者&#xff0c;全球排名前1000的移动游戏70%以上使用了Unity的创作和运营解决方案&#xff0c;如今&#xff0c;Unity引擎在工业场景、…

leaflet地图移动防抖问题

现在有这么一个需求&#xff0c;当移动地图时&#xff0c;需要获取当前地图范围属于那个城市。如果频繁移动地图&#xff0c;会不停的调用接口获取当前地图视图所属城市&#xff0c;所以加个防抖&#xff0c;减少请求。代码示例&#xff1a;<!DOCTYPE html> <html>…