瞎更新,container_cpu_usage_seconds_total{job=“cadvisor“} 怎么没有啦

news2024/11/27 1:17:04

一、 基本介绍

1.1 概论

1.1.1 故事背景

今天在同步其他团队的 grafana 监控大盘时,Prometheus 服务报告说不能找到名为 container_cpu_usage_seconds_total{job=“cadvisor”} 的指标,一般来说可能有几个原因。

  1. 可能是 Prometheus 服务没开启
  2. prometheus.yaml文件可能也没有正确配置
  3. 可能是你的操作系统不兼容,有些操作系统并不兼容 container_cpu_usage_seconds_total 指标

当然我这里不是以上的问题。我的指标 job label 是 kubelet。

1.1.2 介绍 container_cpu_usage_seconds_total 指标

Container_cpu_usage_seconds_total(CCU)是容器资源监控中非常重要的一个指标,它可以帮助用户诊断容器应用程序的负载情况。它是定期统计容器已使用 CPU 时间总和,确切地计算容器中每个核心总体占用时间。这对于监视容器内运行的应用程序和进程的性能、优化性能以及准备扩展到容器集群和大规模架构来说,都是非常有用的。

通过 CCU,可以使用分析法来发现容器内诸如 CPU 过载、内存问题、roofline 带宽限制以及死锁等其他问题,从而有效地为团队提供解决方案,并提高整体系统的吞吐量和资源利用率。 CCU 提供了一种简单有效的方法,可以帮助开发者跟踪某些特定容器中的 CPU 需求,也可以帮助 SRE/DevOps 团队识别和优化容器中运行的应用程序。

Container_cpu_usage_seconds_total 通过谷歌的 cAdvisor 组件采集。

1.1.3 cAdvisor 容器监控介绍

cAdvisor 是一款能够监视容器性能的开源软件,由 Google 开发并维护。它可以用于监视本地的容器以及远程的容器,监测包括 CPU、内存、文件系统等等指标,并提供实时和历史图表。

cAdvisor 不但可以监督容器,它还可以运行在物理机上面,监控物理机的资源情况。另外,cAdvisor 用来支持 Kubernetes 的资源管理系统,使得 Kubernetes 可以更好地处理容器的管理和调度工作。
在这里插入图片描述

注意,坑来了

从 v1.7 开始,Kubelet metrics API 不再包含 cadvisor metrics,而是提供了一个独立的 API 接口:

● Kubelet metrics: http://127.0.0.1:8001/api/v1/proxy/nodes//metrics
● Cadvisor metrics: http://127.0.0.1:8001/api/v1/proxy/nodes//metrics/cadvisor

这样,在 Prometheus 等工具中需要使用新的 Metrics API 来获取这些数据,比如下面的 Prometheus 自动配置了 cadvisor metrics API:
helm install stable/prometheus --setrbac.create=true --name prometheus --namespace monitoring

注意:cadvisor 监听的端口将在 v1.12 中删除,建议所有外部工具使用 Kubelet Metrics API 替代。

也就是说,k8s 默认会携带 cadvisor,在 kubelet 上,但是不同版本,他们的 job 会发生变化(存疑?)。我的 k8s 底座版本是 1.18,我的 container_cpu_usage_seconds_total{job=“kubelet”},而不是在 cadvisor。

我独立安装 cAdvisor,这样 container_cpu_usage_seconds_total{job=“cadvisor”} 就能继续出现,也能比较一下他们的差异。

二、kubelet 和 cAdvisor 暴露的指标有什么区别呢

通过部署独立版 cAdvisor,只查询 container_cpu_usage_seconds_total 这个指标,发现区别还是很大的。

  1. kubelet 暴露的 container_cpu_usage_seconds_total 指标,总长度会精简很多,只有1/4的长度
  2. 查询速度也快的多,耗时小于超过 1/3。

原因是 cAdvisor 导出的指标有20多个label,而kubelet 导出的只有10多个label,且整个指标数据总长度大于4倍。

三、找到这个指标的两个办法

  1. 使用 kubelet 的指标
  2. 部署 cAdvisor

3.1 部署 cAdvisor 方式

  1. 查看官方部署教程:https://github.com/google/cadvisor/tree/master/deploy/kubernetes
  2. 添加 service 和 servicemonitor
# service.yaml
apiVersion: v1
kind: Service
metadata:
  labels:
    app: cadvisor
  name: cadvisor
  # 部署的 namespace
  namespace: cadvisor
spec:
  clusterIP: 10.43.132.12
  ports:
  - name: metric
    port: 8080
    protocol: TCP
    targetPort: 8080
  selector:
    app: cadvisor
    name: cadvisor
  sessionAffinity: None
  type: ClusterIP


# serviceMonitor.yaml
apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
  labels:
    release: monitor
  name: cadvisor
  # 部署的 namespace
  namespace: cadvisor
spec:
  endpoints:
  - interval: 30s
    port: metric
  namespaceSelector:
    matchNames:
    - cadvisor
  selector:
    matchLabels:
      app: cadvisor

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/364759.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

leaflet 实现极地标线地图,加载tileLayer.wms数据(088)

第088个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+leaflet中实现极地标线地图,加载tileLayer.wms数据。 直接复制下面的 vue+openlayers源代码,操作2分钟即可运行实现效果. 文章目录 示例效果配置方式示例源代码(共93行)安装插件专栏目标相关API参考:示例效果…

什么是API?(详细解说)

编程资料时经常会看到API这个名词,网上各种高大上的解释估计放倒了一批初学者。初学者看到下面这一段话可能就有点头痛了。 API(Application Programming Interface,应用程序编程接口)是一些预先定义的函数,目的是提供应用程序与开…

超详细的阿里java岗社招知识点整理,常考知识点全在这里了

常考知识点 1、java的基本数据类型与包装类; 2、final修饰变量类方法; 3、String为什么是不可变的,以及new String(“abc”)创建了几个对象; 4、String、StringBuffer、以及StringBuilder的区别; 5、static修饰变…

金融BI分析的价值

众所周知,金融行业从信息化时代起,就是对IT依赖程度非常高的,也是最严苛的。进入到数字化时代,金融机构越来越注重技术创新,BI工具也越来越受到重视。利用BI工具,金融机构可以更快、更准确地获得有关市场信…

2023年1月用户体验GX评测:商业银行抢抓新春营销旺季,多措并举持续提升用户体验

易观:2023年1月正值中国传统春节营销旺季,各家银行充分发挥手机银行的优势,积极探索新春营销新模式,为客户提供极富特色的“开门红”线上营销活动,提升用户参与积极性,在用户体验上积极探索,增强…

真香!Linux 原来是这么管理内存的

Linux 内存管理模型非常直接明了,因为 Linux 的这种机制使其具有可移植性并且能够在内存管理单元相差不大的机器下实现 Linux,下面我们就来认识一下 Linux 内存管理是如何实现的。 一,基本概念 每个 Linux 进程都会有地址空间,这…

基于莱维飞行改进粒子群优化的长短期神经网络ispso-lstm的客流量预测,ISPSO-LSTM,神经网络1000案例之16

目录 摘要 背影 改进思路 shubett测试函数 函数代码 函数图像 测试ispso算法性能 测试代码 测试效果图像 ispso-lstm客流量预测 代码 测试效果 分析 展望 摘要 针对基本粒子群算法容易发生早熟收敛,陷入局部最优,等缺点,提出了基于莱维飞行的改进粒子群算法.在粒子位置更新公…

《计算机网络:自顶向下方法》实验5:TCP

Q1 包含HTTP POST消息的TCP报文段的序号是多少?注意:为了发现POST 命令, 你需要在wireshark底部的报文内容域窗口中去查找,查找数据中包含 “POST”的段。 如图所示,由报文中的POST 和 HTTP/1.1可知,其包含HTTP POST消息; TCP报文段的序号可见TCP报文: Sequence Number:…

win10输入法设置在哪里?对于输入法设置的图文教程

使用电脑打字,那么我们就会用到输入法。对于Windows电脑输入法的设置,很多用户都不知道如何调整。实际上,输入法设置就在“语言”选项里面,想要知道win10输入法设置的操作步骤,那就跟着小编的步伐来看看吧!…

win10下 WSL2安装及配置

目录 一. Windows中WSL2(子系统)安装前提条件 二. Windows中WSL2(子系统)安装步骤(默认安装C盘) 选择包安装模式(选择到其他盘安装) 三. Windows中WSL2(子系统)设置默认root用户登…

数据结构——复杂度的详解(空间复杂度和时间复杂度)

1.程序算法效率 1.1什么是算法? 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。 1.2衡量算法好坏的标准 这是一个通过函数递归算法实…

轻量级权限框架之-Sa-ToKen

轻量级的权限认证框架 Sa-Token 目前主要五大功能模块:登录认证、权限认证、单点登录、OAuth2.0、微服务鉴权 登录认证 —— 单端登录、多端登录、同端互斥登录、七天内免登录 权限认证 —— 权限认证、角色认证、会话二级认证 Session会话 —— 全端共享Session、…

Hadoop3 集群搭建

测试环境 信息内容主机版本centos7机器数量3台Hadoop版本3.3.4安装包解压路径/home/tools/hadoop/ hosts配置 主机ip地址对应主机host192.168.57.188node1192.168.57.189node2192.168.57.190node3 一. 前置环境准备 安装JDK1.8(Hadoop支持1.8)创建非root用户(这里用的myuser…

关于企业文档能力开放,你想知道的都在这里了

最近一个朋友向我请教关于企业文档能力开放的事,说了一大堆的问题,我是做技术的,有很多基础知识和理论要向同行学习,所以给他解答了一通,但是朋友觉得解释的没啥实际用处。。。其实这个能力对很多人来说可能都不太明白…

MYBatis-Plus常用注解@TableName、@TableId、@TableField、@TableLogic

1-1:TableName 注解作用:设置实体类对应的表明 value作用:value指定数据库中的表名 如果我们不设置这个注解,我们操作的数据库的表就由BaseMapper 泛型决定(SysLog) TableName(value "sys_Log&qu…

学习动漫插画的网络班排行榜

很多小伙伴不知道动漫插画培训机构哪个好,找不到靠谱的插画班,今天给大家整理了国内动漫插画培训机构排名! 一:动漫插画培训机构排名 1、轻微课(五颗星) 主打课程有日系插画、游戏原画、古风插画、动漫漫画…

python基于vue个人家庭理财记账管理系统

近年来在计算机的迅速发展的背景下,家庭理财领域与传统手工记账相比,使用计算机系统来管理不仅克服了地域上的局限性,而且增强了用户在时间和空间上的体验,以及能够让用户随时随地进行需要的操作,可以很好的规避传统的…

【建议收藏】Jenkins+postman+newman之API全自动化测试

1 背景 本文要介绍的环境在我司已经投入使用,举个简单的真实使用场景,开发提供了300多个API,每个API都有各种参数,所以我们会先在postman中为这300多个API编写300*n个testcase,然后在jenkins上跑;到此有人…

【Spark分布式内存计算框架——离线综合实战】2. 业务需求

1.3 业务需求 对广告数据进行初步ETL处理和业务报表统计分析,整体业务需求如下图所示: 两个主要方面的业务: 第一个、数据【ETL 处理】 依据IP地址,调用第三方库解析为省份province和城市city;将ETL后数据保存至PAR…

消费升级趋势下,平台如何在广告电商模式中攫取新流量

如今电商平台飞速发展,越来越多的人加入电商运营的行列,同行竞争逐渐变得激烈起来,为了能够让平台有更多的展现机会,提升平台的商品转化率,大家都很重视平台的优化,因为一个好的平台可以给自身带来更多的流…