黑马Hive+Spark离线数仓工业项目-服务器性能监控Prometheus

news2024/12/26 9:33:30

监控需求及常见工具

目标:了解服务器性能监控需求及常见监控工具

路径

  - step1:监控需求
  - step2:常见工具

实施

  监控需求

    - 问题:数据量越来越大,机器数量越来越多,如何保证所有服务器稳定的的运行,确保所有业务不掉线?
      - 资源:CPU、内存、磁盘、网络
      - 阈值:80%
    - 解决:高效的监控系统可以对运维数据进行分析整理,将运维工作透明化可视化,方便运维人员及时找出问题,保障系统稳定运行,提高运维效率,满足不同业务需求,适用不同服务器场景,也是决定运维成本和效率的重要因素
    - 需求
      覆盖式监控:监控所有机器、所有服务的运行
      统一监控内容:CPU、内存、磁盘、网络IO
      分离告警和显示:实时的监控机器负载,程序运行,并针对不同业务实现不同方式的告警和报表

常见工具

  zabbix

   基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案
      zabbix能监视各种网络参数,保证服务器系统的安全运营
      提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题

Nagios

    一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的状态,交换机路由器等网络设备,打印机等
      在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知

Prometheus

Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB),它启发于 Google 的 borgmon 监控系统,由工作在 SoundCloud 的 google 前员工在 2012 年创建,作为社区开源项目进行开发,并于 2015 年正式发布。
      2016 年,Prometheus 正式加入 Cloud Native Computing Foundation,成为受欢迎度仅次于 Kubernetes 的项目。

Prometheus的介绍

目标:了解Prometheus的功能和特点

路径

  - step1:功能
  - step2:特点

实施

  - https://prometheus.io/

  - 功能:服务器性能指标监控及时序数据存储

    -  Prometheus实现了高纬度数据模型,时间序列数据由指标名称和键值对指标组成。
    - PromQL允许对收集的时间序列数据进行切片和切块,生成ad-hoc图形、图表、告警
    - Prometheus有多种数据可视化模式:内置表达式浏览器,grafana集成、控制台模板语言
    - Prometheus使用有效的自定义格式将时间序列数据存储在内存中和本地磁盘,通过函数式分片和联邦进行弹性扩展。
    - 每个服务器都是独立的,仅依赖于本地存储。用go语言编写,所有二进制文件都是静态链接,易于部署。
    - 告警是基于PromQL灵活定义的,并保留维度信息,告警管理器控制告警信息的通知与否。

  - 特点

    - 多维度数据模型。
    - 灵活的查询语言。
    - 不依赖分布式存储,单个服务器节点是自主的。
    - 通过基于HTTP的pull方式采集时序数据。
    - 可以通过中间网关进行时序列数据推送。
    - 通过服务发现或者静态配置来发现目标服务对象。
    - 支持多种多样的图表和界面展示,比如Grafana等。

Prometheus的架构

目标:了解Prometheus的架构

实施

  - **Prometheus server**:Prometheus主服务器,它会收集并存储时间序列数据

  - **Alalert manager**:处理告警信息

  - **Push gateway**:支持短暂任务的推送网关

  - Client libraries:用于检测应用程序代码的客户端库

  - Exporters:特定的导出器服务,例如:HAProxy,StatsD,Graphite等服务。

 Prometheus的部署

目标:实现Prometheus的部署
实施

  上传解压

cd ~
    rz
    # 解压安装包
    tar zxvf prometheus-2.26.0.linux-amd64.tar.gz -C /opt
    # 修改文件名
    mv /opt/prometheus-2.26.0.linux-amd64/ /opt/prometheus-2.26
    # 进入解压后的安装包
    cd /opt/prometheus-2.26

  验证

  

 ./prometheus --version

  - 查看配置:prometheus.yml

# my global config
    global:
      scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
      evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
      # scrape_timeout is set to the global default (10s).
    
    # Alertmanager configuration
    alerting:
      alertmanagers:
      - static_configs:
        - targets:
          # - alertmanager:9093
    
    # Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
    rule_files:
      # - "first_rules.yml"
      # - "second_rules.yml"
    
    # A scrape configuration containing exactly one endpoint to scrape:
    # Here it's Prometheus itself.
    scrape_configs:
      # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
      - job_name: 'prometheus'
    
        # metrics_path defaults to '/metrics'
        # scheme defaults to 'http'.
    
        static_configs:
        - targets: ['localhost:9090']

注册系统服务

    vim /etc/systemd/system/prometheus.service
  [Unit]
    Description=Prometheus
    Documentation=Prometheus Monitoring System
    
    [Service]
    ExecStart=/opt/prometheus-2.26/prometheus --config.file=/opt/prometheus-2.26/prometheus.yml
    Restart=on-failure
    [Install]
    WantedBy=multi-user.target

启动

# 设置开机自启动
    systemctl enable prometheus
    # 启动服务
    systemctl start prometheus
    # 查看服务状态
    systemctl status prometheus

验证:node1:9090


 node_exporter插件

目标:实现node_exporter插件的安装监控Linux指标

实施

上传安装

  cd ~
    rz
    tar zxvf node_exporter-1.1.2.linux-amd64.tar.gz -C /opt/prometheus-2.26/
    mv /opt/prometheus-2.26/node_exporter-1.1.2.linux-amd64 /opt/prometheus-2.26/node_exporter

注册

 # 创建并编辑文件
    vim /etc/systemd/system/node_exporter.service
  [Unit]
    Description=node_exporter
    Documentation=Prometheus node_exporter plugin
    
    [Service]
    ExecStart=/opt/prometheus-2.26/node_exporter/node_exporter
    Restart=on-failure
    [Install]
    WantedBy=multi-user.target

启动

   # 设置开机自启动
    systemctl enable node_exporter
    # 启动服务
    systemctl start node_exporter
    # 查看服务状态
    systemctl status node_exporter

配置Prometheus

vim /opt/prometheus-2.26/prometheus.yml
scrape_configs:
    
      - job_name: 'prometheus'
        static_configs:
          - targets: ['localhost:9090']
      # 增加以下内容
      - job_name: 'linux'
        static_configs:
        - targets: ['localhost:9100']
          labels:
            instance: node1  

重启prometheus

 systemctl restart prometheus.service

验证:http://node1:9090

 

 - 查看当前主机的CPU使用情况:node_cpu_seconds_total

  - 查看当前主机的CPU负载情况 :node_load15

 mysqld_exportor插件

目标:实现mysqld_exportor插件的安装监控MySQL指标

实施

  上传安装

cd ~
    rz
    tar zxvf mysqld_exporter-0.13.0-rc.0.linux-amd64.tar.gz -C /opt/prometheus-2.26/
    mv /opt/prometheus-2.26/mysqld_exporter-0.13.0-rc.0.linux-amd64/ /opt/prometheus-2.26/mysqld_exporter/

  - **配置MySQL用户授权**

  mysql -uroot -p
    SHOW VARIABLES LIKE 'validate_password%';
    set global validate_password_policy=LOW; 
    set global validate_password_length=6;
    # 授权
    GRANT PROCESS, REPLICATION CLIENT, SELECT ON *.* TO 'mysql_exporter'@'localhost' IDENTIFIED BY '123456' WITH MAX_USER_CONNECTIONS 3;
    flush privileges;

    - DDL:数据定义语言:建库建表
    - DML:数据操作语言:增删改
    - DQL:数据查询语言:查询
    - DCL:grant、revoke

  - **注册服务**

  vim /etc/systemd/system/mysqld_exporter.service
 [Unit]
    Description=mysqld_exporter
    Documentation=Prometheus mysql exporter plugin
    
    [Service]
    Type=simple
    User=mysql
    Environment=DATA_SOURCE_NAME=mysql_exporter:123456@(localhost:3306)/
    ExecStart=/opt/prometheus-2.26/mysqld_exporter/mysqld_exporter --config.my-cnf /etc/my.cnf \
      --collect.slave_status \
      --collect.slave_hosts \
      --log.level=error \
      --collect.info_schema.processlist \
      --collect.info_schema.innodb_metrics \
      --collect.info_schema.innodb_tablespaces \
      --collect.info_schema.innodb_cmp \
      --collect.info_schema.innodb_cmpmem 
    Restart=on-failure
    [Install]
    WantedBy=multi-user.target

启动服务

  # 设置开机自启动
    systemctl enable mysqld_exporter
    # 启动服务
    systemctl start mysqld_exporter
    # 查看服务状态
    systemctl status mysqld_exporter

  - **配置Prometheus**

 vim /opt/prometheus-2.26/prometheus.yml
  scrape_configs:
      # 增加以下内容
      - job_name: 'mysql'
        scrape_interval: 1s
        static_configs:
        - targets: ['localhost:9104']
          labels:
            instance: 'mysqld_exporter'

    - 重启prometheus

systemctl restart prometheus.service

验证

    - mysql_exporter_collector_duration_seconds

    

可视化工具Grafana介绍

目标:了解Grafana的功能及特点

路径

  - step1:功能
  - step2:特点

实施

  - https://grafana.com/

 功能:Grafana是一个跨平台的开源的度量分析和可视化工具,可以通过将采集的数据查询然后可视化的展示,并及时通知

特点

展示方式多样:快速灵活的客户端图表,面板插件有许多不同方式的可视化指标和日志,官方库中具有丰富的仪表盘插件,比如热图、折线图、图表等多种展示方式
数据源丰富:Graphite,InfluxDB,OpenTSDB,Prometheus,Elasticsearch,CloudWatch和KairosDB等
多种通知提醒:以可视方式定义最重要指标的警报规则,Grafana将不断计算并发送通知,在数据达到阈值时通过Slack、PagerDuty等获得通知
混合展示:在同一图表中混合使用不同的数据源,可以基于每个查询指定数据源,甚至自定义数据源
注释:使用来自不同数据源的丰富事件注释图表,将鼠标悬停在事件上会显示完整的事件元数据和标记
过滤器:Ad-hoc过滤器允许动态创建新的键/值过滤器,这些过滤器会自动应用于使用该数据源的所有查询

可视化工具Grafana部署

目标:实现可视化工具Grafana的部署

实施

上传安装

 cd ~
    rz
    yum install -y  grafana-7.5.3-1.x86_64.rpm

启动服务

 # 设置开机自启动
    systemctl enable grafana-server
    # 启动服务
    systemctl start grafana-server
    # 查看服务状态
    systemctl status grafana-server

验证:http://node1:3000/

    - 默认用户名密码均为admin

 - 可以自行修改 

    - 进入主界面

Grafana集成Prometheus

目标:实现Grafana集成Prometheus

实施

 添加数据源

选择模板

    - https://grafana.com/grafana/dashboards

    

导入报表

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/138542.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【EHub_tx1_tx2_E100】 ROS_ Melodic + Astra S(如何在该环境下打开摄像机获取rgb/深度图/点云)

简介&#xff1a;介绍奥比中光 Astra S 深度相机 在EHub_tx1_tx2_E100载板&#xff0c;TX1核心模块环境&#xff08;Ubuntu18.04&#xff09;下测试ROS驱动&#xff0c;打开摄像头RGB图像和查看深度图和点云图&#xff0c;本文的前提条件是你的TX1里已经安装了ROS版本&#xff…

CAN 通信协议

CAN 概述 CAN 是Controller Area Network 的缩写&#xff08;以下称为CAN&#xff09;&#xff0c;它的设计目标是以最小的CPU负荷来高效处理大量的报文。1986 年德国电气商BOSCH公司开发出面向汽车的CAN 通信协议。此后&#xff0c;CAN 通过ISO11898 及ISO11519 进行了标准化…

Vue 实现拖拽模块(五) - 下 预览元件

上文介绍了 定义元件的触发事件(上) 的简单实现 本文主要介绍了预览元件数据&#xff0c;并根据配置事件去触发逻辑&#xff0c;具体如下&#xff1a; 效果图 实现过程 创建预览页面 (元件配置和预览并不是同一个页面)预览页面使用 localStorage 缓存获取保存的元件数据&…

网络编程看这一篇文章就够了

第一章 网络编程概述 网络编程概述1 2 3Java语言提供了网络的支持,程序员能够很容易的开发常见的网络应用.Java提供的类库,可以实现无痛的网络连接,联网的底层细节被隐藏在安装Java本机系统里.由JVM进行控制.并且Java实现了一个跨平台的网络库.网络编程的目的1直接或间接地通过…

SQL Server注入技巧与提权方式详解

目录 前言 一、SQL Server基础 1. SQL Server 2012安装启动 navicat远程连接 2. SQL Server概念 数据库的组成 数据库中常用对象 默认库介绍 3. T-SQL语言 创建数据库 创建表 插入数据 基础语法总结 4. sqlserver权限 新建用户并赋予权限 权限总结 二、Sqlser…

4.1 集成运算放大电路概述

集成电路以半导体单晶硅为芯片&#xff0c;采用专门的制造工艺&#xff0c;把晶体管、场效应管、二极管、电阻和电容等元件及它们之间的连线所组成的完整电路制作在一起&#xff0c;使之具有特定的功能。集成放大电路最初多用于各种模拟信号的运算&#xff08;如比例、求和、求…

RabbitMQ 管理界面操作说明

RabbitMQ 管理界面操作说明 当我们安装好RabbitMQ&#xff0c;并开启了rabbitmq_management插件并重启RabbitMQ服务后,我们就可以访问管控台了。 #启动后台管理 [rootVM-0-9-centos sbin]#rabbitmq-plugins enable rabbitmq_management rabbitmq_management开启后&#xff0…

Java流程控制语句-学习笔记

目录 第一章 流程控制语句 1.1 流程控制语句分类 1.2 顺序结构 第二章 判断语句&#xff1a;if语句 2.1 if语句格式1 2.2 if语句格式2 2.3 if语句格式3 第三章 switch语句 3.1 格式 3.2 执行流程&#xff1a; 3.3 switch的扩展知识&#xff1a; 第四章 循环结构 4…

win11+wsl2+kind安装k8s

win11wsl2安装k8s 1. 安装docker w11上面安装docker-desktop的方案&#xff0c;具体的安装步骤&#xff1a; 先开启系统的镜像支持更新wsl设置默认版本为2安装docker-desktop&#xff0c;修改安装位置等&#xff0c;否则就是安装在c盘中 https://blog.csdn.net/weixin_4391…

【机器学习】李宏毅-判断年收入

李宏毅-判断年收入1 实验目的 本次作业的数据是加州大学尔湾分校机器学习作业中下载得到&#xff0c;使用Classification中的生成模型generative model以及logistic regression解决二分类问题。 根据已有数据&#xff0c;判断该人年收入是否大于5万美元&#xff0c;最终得到预…

leetcode 23[python3]几种方法的思考与总结

题目 给你一个链表数组&#xff0c;每个链表都已经按升序排列。 请你将所有链表合并到一个升序链表中&#xff0c;返回合并后的链表。 示例 输入&#xff1a; lists [[1,4,5],[1,3,4],[2,6]]输出&#xff1a;[1,1,2,3,4,4,5,6]解释&#xff1a;链表数组如下&#xff1a;[ 1…

⚡️【linux】linux编辑器-VIM的高频使用,快快收藏起来!

⚡️目录 1️⃣VIM最小集 2️⃣VIM指令集 3️⃣VIM的配置 &#x1f332;前言&#xff1a;VIM和VI的区别简单点来讲&#xff0c;他们都是多模式编辑器&#xff0c;不同的是VIM是VI的升级版本&#xff0c;它不仅兼容VI的所有指令&#xff0c;而且还有一些新的特征在里面。例如语…

录屏软件哪个好?试试这6款录屏软件,小编亲测(2023已更新)

对于很多小伙伴来说&#xff0c;电脑录屏是经常需要使用的技能。面对网络上眼花缭乱的录屏软件&#xff0c;究竟哪个录屏软件好用呢&#xff1f;录屏软件哪个好&#xff1f;今天&#xff0c;小编分享亲自测试的这6款录屏软件给你&#xff0c;一起来看看吧。 录屏软件1&#xff…

DevSecOps“内置安全保护”,让软件研发“天生健康”

前言 随着DevOps的发展&#xff0c;DevOps大幅提升了企业应用迭代的速度。但同时&#xff0c;安全如果不能跟上步伐&#xff0c;不仅会抵消DevOps变革带来的提升&#xff0c;拖慢企业数字化转型进程&#xff0c;还会导致漏洞与风险不约而至。所以安全能力在全球范围内受到的重…

4款宝藏国产软件,装了就舍不得卸载,白嫖必备

提到国产软件&#xff0c;许多人想到“流氓、捆绑、广告多”&#xff0c;事实上国产良心软件非常多&#xff0c;如下面几款&#xff0c;每一个都功能强大&#xff0c;最重要还免费使用。 1、原本&#xff08;图片处理神器&#xff09; 日常生活与工作中&#xff0c;经常需要拍摄…

C++单例模式 : 懒汉模式 与 饿汉模式

单例模式&#xff1a; 只能有一个实例&#xff0c;有懒汉和饿汉区分&#xff0c;实现核心思想&#xff1a; 1.构造函数私有化 2.使用静态函数作为接口来获取类对象 1、懒汉模式&#xff1a; 由调用者实例&#xff0c;多线程情况下会存在线程安全问题&#xff0c;需要加互斥锁进…

寒冬已过,2023抓住IT复苏新机会

随着疫情防控进入新的阶段&#xff0c;2023年经济将逐渐回暖&#xff0c;许多行业也将迎来IT需求复苏的新机会。本期&#xff0c;我们就以互联网&#xff0c;金融和房地产这3个支柱行业近期的实际案例&#xff0c;来说明在在线文档领域的新机会。案例1:某互联网集团A公司&#…

数据结构---二叉树路径问题

二叉树路径问题二叉树所有路径分析JAVA实现力扣提交找到一个和为sum的到达叶子节点的路径分析JAVA实现力扣提交求路径&#xff08;中间一段&#xff09;C实现打印根节点到任意节点的路径JAVA实现二叉树所有路径 257二叉树所有路径 分析 前序遍历二叉树递归实现回溯 深度优先搜…

容器化——Centos下部署最后一版支持Docker的k8s集群

部署版本 首先要确定部署的版本 查询Kubernetes对Docker支持的情况 kubernetes/dependencies.yaml at master kubernetes/kubernetes (github.com) 查询Kubernetes Dashboard对Kubernetes支持的情况 Releases kubernetes/dashboard (github.com) 名称版本kubernetes1.23Doc…

如何对CentOS7配置静态IP

CentOS配置静态IP一、检测配置成功的方法1.虚拟机能访问互联网2.虚拟机和物理机可以相互ping通二、配置步骤1.查看物理机IP2.配置虚拟机网络模式3.设置NAT模式网段4.编辑修改配置文件5.测试三、报错解决方案1.网络重启失败2.ping不通一、检测配置成功的方法 1.虚拟机能访问互联…