nightingale-0-介绍单机二进制部署

news2025/1/16 5:40:24

(一) 夜莺介绍

Nightingale | 夜莺监控,一款先进的开源云原生监控分析系统,采用 All-In-One 的设计,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,提供开箱即用的企业级监控分析和告警能力。于 2022 年 5 月 11 日,捐赠予中国计算机学会开源发展委员会(CCF ODC),为 CCF ODC 成立后接受捐赠的首个开源项目。
官网链接:快猫星云Flashcat | 云原生监控 | 混合云监控 | 稳定性保障体系
Flashcat平台可以解决的痛点问题:
1、统计监控难:构建统一的观测平台
- 物理机、微服务、云原生架构
- 公有云、私有云、多云
- Metrics、Logging、Tracing
2、故障定位慢:构建实时的故障定位系统
- 总是后于用户反馈发现故障
- 难以快速确认故障影响面
- 难以快速找到故障的直接原因
- 故障处理进度不透明

Categraf:
快猫采集器 Categraf 是一款 MIT 协议的开源软件,支持近百个插件,指标、日志、链路数据均可对接采集,All-in-one,开箱即用。

  • 作为Agent运行采集机器性能指标
  • 中心式探针,作为网络探针,采集各类中间件数据库的指标
  • Sidecar模式采集业务指标

(二) 夜莺部署安装架构

现在夜莺的版本已经更新迭代到V6版本
Ninghtingale下载地址:Nightingale
Categraf下载地址:Categraf
Categraf官方github地址

2.1、部署架构图

比较常用的中心汇聚部署方案
在这里插入图片描述
组件功能介绍

  • MySQL:存储告警信息,配置信息,告警规则,用户信息等;
  • Redis:存储一些验证信息,JWT的token,metadata元信息,元数据,心跳信息等;
  • TSDB:时序数据库(可以支持Prometheus、M3DB、VictoriaMetrics、Thanos等);
  • N9E:Nightingale | 夜莺监控,一款先进的开源云原生监控分析系统,采用 All-In-One 的设计,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,提供开箱即用的企业级监控分析和告警能力。于 2022 年 5 月 11 日,捐赠予中国计算机学会开源发展委员会(CCF ODC),为 CCF ODC 成立后接受捐赠的首个开源项目,Nightingale 可以接收各种采集器上报的监控数据,转存到时序库(可以支持Prometheus、M3DB、VictoriaMetrics、Thanos等),并提供告警规则、屏蔽规则、订阅规则的配置能力,提供监控数据的查看能力,提供告警自愈机制(告警触发之后自动回调某个webhook地址或者执行某个脚本),提供历史告警事件的存储管理、分组查看的能力,n9e可以做集群,多个n9e分担告警规则的处理和压力,n9e也分为无状态和有状态服务。
  • LB:负责多个n9e的负载均衡;使用7层代理;
  • categraf:是夜莺监控的默认的自制的数据采集器;

针对网络链路不好的边缘下沉式混杂部署方案
在这里插入图片描述

2.2、部署n9e+categraf+VictoriaMetrics+mysql+redis中心化二进制单机部署夜莺

1)下载部署N9E:

下载安装部署MySQL和Redis

# INSTALL MySQL 
yum -y install mariadb*
systemctl enable mariadb
systemctl start mariadb
mysql -e "SET PASSWORD FOR 'root'@'localhost' = PASSWORD('1234');"
# 权限有问题就执行下这个
mysql -uroot -p1234
grant all on *.* to 'root'@'%';
grant all on *.* to 'root'@'127.0.0.1';

# INSTALL Redis
yum -y install redis
systemctl enable redis
systemctl restart redis 

下载N9E部署包并导入sql

mkdir -p /opt/n9e && cd /opt/n9e
wget https://download.flashcat.cloud/n9e-v6.0.0-ga.4.1-linux-amd64.tar.gz
tar -zxf n9e-v6.0.0-ga.4.1-linux-amd64.tar.gz -C /opt/n9e
mysql -uroot -p1234 < n9e.sql
# 启动n9e,并且查看日志,检查启动是否正常,默认端口17000
nohup ./n9e &> n9e.log &
tailf n9e.log
netstat -antp |grep :17000

如果启动成功,n9e 默认会监听在 17000 端口。上面使用 nohup 简单演示,生产环境建议用 systemd 托管。
配置文件在当前目录 etc/config.toml 中含有 mysql 的连接地址配置,如果连接数据库报错,可以检查一下用户名和密码
夜莺服务端部署好之后,浏览器访问 17000 就可以体验相关功能了,默认用户是 root,密码是 root.2020

2)下载部署categraf:

mkdir /opt/categraf && cd /opt/categraf
wget https://download.flashcat.cloud/categraf-v0.2.39-linux-amd64.tar.gz
tar -zxf categraf-v0.2.39-linux-amd64.tar.gz -C /opt/categraf/
cp -a conf/categraf.service /usr/lib/systemd/system/
systemctl start categraf
journalctl -efu categraf
systemctl status categraf

解压完毕后会发现有一个可执行文件categraf和一个文件夹conf,conf文件下面有很多input的文件夹,里面都是每一个插件的配置文件(xxx.toml)config.toml是主配置文件,把systemd管理的启动文件直接拷贝过去启动

浏览器访问本机IP:17000端口
在这里插入图片描述

3)安装VictoriaMetrics,配置对接数据源

VictoriaMetrics官方文档
Github下载地址

VictoriaMetrics 架构简单,可靠性高,在性能,成本,可扩展性方面表现出色,社区活跃,且和 Prometheus 生态绑定紧密。如果单机版本的 Prometheus 无法在容量上满足贵司的需求,可以使用 VictoriaMetrics 作为时序数据库。

VictoriaMetrics 提供单机版和集群版[https://docs.victoriametrics.com/Cluster-VictoriaMetrics.html]。如果您的每秒写入数据点数小于100万(这个数量是个什么概念呢,如果只是做机器设备的监控,每个机器差不多采集200个指标,采集频率是10秒的话每台机器每秒采集20个指标左右,100万/20=5万台机器),VictoriaMetrics 官方默认推荐您使用单机版,单机版可以通过增加服务器的CPU核心数,增加内存,增加IOPS来获得线性的性能提升。且单机版易于配置和运维。

  • 它可以用作普罗米修斯的长期储存。
  • 它可以用作 Grafana 中 Prometheus 的直接替代品,因为它支持Prometheus 查询 API。
  • 它可以用作Grafana中Graphite的直接替代品,因为它支持Graphite API。与Graphite相比,VictoriaMetrics允许将基础设施成本降低10倍以上 - 请参阅此案例研究。
  • 易于设置和操作:
    • VictoriaMetrics由一个没有外部依赖关系的小可执行文件组成。
    • 所有配置都是通过具有合理默认值的显式命令行标志完成的。
    • 所有数据存储在命令行标志指向的单个目录中。-storageDataPath
    • 使用vmbackup/vmrestore工具可以轻松快速地从即时快照进行备份。
  • 它实现了类似 PromQL 的查询语言 - MetricsQL,它在 PromQL 之上提供了改进的功能。
  • 它提供全局查询视图。多个 Prometheus 实例或任何其他数据源可能会将数据摄取到 VictoriaMetrics 中。稍后可以通过单个查询查询此数据。
  • 它为数据引入和数据查询提供了高性能以及良好的垂直和水平可扩展性。它的性能比InfluxDB和TimescaleDB高出20倍。
  • 在处理数百万个独特的时间序列(又称高基数)时,它使用的 RAM 比 InfluxDB 少 10 倍,比普罗米修斯、灭霸或 Cortex 少 7 倍。

可以说VictoriaMetrics是企业版的普罗米修斯。

部署安装

mkdir /opt/vm && cd /opt/vm
wget https://github.com/VictoriaMetrics/VictoriaMetrics/releases/download/v1.90.0/victoria-metrics-linux-amd64-v1.90.0.tar.gz
tar -zxf victoria-metrics-linux-amd64-v1.90.0.tar.gz -C /opt/vm
## 我们这里因为是单机点所以用的victoriaMetrics是单机版,解压过后只有一个文件victoria-metrics-prod

#启动vm
nohup ./victoria-metrics-prod &> vm-prod.log &

他的默认端口是8428 启动后 可以使用命令ss -ntpl查看是否启动,启动成功后如果不指定存储目录他会在当前目录默认创建一个victoria-metrics-data的文件夹来存储数据 如果需要更改存储目录加参数-storageDataPath 即可

修改N9E的配置文件,配置VictoriaMetrics的地址来查看数据

vim /opt/n9e/etc/config.toml
...
[[Pushgw.Writers]] 
# Url = "http://127.0.0.1:8480/insert/0/prometheus/api/v1/write"
#Url = "http://127.0.0.1:9090/api/v1/write"  ##这里注释掉 这个是普罗米修斯的默认的remote-wirte协议的接口,因为我们安装的是vm所以这里注释掉
Url = "http://127.0.0.1:8428/api/v1/write" ##这里添加为VictoriaMetrics的地址8428的端口
# Basic auth username
BasicAuthUser = ""
# Basic auth password
BasicAuthPass = ""

重启N9E

pkill n9e
nohup ./n9e &> n9e.log &

进入n9e的web页面添加数据源
在这里插入图片描述
在这里插入图片描述
验证数据源是否配置成功
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
配置告警

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
玩一下钉钉告警在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

加一个测试的告警
在这里插入图片描述
告警来了
在这里插入图片描述
在这里插入图片描述

这里再补充一下n9e配置文件存储日志的字段,切片,类似于ELK里的E做切片存储


 vim /opt/n9e/etc/config.toml
.....
.....
.....     找到log字段
[Log]
# log write dir
Dir = "logs"     ##这里的意思是日志写到当前目录的logs目录下
# log level: DEBUG INFO WARNING ERROR
Level = "DEBUG"
# stdout, stderr, file
Output = "stdout"
# # rotate by time
# KeepHours: 4       ##这里的意思是我要保存4个小时的n9e日志         
# # rotate by size
# RotateNum = 3       ##这里是按大小来存储日志 存储3个文件,每个文件有256MB大小这么大来存储日志,对应下面的RotateSize字段来配置启动
# # unit: MB
# RotateSize = 256

引用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/435596.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

渗滤液除氨氮、矿井水除氨氮,氨氮吸附技术

垃圾渗滤液是生活垃圾的必然产物&#xff0c;顾名思义&#xff0c;垃圾渗滤液是指来源于垃圾填埋场中垃圾本身含有的水分、进入填埋场的雨雪水及其他水分&#xff0c;扣除垃圾、覆土层的饱和持水量&#xff0c;并经历垃圾层和覆土层而形成的一种高浓度的有机废水。垃圾在堆放和…

[golang gin框架] 24.Gin 商城项目-redis讲解以及操作

一.reids相关文章 Redis五种数据类型及其应用场景 REDIS中的缓存穿透&#xff0c;缓存击穿&#xff0c;缓存雪崩原因以及解决方案 redis实现用户签到&#xff0c;统计活跃用户&#xff0c;用户在线状态&#xff0c;用户留存率 [golang gin框架] 12.Gin 商城项目-base64Captcha生…

KDXJ-8 SF6气体泄漏报警在线检测系统

一、功能特点 1. 定量测量SF6&#xff08;六氟化硫&#xff09;气体浓度&#xff1b; 2. 定量测量O2&#xff08;氧气&#xff09;气体浓度&#xff1b; 3. 定量测量大气温湿度&#xff1b; 4. 可根据需要设置SF6和O2气体浓度的报警点&#xff1b; 5. 后台监控&#xff1b; 6.…

【通过加载plist文件显示分组数据 Objective-C语言】

一、展示汽车品牌数据 1.首先,我们还是先把控制器调成3.5英寸,再把模拟器调成iPhone4S, 2.然后呢,我们要先把素材拷进来, 我们要展示,要把一个plist文件中的数据展示到我们的这个UITableView里面,所以说,首先,是要把我们的plist文件拷进来, 找到我们这个plist文件…

爱智EdgerOS之深入解析在爱智应用中如何使用Socket.IO轻松实现双向通信

一、什么是 Socket.IO&#xff1f; Socket.IO 是一个基于事件通信的实时应用程序框架&#xff0c;它在即时通讯、通知和消息推送&#xff0c;实时分析等场景中有广泛的应用。Socket.IO 包括两个部分&#xff1a; 在 Server 端的模块&#xff08;JSRE 已提供了 socket.io 模块&…

Onnx 转Ncnn

Onnx 转Ncnn 算法工程师给了onnx,需要转成ncnn才能用到安卓上去&#xff0c;步骤如下 简化onnx 算法给了.onnx后缀的文件&#xff0c;100多兆&#xff0c;太大&#xff0c;第一步&#xff0c;先简化&#xff1a; conda env list 查看conda环境&#xff08;前提是之前已经配…

企业级实践:分布式系统中的可靠消息最终一致性方案

背景 公司由于业务爆发式增长&#xff0c;新上了许多业务系统&#xff0c;例如&#xff1a;本地生活、社区团购、旅投B2B、旅投B2C等系统&#xff1b;同时&#xff0c;由于业务系统越来越多&#xff0c;为了运营方便&#xff0c;把分销、营销、订单、会员等多个业务系统公共业…

Babel零基础教程

参考https://www.jiangruitao.com/babel/ 写的非常好&#xff0c;本人只是为了方便查找&#xff0c;记录在自己博客上&#xff0c;原文可以去该链接拜读 1、 Babel 简介 Babel是什么&#xff1f; Babel是一个工具集&#xff0c;主要用于将ES6版本的JavaScript代码转为ES5等向…

遗传算法的概念和python实现

遗传算法是一个非常经典的智能算法&#xff0c;主要用于解决优化问题。本文主要简单介绍一些原理&#xff0c;同时给出一个基于python实现的&#xff0c;用于解决实数内优化问题的模板。 本文参考&#xff1a; 原理&#xff1a;遗传算法入门详解 - 知乎 简单介绍 遗传算法就…

服务型企业如何使用飞项实现项目化管理?

服务型企业的业务模式一般都是按项目来运作的&#xff0c;其业务分为售前&#xff0c;售中和售后三个阶段&#xff0c;分别由不同部门和人员对客户进行个性化服务。在这个过程中需要对人、流程和知识的高效统筹管理&#xff0c;即项目的整体管理&#xff0c;因此存在着不小的挑…

Nvidia Jetson Orin: SPE/AON Cortex-R5 固件开发

Nvidia Jetson Orin: SPE/AON Cortex-R5 固件开发 写在最前边开发/下载 SPE 固件关于修改DTS 写在最前边 SPE 只能控制 AON GPIO 最多32个PIN 开发/下载 SPE 固件 S1&#xff1a;打开 https://developer.nvidia.com/embedded/jetson-linux S2&#xff1a;这里下载 S3&#x…

Linux环境使用日志切割工具-cronolog

Linux环境使用日志切割工具 需明白的点&#xff1a;1.安装 2.如何使用 一、安装cronolog 1.首先检查是否存在cronolog 命令&#xff1a;whereis cronolog 或 which cronolog 2.不存在则安装 安装方式&#xff1a; a.yum 安装&#xff1a;yum install cronolog b. 源码安装&am…

C/C++|物联网开发入门+项目实战|指针|嵌入式C语言高级|C语言内存空间的使用-数组-学习笔记(10)

参考&#xff1a;麦子学院-嵌入式C语言高级-内存空间 2-3 : C语言内存空间的使用-数组 内存分配的一种形式 数组的定义及初始化 定义一个空间: 1、大小 2、读取方式 数组名[]:升级为连续空间的名称&#xff0c; [m]的作用域只在申请的时候起作用 每个多大&#xff1f;数组…

太给力了,这款java表单设计器可提高办公协作效率!

随着办公自动化的快速发展&#xff0c;java表单设计器的应用价值和突出优势也逐渐成为企业提高办公效率的好帮手。传统的表单操作起来费时费力&#xff0c;效率不高&#xff0c;逐渐满足不了日益繁多的业务需求了&#xff0c;在广大用户的呼声和市场发展下&#xff0c;简洁、灵…

ESP32学习五-启动流程

一、简介 在ESP32的开发中&#xff0c;通常我们会从app_main函数中开始我们的代码开发。但是为什么是app_main呢&#xff1f;app_main又是从哪里被调用的&#xff1f;app_main之前又做了什么操作呢&#xff1f;今天我们就来详细分析一下。 官方参考文档&#xff1a;应用程序的启…

柔性作业车间生产调度中MK算例文本各行数字表示的含义以及算例的数据

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 MK算例其他MK02~MK10柔性作业车间数据 MK算例 Brandimarte给出了10组柔性作业车间的实例分别是MK01~Mk10&#xff0c;下方即为MK01的实例数据 10 6 26 2 1…

Kubernetes Operator开发

Kubernetes Operator开发 1.kubebuilder 创建项目 2.Crontroller开发与部署 开发环境准备 kubebuilder 介绍 CRD的开发与部署 Crontroller开发与部署 Operator功能设计 借助operator完成 和企业内部注册中心打通 这里以Traefiketcd的模式为例进行演示说明 在这里etcd provi…

现在学习云计算,还有出路吗?

现在学习云计算&#xff0c;还有出路吗&#xff1f; 当然有出路&#xff0c;现在正是学习云计算的好时机。只要你专业技术过关&#xff0c;有一定的项目经验&#xff0c;有的企业甚至接受应届生&#xff1b;其次是具备一定的职业素养&#xff0c;学历在大专及以上&#xff0c;年…

潇洒郎: git配置、拉取、提交代码

git配置拉取代码 git 配置全局变量 git config --global user.name "xuxiaosa" git config --global user.email "xuxiaosamigu.cn" 配置ssh key 1、打开git-bash 输入ssh-keygen 一直回车&#xff0c;会提示文件保存的地址 id_rsa,id_rsa.pub两个文…

谷粒商城二十二订单服务支付

我们支付暂时只开发支付宝&#xff0c; 按照正规的流程&#xff0c;我们的系统要接入支付宝&#xff0c;肯定是需要大量的审核过程&#xff0c;而且需要我们的项目上线。 那现在我们就想测试该怎么办&#xff1f;支付宝为我们提供了沙箱环境&#xff0c;我们可以在应用未上线之…