为什么要把测试环境的告警当成生产环境的告警处理?是一个哲学问题,还是一个技术问题?...

news2024/11/30 8:48:06

65b0acf5150555890dd2d598a7b591ad.jpeg

开发不愿意了

一个后端服务通常有三个环境:测试环境,预发布环境,生产环境。

运维在给测试环境增加告警规则和告警路由时,开发人员反对。

这很容易理解,如果真把告警规则配置到测试环境,他们可能无时不刻地收到告警通知。

为什么会这样?因为:

  1. 很多开发将测试环境当开发环境,他们没有本地开发环境。测试环境不稳定,告警通知会非常的多;

  2. 开发人员的心理:测试环境挂了也无法所谓。

运维要强上

我觉得是要给测试环境加上的,理由如下:

  1. 这样可以让开发人员重视测试环境的可用性;

  2. 这样可以强迫开发人员在测试环境就考虑在生产环境可能出现的异常情况;

  3. 这样可以让开发人员不把测试环境当成开发环境。间接增加他们在本地写单元测试的动力(奢求)。

大前提

当然,以上理由也有一个前提,就是告警要实现服务级别的告警模式。

什么是服务级别的告警模式?假如存在一个平台alpha,它由svc-1,svc-2...svc-n组成。

  • 笼统的告警通知模式:整个alpha平台只有一个On-Call值班表,只要是告警,就通知当前的On-Call,不论是基础设施问题的告警,还是业务逻辑问题的告警,一律通知这个On-Call,再由On-Call决定通知谁;

  • 服务级别的告警模式:我们需要做到svc-1有一个On-Call值班表,svc-2也有一个值班表...svc-n也有。如此,当一个svc出现告警时,就只会通知到svc的on-call。

不难想象,笼统的告警通知模式只要做到告警自动路由到不同的业务的负责人,就是服务级别的告警通知模式了。

笼统的告警通知模式应用到测试环境,我们每天都需要有一个On-Call进行人工对告警进行分配的,这对于整个团队的效能是一种浪费。

所以,在没有实现服务级别的告警模式前,不建议在测试环境增加告警规则。

不存在没有缺点的解决方案

当然,为测试环境加上告警也可能会变成缺点:通知量太多了,开发人员对告警通知麻木。

这个问题可以通过以下方式来规避:

  1. 测试环境的告警通知要配置和生产环境一样的告警通知升级机制;即,如果开发长时间不处理告警,就将告警通知给他的上级;

  2. 测试环境只在工作时间进行告警通知。比如下班时间,告警触发规则虽然生效,但是告警通知只被记录下来,不发出通知。

问题

当告警通知可以被记录下来后,应该会有人想到加一个“告警通知处理速度”的KPI。我目前还没想通,加这个KPI的好处和坏处。就把这个问题留给各位读者了。

往期好文:

  • 小基础设施团队的分工思路

  • 另类的思路CMDB建设思路

  • SRE认知升级之可用性的本质

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/84868.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Web GIS开发教程

Web GIS开发教程 非程序员的基本 Web GIS 开发 课程英文名:Web GIS development course 此视频教程共4.0小时,中英双语字幕,画质清晰无水印,源码附件全 下载地址 课程编号:355 百度网盘地址:https://p…

杭州联合银行 x 袋鼠云:打造智能标签体系,助力银行大零售业务转型

“智能标签平台上线后,支行及业务部门已创建多个客群用于营销,为我行客户精细化管理打下了良好基础。” 2021 年,联合银行就已搭建了大数据基础平台,围绕平台搭建了数据研发平台、大数据调度平台及大数据服务平台,提高…

(附源码)Python飞机票销售系统 毕业设计 141432

摘 要 21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐渐被人们所认识,科学化的管理,使信息存…

Vue组件的嵌套关系,父组件传递子组件 ,事件总线,Provide,inject,作用域插槽,具名插槽非props的attribute ,子组件传递父组件

组件化 – 组件间通信 认识组件的嵌套 ◼ 前面我们是将所有的逻辑放到一个App.vue中:  在之前的案例中,我们只是创建了一个组件App;  如果我们一个应用程序将所有的逻辑都放在一个组件中,那么这个组件就会变成非常的臃 肿和难以维护;  所以组件化的核心思想应该是对…

【YOLOv5】记录YOLOv5的学习过程

以下记录的是Ubuntu20.04版本,其他Ubuntu版本也相差不大~ 一、安装pytorch GPU版本、显卡驱动、CUDA、cuDNN 下载pytorch GPU版本: 最新版本链接:Start Locally | PyTorch 历史版本链接:Previous PyTorch Versions | PyTorch…

MySQL——内置函数

文章目录内置函数日期函数字符串函数数学函数其他函数内置函数 日期函数 基本使用: 可以进行运算: 在日期基础上加时间 在日期基础上减时间 计算两个日期相差的天数 案例1: 建一张表,记录生日 案例2: 创建一…

设计有趣的轻巧真无线,体积小续航长,南卡小音舱上手

大家平时都会听听音乐、玩玩游戏,这时候就需要用到蓝牙耳机,特别是在户外接打电话时,戴上一副耳机都会方便很多。最近发现了一款南卡小音舱Lite2,这些天用过之后感觉它质量不错,做得十分小巧,日常携带特别方…

Postman带sessionId的post请求访问失败

Postman带sessionId的post请求访问失败1、Python 调用过程2、Postman 错误示例3、Postman 正确示例4、总结使用 Python 访问一个数据接口,调用是正常的,但是使用 Postman 进行访问时出错了,搞了两天,后面发现很简单,故…

如何理解FFT中时间窗与RBW的关系

作为一种常用的频谱分析工具,快速傅里叶变换(FFT) 实现了时域到频域的转换,是数字信号分析中最常用的基本功能之一。FFT 频谱分析是否与传统的扫频式频谱仪类似,也具有分辨率带宽(RBW) 的概念?如果具有RBW ,那么FFT 的…

前端食堂技术周刊第 63 期:Vite 4.0、State of CSS 2022、Rome v11、Web 性能日历、VueConf 2022 PPT

美味值:🌟🌟🌟🌟🌟 口味:霜糖山楂 食堂技术周刊仓库地址:https://github.com/Geekhyt/weekly 本期摘要 Vite 4.0State of CSS 2022 调查结果Rome v11HTMHell Advent Calendar 20…

虚幻引擎VR游戏开发基础教程

虚幻引擎VR游戏开发基础教程 了解如何使用 Oculus Quest 2 的蓝图在虚幻引擎 4 中从头开始构建基本的 VR 机制 课程英文名:Unreal Engine VR Development Fundamentals 此视频教程共4.0小时,中英双语字幕,画质清晰无水印,源码附…

推荐一些Python练手项目,了解完毕后才吃惊

前言 入门篇: 0.Python初学者一般都是那些根本没有编程基础的学生。做这个项目,你应该首先开始基本语法。教程中的几个实验可以让完全零基础的学生在一个下午学习Linux、python基础知识和GitHub命令。 1.Python-Python 图片转字符画50 行 Python 代码…

web前端期末大作业网页设计与制作 ——汉口我的家乡旅游景点 5页HTML+CSS+JavaScript

家乡旅游景点网页作业制作 网页代码运用了DIV盒子的使用方法,如盒子的嵌套、浮动、margin、border、background等属性的使用,外部大盒子设定居中,内部左中右布局,下方横向浮动排列,大学学习的前端知识点和布局方式都有…

JDBC 入门

目录1 JDBC 快速入门1.1 JDBC 的概念1.2 JDBC 快速入门2 JDBC 功能类详解2.1 DriverManager2.2 Connection2.3 Statement2.4 ResultSet3 JDBC 工具类4 SQL 注入攻击5 JDBC 事务5.1 JDBC 管理事务6 连接池6.1 数据库连接池的概念6.2 自定义数据库连接池6.2.1 DataSource6.2.2 归…

嵌入式:ARM存储器组织、协处理器及片上总线

文章目录ARM存储器组织ARM存储数据类型和存储格式ARM的存储器层次简介存储器管理单元MMUARM协处理器ARM片上总线AMBAARM存储器组织 ARM存储数据类型和存储格式 ARM处理器支持以下6种数据类型 8位有符号和无符号字节。16位有符号和无符号半字,它们以两字节的边界定…

字符串匹配问题(KMP)

文章目录题目KMP 算法1)例子演示2)KMP算法思路3)疑惑模型验证4)求 next 数组5)代码演示6)复杂度分析题目 有字符串 str1 和 str2 ,str1 中是否包含 str2,如果没有包含返回 -1&#…

电商行业用天翎低代码平台做客服管理系统

编者按:在市场竞争越来越激烈的今天,客服作为电商行业的重要组成部分,如何科学管理成为企业管理层不可避免的难题,做好客服管理对企业具有重要意义。本文通过唯品会金牌客服管理系统案例介绍了低代码平台在定制化和快速落地的特点…

python tkinter 登录 计算器

使用tkinter开发图形化小项目: 功能: 登录 :登录成功 跳转到 计算器 页面,否则登录失败计算器 :登录成功后,窗口标题栏显示当前登录的用户 技术: 面向对象标准模块SQLite数据库登录成功后页…

SpringCloud MQ介绍与使用

哈喽~大家好,这篇来看看SpringCloud MQ介绍与使用。 🥇个人主页:个人主页​​​​​ 🥈 系列专栏:【微服务】 🥉与这篇相关的文章: SpringCloud Sentinel 使用…

基于Python+Django的银行取号排队系统 毕业设计

随着信息技术和网络技术的飞速发展,人类已进入全新信息化时代,传统管理技术已无法高效,便捷地管理信息。为了迎合时代需求,优化管理效率,各种各样的管理系统应运而生,各行各业相继进入信息管理时代&#xf…