如何高效处理IT中的突发事件?

news2024/10/5 12:57:39

在当今快节奏的商业环境中,IT中的重大事件可能会意外发生,从而影响生产力和客户满意度。无论哪个行业,制定恢复计划并建立ITSM事件管理对于在危机时期确保业务连续性至关重要。

让我们来看一下某航空公司的运营,航空公司的运营很复杂,效率是通过许多人的共同努力来实现的。IT系统对于航空公司的时刻表合规性至关重要,因此,IT崩溃会扰乱许多用户。例如,某航空公司最近经历了 IT 中断,给数千名乘客带来了不便。让我们来看看该航空公司IT中断的原因和事件。

ITSM事件管理

中断原因
航空公司运营因 IT 中断而受到阻碍,该航空公司的网站现在显示 502:网关错误,导致预订、办理登机手续、取消和其他操作出现问题。根本原因的IT中断归因于供应商提供的防火墙故障。

为了应对新的漏洞和威胁,供应商的防火墙团队会定期向 Web 应用程序防火墙 (WAF) 的现有托管规则发布新规则,然后在全球范围内推送更新。在这样的更新中,防火墙团队的一位工程师进行了一个小的修改,无意中将专用于在整个网络中提供 HTTP 和 HTTPS 流量的 CPU 的使用率提高到接近 100%。这导致了 该航空公司的网站和关键系统将在几个小时内无法访问。

导致中断的事件

在维护时段内,应用了更新的 WAF规则,系统似乎正常运行。规则更新几个小时后,用户开始报告访问该航空公司网站的问题。这时 IT 团队开始调查原因,13 分钟后,它被宣布为重大事件,并通知了利益相关者。同时,有大量电话报告问题。

事件发生 33 分钟后,来自多个团队的成员聚集在一起,组成了一个事件响应小组。该团队调查了网络攻击假设。他们花了 53 分钟才排除网络攻击的可能性,但根本原因仍未确定。

经过进一步调查,该团队确定 IT 中断的原因可能归因于 WAF 托管规则更新,他们开始回滚托管规则更新以还原服务。正常操作 在航空公司的 Web 应用程序中断 78 分钟后恢复。

尽管使用了多个应用程序和监控工具,但 某航空公司 还是出现了一些失误,无法有效地处理重大中断。这一事件凸显了对重大事件进行强有力的管理的必要性 流程和有效的通信协议,以减轻未来中断的影响。

在ServiceDesk Plus中构建请求生命周期以处理IT重大事件

ServiceDesk Plus 可以帮助 某航空公司 遵循最佳实践框架,以确保公司有效地扑灭重大事件。

为了实时实现此框架,ServiceDesk Plus使用请求生命周期(RLC)功能。RLC 允许您使用简单的拖放画布直观地设计工单的整个生命周期。它进一步将工单的生命周期分解为各种状态和转换。ServiceDesk中的每张票 Plus 会经历各种状态,例如“打开”、“暂停”、“已解决”和“已关闭”。使用 RLC,您可以设计状态的顺序以及每次状态更改所需的条件和操作(转换) 只需将状态拖放到画布上即可。

转换是将工单从一种状态移动到另一种状态所需的操作。在每种状态下,转换都会引导技术人员通过条件操作进入下一个状态。技术人员只能更改状态 通过事件单的“详细信息”页面上提供的转换。有三个转换阶段:BEFORE、DURING 和 AFTER,它们允许您设置多个选项来根据 满足指定条件。此 RLC 可以与一个或多个事件模板相关联。

让我们来看看 RLC 功能如何帮助航空公司处理重大事件

1.在维护时段内,将应用 WAF 规则更新。ServiceDesk Plus与多个ITOM产品集成,包括ManageEngine OpManager,用于监控网络和服务。当OpManager识别出一个 服务中的异常情况,警报会自动记录为ServiceDesk Plus中的事件单,其中包含所有相关详细信息,例如中断的日期和时间,受影响的系统或应用程序以及错误 收到的消息。
2.此工单通过简单的无代码、基于规则的自动化自动使用重大事件模板。使用重大事件模板记录工单后,与该模板关联的重大事件 RLC 立即被激活,并开始指导该过程。
3.在接下来的三分钟内,某航空公司 的服务台代表将评估事件影响,以避免任何误报,并通过单击“报告”过渡将事件工单标记为重大事件 事件工单的“详细信息”页面上的操作;这将更新工单状态,并自动将工单分配给事件响应团队 (IRT)。然后,向所有利益相关者发送即时通知。这些 操作是使用 RLC 中的三个过渡阶段配置的,如下所述。

行动前:
某航空公司 将“报告”转换按钮的访问限制为具有特定角色的服务台代表,必须为其显示转换按钮,并添加了确定此转换按钮是否的条件 应显示在事件详细信息页面上。如果请求类型为事件,则“报告转换”按钮将仅针对具有 IT 或 IRT 技术角色的技术人员显示在事件详细信息页面上。

操作期间:
在执行报告转换时,“是否为重大事件?字段是必需的,服务台代表将事件标记为重大事件或不标记为重大事件。如果它被标记为重大事件,则组 事件详细信息页面上的字段更新为 IRT,这会将工单传输到 IRT 的存储桶。

行动后:
执行报告转换后,会自动向 IRT 发送自定义通知,通知他们发生重大事件。除了通知、Webhook、任务和自定义函数 也可以根据条件触发。执行此转换时,事件工单的“状态”将移至 WIP。
1、下一步,将进行分类过程。在 Collaborate IRT 转换中,某航空公司 配置了一个通知,并在 AFTER 转换操作中添加了一个自定义函数,该函数允许 ServiceDesk 此外,还可以与 Microsoft Teams 集成以创建虚拟作战室链接。单击事件详细信息页面上的此转换将触发自定义通知,其中包含要发送到 分布式 IRT,促进在混合工作模式下工作的团队之间的协作。然后,工单的“状态”将自动更新为“会审”。
2、在进行分类时,使用ServiceDesk Plus中的公告功能通知客户中断,以防止他们用新工单淹没服务台。
现在,根本原因分析(RCA)开始了。在 RCA 分析转换中,将已分配给特定技术人员组或技术人员的任务添加到 AFTER 操作中,以分析根本原因。
3、在五分钟内,IRT 将根本原因确定为 WAF 规则更新,并通知相应的利益干系人。同样,某航空公司 配置了三个转换操作,以达到重大事件生命周期中的各种状态循环根据其要求。
找到根本原因后,事件工单将委派给相关团队,以回滚 WAF 规则更新。某航空公司 的一名技术人员在 WAF 规则更新上实施了回滚,并在 28分钟。整个团队能够确定根本原因,并在任何重大中断之前解决它。
4、问题解决后,将通知利益干系人,并在知识库中更新解决方案,以便将来为技术人员提供帮助。

因此,ITSM事件管理框架内的RLC提供了一种结构化的方法来解决IT事件,保护企业免受任何中断的潜在灾难性后果的影响。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1185564.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Alphago Zero的原理及实现:Mastering the game of Go without human knowledge

近年来强化学习算法广泛应用于游戏对抗上,通用的强化学习模型一般包含了Actor模型和Critic模型,其中Actor模型根据状态生成下一步动作,而Critic模型估计状态的价值,这两个模型通过相互迭代训练(该过程称为Generalized …

YOLOv8-Seg推理详解及部署实现

目录 前言一、YOLOv8-Seg推理(Python)1. YOLOv8-Seg预测2. YOLOv8-Seg预处理3. YOLOv8-Seg后处理4. YOLOv8-Seg推理 二、YOLOv8-Seg推理(C)1. ONNX导出2. YOLOv8-Seg预处理3. YOLOv8-Seg后处理4. YOLOv8推理 三、YOLOv8-Seg部署1. 源码下载2. 环境配置2.1 配置CMakeLists.txt2.…

JavaScript 作用域链(Scope Chain)是什么?有什么作用?

结论先行: 当在函数内部访问一个变量的时候,(JS 引擎)程序会先在当前作用域中查找(是否存在该变量),如果找到了就直接使用。否则就会向上层作用域逐级查找,直到找到全局作用域为止。…

高等数学教材重难点题型总结(一)函数与极限

强化阶段的另一个专题,本专题主要总结高数课本上的经典例题与课后题,尤其一部分加*标的题目,对于冲击高分的同学来说,必须熟练掌握。 (蓝色代表难点,红色代表重点,紫色代表重难点) …

Origin2023绘制双轴

在水文气象研究中,经常是把降水右轴并在顶部。具体操作如下: 1.先绘制径流曲线图 2.再添加一个图层,insert→new layer→Top-X-Right-Y 3.图层设置,添加降水序列,样式为柱状图 4.设置右轴的标注为600到0(保证倒立)&am…

没有接口文档如何进行接口测试(超详细~)

前言 在进行接口测试之前,一般开发会提供接口文档,给出一些接口参数和必要熟悉,便于我们编写接口脚本。但如果没有提供接口开发文档的请求下,我们该如何编写接口测试脚本呢?在编写测试脚本前要做哪些必要的准备呢&…

网络原理---拿捏网络层:IP协议

文章目录 IP协议4位版本4位首部长度、选项8位服务类型(TOS)16位总长度16位标识、3位标志、13位片偏移8位生存时间(TTL)8位协议16位首部校验和32位源IP地址、32位目的IP地址解决IP地址不够用的问题动态分配IP地址NAT机制&#xff0…

好消息,微信消费者投诉工具升级,可以直接回复用户、处理投诉了。。。

大家好,我是小悟 兄弟们,阅读本文之前,建议先阅读【连夜干出来一个自动处理【微信消费者投诉管理系统】,支持多商户】。 为了使工具更好用,也为帮助商户更好地处理消费者投诉,提升用户满意度,…

谷歌提出 AGI 完整路线图:目前 ChatGPT 只处于 AGI 的第一阶段

本心、输入输出、结果 文章目录 谷歌提出 AGI 完整路线图:目前 ChatGPT 只处于 AGI 的第一阶段前言谷歌 DeepMind 发布 AGI 分级框架发展 AGI 必须遵循6个基本原则什么是AGI图灵测试详解六大原则AGI 的五大发展过程阶段原文参考弘扬爱国精神谷歌提出 AGI 完整路线图:目前 Cha…

Fabric区块链浏览器搭建

目录 一、创建区块链浏览器相关目录二、配置docker-compose三、配置区块链浏览器四、启动区块链浏览器 书接这一回 Fabric二进制建链,在建好链之后,将为这条链部署一个区块链浏览器。 Hyperledger Fabric区块链浏览器地址:https://github.co…

计网----数据库(一)

计网----数据库(一) 一.什么是数据库 数据库是”按照数据结构来组织、存储和管理数据的仓库“。是一个长期储存在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。 二.数据库的特点 1.规范化的本地存储 2.加密 3.共享 三.数据库的好处…

[动态规划] (十四) 简单多状态 LeetCode LCR 091.粉刷房子

[动态规划] (十四) 简单多状态 LeetCode LCR 091.粉刷房子 文章目录 [动态规划] (十四) 简单多状态 LeetCode LCR 091.粉刷房子题目解析解题思路状态表示状态转移方程初始化和填表顺序返回值 代码实现总结 LCR 091. 粉刷房子 题目解析 (1) 一排房子,共有n个 (2) 染…

【电路笔记】-基尔霍夫电路定律

基尔霍夫电路定律 文章目录 基尔霍夫电路定律1、框架和定义2、基尔霍夫电流定律3、基尔霍夫电压定律4、基尔霍夫定律应用5、基尔霍夫定律的局限性6、总结 在本文中,将介绍最基本、最重要的电路定律之一。 这些法律由德国医生古斯塔夫基尔霍夫 (Gustav Kirchoff) 于 …

java数据结构--双端队列

一.概念 双端队列的意思是可以在头部和尾部添加和删除元素&#xff0c;更一般的单向链表队列比起来更加的灵活&#xff0c;下面我们用双向循环带哨兵链表和数组来分别实现 二.定义接口Dequeue /*** 双端队列*/ public interface Dequeue<E> {//队头添加元素boolean off…

MSSQL 配置ORACLE ​链接服务器

在有些场景&#xff0c;我们需要整合其他异构数据库的数据。我们可以使用代码去读取&#xff0c;经过处理后&#xff0c;再将数据保存到MSSQL数据库中。如果数据量比较大&#xff0c;但处理的逻辑并不复杂的情况下&#xff0c;这种方式就不是最好的办法。这时可以使用使用链接服…

C++笔记之表驱动法-全局静态结构体变量的应用实例ColorMAP

C笔记之表驱动法-全局静态结构体变量的应用实例ColorMAP code review! 代码 #include <ros/ros.h> #include <visualization_msgs/Marker.h>struct RGBA{RGBA(){red.r 1; green.r 0; blue.r 0;red.g 0; green.g 1; blue.g 0;red.b 0; green.b 0; blue.b…

Netty入门指南之NIO Buffer详解

作者简介&#xff1a;☕️大家好&#xff0c;我是Aomsir&#xff0c;一个爱折腾的开发者&#xff01; 个人主页&#xff1a;Aomsir_Spring5应用专栏,Netty应用专栏,RPC应用专栏-CSDN博客 当前专栏&#xff1a;Netty应用专栏_Aomsir的博客-CSDN博客 文章目录 参考文献前言ByteBu…

终究还是翻车了,人肉运维100 次后

翻车现场 5年前的一个晚上&#xff0c;我接到数据组同事的消息&#xff0c;要求将A用户的磁盘快照共享给B用户。我对这个线上运维工作早已轻车熟路&#xff0c;登录线上服务器仅用了2分钟就完成了。 我继续忙着其他事情&#xff0c;3分钟后&#xff0c;我正要打开新的控制台页…

【多线程】synchronized的特性

文章目录 synchronized 的特性互斥可重入synchronized的使用加锁过程 synchronized 的特性 互斥 synchronized 会起到互斥效果&#xff0c;某个线程执行到某个对象的 synchronized 中时&#xff0c;其他线程如果也执行到同一个对象 synchronized 就会阻塞等待。进入 synchron…

【源码篇】基于SSM+JSP实现的网上花店系统

系统介绍 基于SSMJSP实现的网上花店系统采用了时下流行的 Java 程序设计语言进行开发&#xff0c;系统开发的工具采用 Idea 开发工具&#xff0c;普通用户可以在该系统完成注册、登录、购买等一系列操作&#xff0c;致力于为用户提供一个方便快捷的在线购花平台。 前台系统功…