2.1信息系统运维的管理
信息系统运维管理体系框架
信息系统运维管理主要流程的目标
- 标准化:通过流程框架,构件标准的运维流程
- 流程化:将大部分运维工作流程化,确保工作可重复,并且这些工作都有质量的完成,提升运维工作效率
- 自动化:基于流程化的框架,将事件与IT流程相关联,一旦被监控的系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制;此外,还可以通过自动化手段有效完成日常工作。
考法1:概念
在信息系统运维管理体系框架中,信息系统运维管理对象的内容包括(D)。
A.信息系统变更管理 B.信息系统问题管理
C.信息系统运维管理规范 D.信息系统供应商
信息系统运维管理体系框架不包含(D)
A.运维管理主体、运维管理对象
B.运维管理流程、运维管理制度
C.运维管理系统、运维管理工具
D.运维管理咨询、运维管理集成
信息系统运维管理流程
信息系统运维管理流程(事件管理)
事件管理
负责记录、快速处理信息系统运维管理中的突发事件,并对事件进行分类分级,详细记录事件处理的全过程,便于跟踪了解事件的整个处理过程,并对事件处理结果统计分析
事件是指引起或有可能引起服务中断或服务质量下降的不符合标准操作的活动。
-
事件发生和通告
- 轮询、通知
-
事件检测和录入
-
事件过滤
-
事件分类
- 信息类:存入日志文件中
- 告警类:提交给事件关联做进一步分析,以决定如何处理
- 异常类:需判定是否需要提交给事故、问题或变更管理中的一个或者多个管理流程来处理
- 事件关联
- 响应选择
- 事件关闭
- 信息类事件通常不存在关闭状态,他们会被记录到日志中并作为其他流程的输入,直到日志记录被删除;
- 自动响应的告警类事件通常会被设备或应用程序所自动触发的另一事件关闭
- 人为干预的告警类事件通常在合适的人员或团队处理完毕评估后关闭
- 异常类事件通常在成功启动事故、问题或变更流程后评估关闭
- 事件评估
信息系统运维管理流程(事故管理)
事故管理
包括对引起服务中断或可能导致服务中断、质量下降的事件的管理。
CMDB:配置管理数据库
KEDB:已知错误数据库
- 事故识别和记录
- 事故基本描述、事故状态、事故类型、事故影响度、事故优先级等
- 事故分类和优先级处理
- 紧急度、影响度
- 初步支持
- 事故升级
- 职能升级(水平升级)
- 结构升级(垂直升级)
- 调查和诊断
- 解决和恢复
信息系统运维管理流程(问题管理)
问题管理包括诊断事故根本原因和确定问题解决方案所需要的活动,通过相应控制过程,确保解决方案的实施。
- 问题检测和记录
- 问题记录的内容包含问题描述、问题状态、问题类型、服务信息和设备信息等
- 问题分类和优先级处理
- 问题调查和诊断
- 问题分析和诊断的方法包括时序分析法、KT决策发、头脑风暴法、石川图法、帕累托分析法等
- 创建已知错误记录
- 解决问题
- 关闭问题
- 重大问题评估
信息系统运维管理流程(配置管理)
配置管理包括负责识别、维护服务、系统或产品中的所有组件,以及各组件之间关系的信息,并对其发布和变更进行控制,建立关于服务、资产及基础设施的配置模型。
- 管理规划
- 配置识别
- 配置控制
- 状态记录和报告
- 确认和审核
信息系统运维流程(变更管理)
变更管理负责管理服务生命周期过程中对配置项的变更
- 创建变更请求
- 变更请求(RFC)由变更发起人负责创建并提交给变更管理者
- 记录和过滤变更请求
- 评审变更
- 授权变更
- 变更规划
- 协调变更实施
- 回顾和关闭变更
变更类型 | 审批情况 |
---|---|
标准变更 | 通常有预定的执行流程。不需要得到CAB和变更管理者的授权,而直接转交“请求实现”处理 |
次要变更 | 无须提交CAB直接由变更管理者批准实施 |
实质性变更 | 变更管理者根据变更风险、紧急度和影响度来决定是否事先征求CAB成员的意见或召开CAB会议 |
重大变更 | 必须事先得到IT执行委员会的评审,再交由CAB讨论具体实施方案 |
信息系统运维流程(发布流程)
发布管理负责规划、设计、构建、配置和测试硬件及软件,从而为运行环境创建发布组件的集合。发布管理的目标是交付、分发并追溯发布中的一个或多个变更。
- 发布规划
- 发布设计、构建和配置
- 发布验收
- 设运营规划
- 沟通、准备和培训
- 发布分发和安装
信息系统运维管理流程(知识管理)
知识管理贯穿于整个服务管理生命周期。
- 知识识别和分类
- 初始化知识库
- 知识提交和入库
- 知识过滤和审核
- 知识发布和分享
- 知识维护和评估
考法1:概念
- 通常不需要变更咨询委员会(CAB)评审的变更是(A)
A.标准变更 B.重大变更 C.次要变更 D.关键业务的变更
- 在运维过程中,为了诊断引起服务中断的根本原因和确定解决方案所需的活动成为(B)
A.事件管理 B.问题管理 C.配置管理 D.知识管理
- 在运维管理流程中,(A)贯穿于整个服务管理生命周期。
A.知识管理 B.事故管理 C.发布管理 D.设备管理
考法2:结合实际使用场景
- 某政府网站突然出现无法访问的现象,负责维护的工程师小王决定逐一排查相应设备,找到故障原因,以防止再次发生。而同事小李却建议尽快恢复业务可用,包括重启相关服务器等应急措施。针对此情况,描述正确的是(C)。
A.小王的安排合理,属于问题管理范畴
B.小王的安排合理,属于事故管理范畴
C.小李的安排合理,属于事故管理范畴
D.小李的安排合理,属于问题管理范畴
信息系统运维管理制度
- 网络管理制度
- 系统和应用管理制度
- 安全管理制度
- 存储备份管理制度
- 故障管理制度
- 技术支持工具管理制度
- 人员管理制度
- 质量考核制度