什么是IT事件经理?
IT事件经理有时也被称为事件指挥官,他们承担着管理组织事件响应的总体责任,从委派各种事件响应任务到与每个利益相关者进行沟通和协调。
示例:当一个全球性的电子商务平台在一次销售活动中流量激增,数以百万计的用户涌入网站时,不可预见的技术故障开始出现,导致大量网站运行缓慢的事件报告。
在这种情况下,IT事件经理的任务是分配、管理、沟通和升级事件响应。IT事件经理需要分析流量模式、服务器负载、错误日志和用户报告,以了解问题的根本原因。在清楚了解当前面临的挑战后,事件经理会动员来自网络基础设施、服务器管理、数据库管理和 IT 服务台等不同领域的专家,共同解决网站问题。
他们很快发现,性能下降的根本原因是网站数据库基础设施的瓶颈。为了减轻系统压力,最大限度地减少对正在进行的销售活动的干扰,IT事件经理与基础设施团队合作,实施临时措施,如负载平衡或缓存机制,以在短期内优化性能。在解决燃眉之急的同时,IT事件经理还进行全面分析,以确定长期解决方案,防止今后发生类似事件。
在整个事件响应过程中,IT事件经理与利益相关方(包括高级管理层和其他相关方)保持透明的沟通,定期提供最新的解决进展情况,并管理对销售活动影响的预期。
通过果断行动、协调响应工作和实施有效措施,IT事件经理在引导电子商务平台度过这一挑战性情景中发挥了关键作用,确保将对业务运营的干扰降至最低,并维护销售活动的完整性。
IT事件经理的职责范围广泛,包括:
1、领导和监督:IT事件经理对事件管理流程进行战略领导和细致监督。他们帮助 IT 服务台了解事件生命周期,与不同团队合作,并制定事件响应策略,以最大限度地减少中断造成的影响。
2、资源管理:事件经理分配资源,包括人员、工具和基础设施,以便及时处理事件并确保资源的有效利用。此外,他们还要监控事件响应团队的工作量,以确保事件管理过程中的顺利运作。
3、协调与沟通:事件经理与参与事件响应的各个团队进行协调,并将任务分配给特定的团队成员,包括技术支持团队、IT 运营团队和外部供应商。他们促进利益相关者之间的沟通,定期提供有关事件状态的最新信息,并管理对解决时限的预期。
4、决策和解决问题:在事件响应期间,IT事件经理促进决策过程,指导团队确定并实施有效的解决方案,以迅速解决事件。
5、根本原因分析:事件经理领导事件调查,以确定事件的根本原因和潜在问题。他们监督纠正和预防措施的实施,以解决根本原因并防止今后再次发生类似事件。
6、持续改进:事件经理通过开展事件后审查并应用所获得的见解来提高事件管理流程的有效性和效率,从而推动持续改进工作。他们分析事件趋势,确定需要改进的领域,并实施变革,以防止今后发生类似事件。
7、记录事件明细和动作:认识到事件明细、响应动作和结果对分析、合规性和未来改进工作的关键作用,事件经理确保全面记录这些信息。
IT事件经理所需的基本技能
IT事件经理必须具备技术、管理和人际交往技能,才能有效开展工作。安全、网络和系统方面的技术专长是必不可少的,同时还必须精通项目管理和组织技能,以执行事件响应计划。
领导能力和团队协作能力对于有效激励和协调团队成员至关重要。要向不同受众传递清晰、有针对性的信息,必须具备有效的沟通和演讲技能。分析技能、批判性思维能力和压力管理技巧对于评估情况、制定明智的策略和应对事件管理压力至关重要。
获得相关认证,如 ITIL® 基础、注册事件管理师 (CIM)、注册信息安全管理师 (CISM) 或其他专门针对事件管理的认证,可以提高 IT 事件管理者的资质和信誉。
IT 事件管理者面临的挑战
1、压力管理:在紧迫的时间内管理事件时,有效处理时间压力和精神压力至关重要。这一角色本身就涉及高压情况、与要求苛刻的利益相关者互动,以及面临财务或声誉后果。有效的压力管理对于在这一要求苛刻的岗位上保持业绩和应变能力至关重要。
2、复杂性:随着新技术、云服务和互联系统的采用,IT 系统和环境变得越来越复杂。在如此复杂的环境中管理事件,要求事件管理者了解系统及其依赖关系的复杂技术细节。
3、沟通:在严重事件中,有效的危机沟通对于保持冷静、树立信心以及引导利益相关者完成事件响应流程至关重要。事件管理者必须做好准备,在必要时进行清晰的沟通、消除顾虑并提供保证。
4、人际动态和决策:协调具有不同优先级和观点的不同团队和利益相关者需要很强的人际交往技能和解决冲突的能力。IT事件经理必须在压力下做出关键决策,这可能会导致事关重大的结果。
5、持续学习:不断学习是成功的必要条件,但同时也使事件经理的角色变得更加复杂。快速发展的技术、多样化的技能要求、监管合规性以及事件的复杂性,要求事件经理必须紧跟事件响应和网络安全的最新趋势、工具和最佳实践。
IT事件经理需要哪些基本工具?
IT 事件管理者需要一个多功能工具包来应对 IT 事件管理中固有的复杂挑战。以下是他们在 ITSM 软件中应优先考虑的内容:
1、强大的事件管理实践: 从检测到解决,高效管理和跟踪事件的综合模块。这包括与监控工具无缝集成,以实现实时问题检测和自动事件创建。此外,与其他 ITSM 实践(如问题管理、变更管理和资产管理)更紧密地结合在一起,有助于通过提供清晰度和上下文来协同事件管理。
2、自动化和工作流程协调: 自动化功能可简化重复性任务,如工单指派、任务管理、通知管理、升级等。工作流协调可促进结构化的事件管理流程,确保团队和系统之间的无缝协调,从而减少人工工作量并加快解决时间。
3、配置管理数据库(CMDB): CMDB 可提供关键 IT 组件(包括硬件、软件和配置)的全面可见性,这有助于了解事件。CMDB 中的关系映射有助于确定依赖关系,从而促进事件诊断和解决。
4、通信与协作功能: 与 Microsoft Teams、Slack 等流行平台无缝集成的强大通信和协作渠道。这些功能有助于促进事件管理团队、利益相关者和最终用户之间的实时互动与协作。
5、知识库: 用于存储与事件相关的知识文章、标准操作程序、故障排除指南和历史事件数据的集中存储库,有助于事件解决、知识共享和持续改进。
6、报告和分析工具: 可深入了解事件趋势、性能指标、SLA 合规性和有待改进的领域,从而实现数据驱动决策和持续服务改进。
事件经理的报告通常是什么样的?
事件管理器的报告可突出显示关键指标和指数,如打开事件的数量、严重程度及其当前状态。图表或图形通常用于描述一段时间内的趋势,如事件数量、违反服务水平协议的情况、解决时间、重新打开的事件数量等。这些功能增强了知情决策的能力,提高了事件管理的效率。图 1 展示了 IT 事件管理人员常用的仪表板。
ServiceDesk Plus可为 IT事件经理提供哪些功能?
ServiceDesk Plus可帮助 IT事件经理简化事件管理工作流程。通过自动化功能、服务水平协议管理、知识库和集成,ServiceDesk Plus 使 IT事件经理能够迅速响应事件,最大限度地减少停机时间,确保业务运营不中断。其强大的报告和分析工具使 IT事件经理能够深入了解事件趋势,确定需要改进的领域,并做出数据驱动的决策。