网络管理员有一个主要责任:确保其网络的正常运行时间,同时不影响网络性能。然而,随着现代可部署解决方案通过传统的网络架构,这说起来容易做起来难。尽管现代解决方案在效率方面绝对比传统解决方案更上一层楼,但它们也带来了自己的一套管理复杂性。网络管理员必须领先于这些复杂性,同时避免网络停机,这肯定会让他们保持警惕。
为了保持平稳运行,网络管理员需要衡量其网络的效率。这就是三个关键指标发挥作用的地方。这些指标可帮助网络管理员更好地了解其事件管理,通过优化这些指标,网络管理员可以确保其设备的高可用性。三个关键指标是:
- 平均故障间隔时间(MTBF)
- 平均故障时间(MTTF)
- 平均修复/解决时间(MTTR)
平均故障间隔时间(MTBF)
在任何网络中,设备的不可用都可能导致严重影响,包括但不限于网络停机。任何网络停机都可能导致业务服务的进一步中断,从而降低业务收入。
除了金钱损失外,网络停机还会导致声誉损失,这是不可取的。因此,重要的是要确保网络以及与之关联的设备必须始终可用并处于最佳性能。MTBF 是一个指标,可帮助网络管理员了解设备可能经历停机的频率,以及启动和运行设备所需的平均时间。
平均无故障时间f是如何计算的
MTBF 是两个连续停机事件之间的平均时间。通常,可以通过考虑要分析的时间段内的数据集,然后将该特定时间段内的设备正常运行时间除以故障次数来计算。
例如,让我们考虑企业网络中的路由器,该路由器在 24 小时内经历了四次停机,每次停机一小时。现在,它的正常运行时间为 24 小时,因为在 <> 小时窗口内有 <> 小时的停机时间。因此,MTBF 可以计算为:
MTBF = 总正常运行时间 / 故障数 = 20/4 = 5
如何降低平均故障间隔时间
- 创建并建立有效的应急措施,以便将停机时间的影响降至最低。
- 执行根本原因分析,帮助网络管理员全面了解手头的故障。
- 主动监控,帮助网络管理员在设备故障和停机之前领先一步。
平均故障时间 (MTTF)
网络中设备的常见问题肯定会很麻烦,因为它会对网络的整体性能产生影响。这肯定是不可取的,因为不仅会影响网络性能,而且如果问题无人看管,还可能导致网络停机。这就是MTTF的用武之地。MTTF 是一个指标,可帮助网络管理员了解设备发生故障之前所用的平均时间。此指标用于确定设备是否已准备好更换或维修。较高的 MTTF 可能表示设备可能需要定期频繁更换,这是非常不希望的。这会导致时间和资源的损失,而这些时间和资源可能更好地集中在网络的其他关键方面。
MTTF 是如何计算的
MTTF 是设备遇到问题实例之间的平均时间。这可以通过将每个设备的运行小时数之和除以设备数量来计算。
例如,让我们考虑 4 个路由器。设备 A、B、C 和 D 在发生故障之前分别持续 10、12、14 和 16 小时。现在,MTTF 可以按如下方式计算:
MTTF = 总运行小时数 / 设备总数 = (10 + 12 + 14 + 16) / 4 = 52 / 4 = 13
如何改进MTTF
- 实时监控您的网络设备,通知您可能出现的任何潜在瓶颈。
- 采购高质量、耐用、可靠的组件。
- 定期执行设备检查,尤其是对业务关键型设备。
平均修复时间 (MTTR)
网络停机是不可取的,因为它不仅会影响日常业务运营,还会导致客户眼中的声誉和品牌价值损失。尽管网络停机可能是灾难性的,I/O 团队必须尽其所能来防止它,但他们还必须配备尽快处理和纠正停机的能力,以减少损坏程度。MTTR 是一个指标,它允许网络管理员了解其 I/O 团队对迫在眉睫的威胁做出响应的速度,并可以指示其 I/O 团队的准备情况。
中期追踪时间是如何计算的
MTTR 是从收到警报的那一刻到设备再次启动并运行的那一刻纠正设备故障所花费的平均时间。
例如,让我们考虑一个路由器在一周内面临 4 次中断,导致总停机时间为 2 小时。因此,MTTR 中断时间为 30 分钟。
如何降低平均停留时间
- 使用主动网络监控,在即将发生的服务中断之前通知 I/O 团队。
- 区分技术人员的角色、职责和范围,以尽量减少沟通不畅。
- 明确定义标准操作程序(SOP)并对其进行设置,以便在发生事故时必须遵循。
- 将您的网络监控解决方案与相关的 ITSM 工具集成,以便每个警报在正确的时间通过正确的渠道到达正确的人。
如何优化这些指标提高网络性能
OpManager是一个全面的网络监控解决方案,可帮助网络管理员监控其网络,同时避免网络停机时间并消除网络盲点。这有助于他们深入了解网络情况,并保持其设备的最佳运行状况和性能。OpManager凭借其强大的附加组件和集成功能,可帮助网络管理员在问题开始出现时立即收到警报。
OpManager提供以下功能来帮助管理员改善MTTF,同时降低MTBF和MTTR。
- 智能发现:OpManager具有智能发现功能,可帮助网络管理员自动发现其设备。并且还允许网络管理员在方便的时候定期安排发现检查。
- 自适应阈值:在仔细评估设备的历史数据和当前使用模式后手动配置阈值确实听起来容易做起来难。OpManager具有自适应阈值功能,可帮助网络管理员自动执行阈值配置过程,从而减轻负担。
- 预测性能趋势:允许预测任何设备或显示器的性能趋势,这有助于网络管理员进行容量规划。
- 无缝集成:与顶级ITSM工具兼容。这些集成可以在发生事故时通过电子邮件、短信、票证记录等立即提醒网络管理员。
- 强大的可视化功能:提供了强大的可视化功能,可以为您提供网络的大海捞针视图。OpManager的自动网络图功能可帮助您全面了解您的网络,使网络规划和扩展更容易。
OpManager 提供全面的网络监控功能,可帮助管理员监控网络性能,实时检测故障隐患,保障业务系统高效运行。并且拥有强大的实时可视化监控功能,让管理员获得对整个网络基础架构的完全可见性和性能控制。