什么是正常运行时间监控
正常运行时间是衡量服务器或任何网络组件对其最终用户的可用性的指标。定期检查网络设备可用性的过程称为正常运行时间监控。正常运行时间监控有助于确保所有组件保持正常运行,而不会停机。
正常运行时间监控是关键的网络监控功能,对整个网络的运行状况和性能至关重要。正常运行时间表示特定设备或 IT 系统保持运行的持续时间或时间百分比。可以使用以下公式计算任何时间范围内的网络设备的正常运行时间:正常运行时间=(设备不可用的持续时间)/(总时间范围)。
为什么正常运行时间监控很重要
监控正常运行时间很重要,原因如下:
- 网络的理想正常运行时间为100%。正常运行时间监控有助于确定网络是否已达到 99.999% 的最大可实现正常运行时间。
- 正常运行时间监控可确保网络设备的不间断运行,从而防止意外的网络停机并确保业务平稳运行。
- 如果没有正常运行时间监控,IT 管理员在检测到网络组件正在经历停机之前为时已晚。这种迟迟不作反应会削弱本组织的商誉和收入。
正常运行时间监控如何工作
- 通过使用互联网消息协议 (ICMP) ping 和 Telnet 定期执行可用性检查,可以监控正常运行时间。
- 正常运行时间监视器以连续的间隔向网络组件发送 ping。如果网络组件在两次尝试中未能响应,则将其归类为不可用设备。
网络的理想正常运行时间是100%,由于几个限制因素,这很难实现。99.9% 的正常运行时间是最实用的替代方案,这意味着每年只有 5.25 分钟的网络不可用时间。这不会留下太多出错的余地,特别是考虑到网络可能由于多种原因而变得不可用。网络中断分为两大类:计划内事件和计划外事件。
- 计划的活动: 这是IT团队有意关闭网络以完成需要执行的重要任务以保持网络正常运行的时候。这包括网络故障排除、硬件和软件安装、更新设备配置、运行合规性检查、网络扩展等。这几乎不会对整体业务生产力产生影响。
- 计划外事件:这是指由于系统故障、分布式拒绝服务攻击、人为错误、资源分配不当等不可预见的情况而发生的突然中断。这导致意外的业务中断每年给世界各地的组织造成数百万美元的损失。
为了避免此类损失并确保不同地理位置的持续网络可用性,持续监控正常运行时间至关重要。
正常运行时间监控的挑战
- 监控各种 IT 基础架构组件:供应商及其制造的设备数量不断增加。当不断增长的 IT 基础架构使用这些不同的设备时,管理它们的复杂性就会激增。
- 管理大量警报:当父设备发生故障时,其子设备将连续停止响应,从而导致大量警报。
- 消除人为错误 :不正确的设备配置、安装不稳定的更新、安排未经授权的设备停机时间以及类似的不正常做法会影响网络设备的正常运行时间。
- 主动识别和解决问题 :采取被动方法来解决问题是一种古老的做法。能够主动识别与正常运行时间相关的问题并将其扼杀在萌芽状态将节省大量时间和资源。
- 跨 IT 基础架构组件的可见性:监控大量设备的正常运行时间可能是一项具有挑战性的任务,尤其是当它们属于各种类别并分布在多个位置时。
正常运行时间监控服务工具
OpManager的实时正常运行时间监视器会定期扫描IT基础架构组件的运行状况和可用性,并帮助解决问题,以确保网络24/7全天候正常运行。使用互联网控制消息协议(ICMP)ping和Telnet执行设备可用性检查,用于识别边缘路由器和隔离区(DMZ)设备。
OpManager提供的各种可靠的监控正常运行时间的解决方案:
- IT 基础架构组件正常运行时间监控
- 服务正常运行时间监控
- 过程正常运行时间监控
- 网站正常运行时间监控
IT 基础架构组件正常运行时间监控
- 设备正常运行时间监控:默认情况下,OpManager的正常运行时间监视器每两分钟ping一次网络设备,如果设备在两次尝试后未能响应,OpManager会将其归类为不可用设备。Ping 是全球 IT 管理员识别设备可用性的可靠方法。为了轮询设备,OpManager的正常运行时间监控工具使用ICMP ping。
- 接口正常运行时间监控:OpManager的网络正常运行时间监控系统利用简单网络管理协议(SNMP)来确定网络中接口的可用性。这些接口状态可用作单个设备状态、第 2 层网络图、业务视图或自定义设备组。
服务正常运行时间监控
- 监视系统级服务的可用性和响应时间对于确保服务器管理计划完整至关重要。像OpManager这样的服务器正常运行时间监视器监视许多服务的可用性和响应时间,包括DNS,SMTP,LDAP,Telnet,HTTPS,MSSQL,MySQL等等。
- Windows服务正常运行时间监控OpManager的正常运行时间性能监控利用Windows管理规范(WMI)协议来监控。
- Windows服务的正常运行时间。其他功能包括在 Windows 服务关闭时自动重新启动服务或服务器、停止当前正在运行的服务等。
过程正常运行时间监控
OpManager是一种正常运行时间监控工具,可让管理员远程监控服务器上运行的进程。OpManager使用多种协议(SNMP / WMI / CLI)并监控在Windows,Linux,Solaris,UNIX,VMware服务器,虚拟机等上运行的进程。
网站正常运行时间监控
- OpManager使用其URL监视器全天候监控关键网站的可用性。它可以配置为监视 URL、虚拟主机和内部网。
- OpManager的网站正常运行时间监控可立即恢复受感染的网站;监控网络服务器场;确定 Web 应用程序的某些部分是否已关闭;通过登录名监控 Web 应用程序等。
OpManager是集成的网络管理软件,提供实时网络监控,并提供对网络各种问题区域的详细见解,帮助管理员轻松深入了解网络问题的根本原因并快速修复。