随着信息技术的发展和全面应用,数据中心机房已成为各大企事业单位维持业务正常运营的重要组成部分,网络设备、系统、业务应用数量与日俱增,规模逐渐扩大,一旦机房内的设备出现故障,将对数据处理、传输、存储以及整个业务构成威胁,若机房设备出现故障不能及时被发现、处理,不但会影响整个业务系统的正常运行,甚至造成设备报废,使系统陷入瘫痪,造成严重后果和无法挽回的损失。尤其对于银行、税务、证券、电信、电力、大型企业等需要实时交换数据的单位的机房,一旦系统发生故障,造成的经济损失更是不可估量,因此,机房实时监控管理显得更为重要。
一个完善的机房监控系统,应具备五个特点,一是实现从设备运行到机房环境的多层次监控;二是支持设置多种丰富的阈值来监控危机;三是提供丰富的报警方式来确保相关人员能够接收到告警信息;四是提供可视化的自动运维编排方式,实现自动巡检和故障自愈;五是全面兼容国产软硬环境,符合国产信创要求。优秀的国产机房监控系统,是高度集成、适配国产环境、智能化的,可以随时随地关注机房内的情况,并通过系统自动化对机房故障进行处置,实现故障自愈。
北京智和信通作为自研厂商,核心产品“智和网管平台”,通过全栈合一功能结构,对机房数据采集、存储、统计、分析,并对采集到的数据进行处理后,形成可视化的机房拓扑和统计图表,为机房运维提供可靠保障。
北京智和信通 智和网管平台机房监控运维架构
在设备采集层,智和网管平台可对动力系统如配电、UPS等,环境系统如温湿度、漏水、新风系统等,安防系统如烟感、视频监控等,以及其他常规网络设备、机柜等进行全面监控。
在集中监控层,平台部署在应用服务器上,负责采集、存储运维数据,并对数据进行分析展示,对异常数据进行告警等。
在智能运维层,以实时监控为基础,结合自动化运维和设备控制,实现对机房的立体管控。提供多种故障预警通知方式,保证用户可以第一时间获取故障信息,进行干预,并对实时、历史的机房数据进行统计分析。
IDC机房实时监控运维,实现无人值守
北京智和信通基于机器学习技术与大数据分析的无人值守的IDC机房自动运维方案,对不同类型、不同型号、不同厂商的机房设施进行统一监控,并通过自动发现技术,生成机房立体拓扑图,将机柜、设备、配电柜、温感、湿感、烟感、空调、UPS、蓄电池及其他设备可视化呈现。
无人值守的异常告警与故障自愈
以网络状态监控、设备性能监测为基础,结合网络流量侦测功能,动态发现网络故障。智能判断告警类型及级别,自动触发预设的故障处置流程,复杂告警指派工单专人处理,常规告警触发安全策略全自动处理。提供有效的故障监控指标体系,量化告警阈值,以声光、邮件、短信、微信及钉钉等方式实时告警。
无人值守的机房巡检
依托平台对机房设备、应用、系统等预设巡检策略,收集信息数据并对其健康情况进行分析。将周期性、重复性、批量的巡检作业,固化为自动化流程,通过配置时间规则,在指定时间进行调度。从而实现周期性巡检的自动化,仅需关注巡检作业执行过程、执行成功与否以及执行结果。降低日常运维中人员的时间、精力投入,从而将运维人员从繁琐的简单工作中解放出来,进行更重要的工作。
无人值守的设备远程操控配置
用户可通过网页对智和网管平台进行访问,通过对纳入监控的设备进行单独、批量的配置操作,实现如一键开关机、流量策略配置、安全策略配置、策略备份对比等操作。通过批量作业并行处理能力,实现多设备并发批处理操作。通过自动化流程,将简单的设备控制操作在大批量设备进行执行,并对执行过程进行监督,对执行结果进行检查。
自主研发,深度适配国产软硬件
与国产系统、中间件、CPU、数据库深度适配;拥有10年国产融合经验,支撑用户覆盖各行各业。
智能运维数据分析,机房现状一览无余
提供可视化数据分析能力,对网络海量数据进行图形化分析展示。通过直观的图表和图形化手段清晰有效的将运维数据分析结果进行传达,帮助用户由宏观到微观更快地了解网络运维现状,做出更具时效性的决策。
通过北京智和信通机房动环运维监控方案,实现通过线上平台端实时查看机房运行状态,及时接收机房运行异常告警,实现机房7*24小时无人值守,实现事前预计,事中告警,事后审计,以及真正自动化的故障自愈和机房巡检,全面提升机房运维效率。