作者介绍:董晨,山东省中医院信息科机房运维管理
本文从背景、演进、成效来分享建设过程,最终得出结论,类似Zabbix的国产成熟产品市场价值动辄上百万,而我们以极小成本,为医院节省了大量资金,取得了良好的效果。
1、背景
近几年山东省中医院的信息化建设如火如荼,信息化对医院业务的覆盖渗透越来越深入,成为支撑医院业务稳定运行和持续发展的强大助力。
随着信息化规模越大,信息系统也越加复杂,网络系统也越加庞大,问题点也越加隐蔽,运维难度也随之增加。由此产生了亟需解决的运维痛点:
· 系统分散,无统一监控管理
· 缺乏有效的事前预警、事后分析的工具
所以,我们需要一套可以解决以上痛点的监控预警系统。
那么,应当选择什么样的监控预警系统呢?我们认为应当具备以下4个基本特性:
· 开源免费
· 功能强大
· 文档完善
· 界面友好
经过多方考察,我们最终选择了开源软件Zabbix。因为Zabbix作为世界范围内最受欢迎的开源监控系统之一,已经在非常多的行业领域中得到广泛使用,在国内医疗行业也积累了大批客户,拥有众多的产品优势,如下:
完全开源,无产品费用和license限制
功能强大,能够实现对各种对象的监控支持
完善的图形化界面,使用简单,易于维护
版本迭代快,系统运行稳定,资源占用率低
配置灵活,能够快速实现架构和功能扩展
拥有Zabbix官方、合作伙伴和社区技术支持
2、演进
2020年4月开始使用Zabbix,版本是v4.3。
2022年将版本升级到v5.0。
2023年计划将版本升级到v6.2,操作系统由CentOS改为Ubuntu。
同时,为了实现快速交付和部署以及提升资源利用率,我们也将Zabbix的运行环境升级为Docker容器化平台。
3、成效
经过近3年的持续建设和完善,目前医院新入网的设备基本都已纳入监控,整体工作的成效亮点可以归纳为“两全一高”:
· 覆盖全:监控对象包含217台交换机、40台外网虚机、201台内网虚机、429个无线AP、88台物理机、172个其它设备。其中,重点监控对象是给各业务软件系统使用的虚拟机,其中CPU、内存、存储等指标状态都已详尽覆盖
· 告警全:邮件、Web、钉钉、企业微信、大屏等方式都已对接实现
· 效率高:提前发现隐患,故障发生率降低80%,及时定障排障,故障定位效率提升85%
4、结语
类似Zabbix的国产成熟产品市场价值动辄上百万,我们以极小成本,为医院节省了大量资金,取得了良好的效果。