国家电网某地电力公司网络硬件综合监控运维项目

news2024/11/25 18:48:55

        国家电网某地电力公司是国家电网有限公司的子公司,负责当地电网规划、建设、运营和供电服务,下属多家地市供电企业和检修公司、信息通信公司等业务支撑实施机构。

项目现状

        随着公司信息化建设加速,其信息内网中存在大量物理服务器、存储设备、光纤交换机等设备,缺少监控设备细颗粒度部件状态的运维工具,无法满足实际运维需求。

设备类型:存储设备、服务器、光纤交换机、交换机等

设备品牌:华为、H3C、浪潮、惠普、IBM、中兴、联想、DELL、曙光、南瑞、神州鲲泰、超聚变、沃趣、长城超云、Brocade、MELLANOX、贝尔、锐捷等

设备数量:2000+台

项目期望:

  • 将网络内近200种不同品牌、不同型号、不同类型的设备统一、集中监控;
  • 提供详细的、粒度细设备监控指标库,支持监控的指标包括但不限于:CPU、内存、磁盘、网口、温度等;
  • 能够实时监控设备的运行数据,快速判断出硬件部件故障位置与级别,提供高效的故障排查和处理手段;
  • 解决设备产生的事件和日志信息格式多样、复杂不一致的问题,可以对其进行集中管理,并转化为清晰易于理解的告警信息;
  • 具有多种可供选择的告警通知方式,包括但不限于邮件、短信、微信等;
  • 解决目前主要依赖人工巡检,造成的巡检频度低,人力耗费大的问题;
  • 解决不同类型设备配置复杂和设备配置工作量大的问题,能够对设备的配置文件进行管理;
  • 能够与SG-I6000设备状态评价模块进行对接。

智和信通方案

        经过与用户一线运维工程师的深入交流,智和信通充分明确了其对监控运维平台的核心需求,并通过对其日常运维工作的分析提供出针对性的解决方案。

海量异构设备统一纳管

        内置大量不同类型、不同品牌型号设备监控模型,通过多维度监控设备,获取网络最新运行状态。监控指标涵盖在线状态、Ping、CPU、内存、网络接口、磁盘、进程、电源、风扇、温度等各方面。且不同类型和应用场景下的设备具备差异监控资源和监视指标,在设备统一纳管的情况下,实现差异化故障告警。

        提供设备、资源、设备间连接关系自动化发现绘制能力,以图形方式实现设备、资源、链路状态的直观展示,为设备部件故障的实时发现和有效处理提供便利。

灵活可配的设备、资源、监视任务模型库

        支持自定义配置设备类型、设备资源模型和故障监视器、性能监视器监视任务等模型,实现对电力公司内部覆盖存储设备、服务器、光纤交换机、交换机等设备类型,华为、H3C、浪潮、惠普、IBM、中兴、联想、DELL、曙光、南瑞、神州鲲泰、超聚变、沃趣、长城超云、Brocade、MELLANOX、贝尔、锐捷等设备品牌的近200个品牌型号的监控支持。

全面监控设备性能,感知网络运行态势

        全面采集网络内存储、服务器、光纤交换机、交换机等设备的性能信息,按照时间、资源、性能类型等多种维度,图形、表格等多种形式进行实时性能和历史性能的展示。并通过智能算法分析历史数据,对磁盘容量、交换机端口容量、机房机柜容量进行展示和预测分析,并根据容量可使用时间进行自定义预警。

多种告警机制,可自定义告警阈值

        支持多种告警机制,自定义配置告警阈值,从众多的事件、日志和状态信息中分析提炼异常数据并转化为告警。第一时间获取准确的告警信息,快速标示已执行操作的告警,迅速定位告警设备。

智能告警降噪,快速定位故障根因

        采用自动去重、风暴抑制、关联聚合、维护期时间屏蔽、依赖屏蔽等多种智能告警降噪机制,对各类告警进行自动压缩收敛,减少无效告警,一步定位发生故障的源头设备。快速检索异常问题关联涉及的各项维度与影响范围,快速定位问题边界,直达故障根因。

多种告警通知途径结合故障自愈能力,实现快速排障

        通过故障阈值的设置,在故障真正到来前,提前触发通知机制,三级逐步预警。告警发生中,自动关联调取内置的故障处置预案,配合告警自愈及自动派单能力,快速实现排障处置;在故障消失后,系统能自动检测到先前故障,并做自动清除告警处理。

        提供界面颜色、提示声、光效闪烁、信息列表、Email、短信、钉钉、企业微信、个人微信等多种通知渠道。

匹配真实运维场景的自动化巡检

        可自定义巡检策略对设备的运行情况进行统计和报表生成,并可预设时间巡检策略执行时间,进行自动化巡检,可向指定邮箱发送巡检结果报告。通过平台内人工触发或定时触发的方式,将巡检工作托管至平台自动执行,解放人力,实现对设备的定期快速检查。

设备配置文件备份、对比、恢复

        定期自动对设备策略进行巡检备份,可在线查看、下载保留或通过本次执行结果与上次执行结果或基线文件的对比,当配置出现异常时进行自动告警,并可结合故障自愈能力,自动回滚到信任的版本。

全网IT资产统一管理

        提供网络内IT设备一键同步资产数据库的功能,快速同步拓扑内的监控设备,并对其进行资产生命周期管理。以图谱的方式呈现资产与其他资产、配品配件、网络链路、使用人等静态关联关系。

对接I6000系统,实时推送告警与设备状态数据

        方案实现与I6000系统的对接,将设备的异常告警信息集中存储,统一分析处理,转化为I6000可识别的、符合国网要求的标准格式。通过设备信息同步功能,将设备资产、监控信息快速同步至I6000,丰富I6000内关于设备的性能、告警、基本信息等内容。

应用价值

        通过部署智和信通综合监控运维方案,7*24小时实时监控全网设备,获取IT设备的状态信息,真正满足用户硬件资源精细化监控需求。

        通过精细化监控设备的各项硬件指标,实时了解设备的运行状态和负载情况,及时发现硬件组件可能出现的性能瓶颈和故障,不但为设备配置调整和优化提供数据支撑,而且提前预警设备可能出现的故障,以便运维人员有充足的时间准备排障操作。同时,在故障出现后快速诊断故障产生的根本原因,提升排障效率,减少因设备故障带来的业务中断和损失。

        在整体运维工作中通过智和信通综合监控运维方案自动采集、存储、分析设备状态数据,通过设备远程控制和自动化编排运维的能力,对设备进行远程调控和维护,快速提高工作效率的同时,降低IT运维成本,保障电力信息系统稳定、高效运行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1648886.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

我独自升级崛起在哪下载 我独自升级崛起客户端下载教程

定于5月8日全球盛放的《我独自升级:崛起》——这一激动人心的动作角色扮演游戏巨作,汲取了同名动漫及网络漫画的精髓,誓将以其无与伦比的魅力,引领玩家迈入一个探索深远、规模宏大的奇幻之旅。游戏构筑在一个独一无二的网络武侠世…

英语学习笔记3——Sorry, sir.

Sorry, sir. 对不起,先生。 词汇 Vocabulary umbrella n. 伞,保护伞 注意读音 [ʌm’brelə] 英国人离不开雨伞。 please 请 特殊用法:让路(升调)      用餐礼仪(平调)      求求你…

【Toritoise SVN】SVN 怎么忽略文件夹下的所有文件但是不忽略文件夹本身

比如:忽略 Assets\StreamingAssets\LocalAsset文件夹下的所有文件但是不忽略LocalAsset这个文件夹 在TortoiseSVN中,你可以通过以下步骤来修改文件夹的svn:ignore属性: 打开Windows资源管理器,导航到你的工作副本中的Assets\Stre…

鸿蒙内核源码分析(互斥锁篇) | 互斥锁比自旋锁丰满多了

内核中哪些地方会用到互斥锁?看图: 图中是内核有关模块对互斥锁初始化,有文件,有内存,用消息队列等等,使用面非常的广.其实在给内核源码加注的过程中,会看到大量的自旋锁和互斥锁,它们的存在有序的保证了内核和应用程序的正常运行.是非常基础和重要的功能. 概述 自旋锁 和…

HIVE函数的基本使用

HIVE函数的基本使用 1.查看所有支持的函数 共289个 1)SHOW FUNCTIONS 查看所有支持的函数 共289个 2)SHOW FUNCTIONS LIKE "**" 模糊查询函数名 3)DESC FUNCTION 函数名 可以查看函数的具体使用方法 show functions; show functions like "*c…

【Python爬虫实战入门】:全球天气信息爬取

文章目录 一、爬取需求二、所需第三方库2.1 简介 三、实战案例四、完整代码 一、爬取需求 目标网站:http://www.weather.com.cn/textFC/hb.shtml 需求:爬取全国的天气(获取城市以及最低气温) 目标url:http://www.weath…

双热点的王炸组合!损失函数+Attention,精度与速度上实现SOTA!

损失函数注意力机制在深度学习领域是一个热门研究方向,它可以提高模型的性能和泛化能力,帮助我们构建更加精确且高效的模型。 具体来说: 通过结合注意力机制的聚焦能力和损失函数的优化指导,模型能够更精确地捕捉数据中的关键信息…

Vue3基础笔记(4)组件

目录 一.模版引用 二.组件组成 1.引入组件 2.注入组件 3.显示组件 三.组件嵌套关系 四.组件注册方式 五.组件传递数据 六.组件事件 一.模版引用 虽然Vue的声明性渲染模型为你抽象了大部分对DOM的直接操作,但在某些情况下,我们仍然需要直接访问底…

一个新细节,Go 1.17 将允许切片转换为数组指针!

在 Go 语言中,一个切片(slice)包含了对其支持数组的引用,无论这个数组是作为一个独立的变量存在于某个地方,还是仅仅是一个为支持分片而分配的匿名数组。 其切片基本结构都如下: // runtime/slice.go typ…

windows安装ElasticSearch以及踩坑

1.下载 elasticsearch地址:Past Releases of Elastic Stack Software | Elastichttps://www.elastic.co/cn/downloads/past-releases#elasticsearch IK分析器地址:infinilabs/analysis-ik: 🚌 The IK Analysis plugin integrates Lucene IK…

学习R语言第五天

文章目录 语法学习创建数据的方式绘制图形的方式图形添加颜色如何操作数据的方式数据进行验算的判断加付值的方式修改变量名称的方式判断是否存在缺失值在计算的方式忽略缺失值通过函数的方式忽略缺失值日期处理的方式字符串转化成日期的方式格式化数据框中数据返回当前的日期的…

【重磅开源】MapleBoot生成代码工具介绍(单表表格功能)

基于SpringBootVue3开发的轻量级快速开发脚手架 🍁项目简介 一个通用的前、后端项目模板 一个快速开发管理系统的项目 一个可以生成SpringBootVue代码的项目 一个持续迭代的开源项目 一个程序员的心血合集 度过严寒,终有春日&#xff…

【深度学习实战(33)】训练之model.train()和model.eval()

一、model.train(),model.eval()作用? model.train() 和 model.eval() 是 PyTorch 中的两个方法,用于设置模型的训练模式和评估模式。 model.train() 方法将模型设置为训练模式。在训练模式下,模型会启用 dropout 和 batch norm…

SinoDB SQL管理工具之-DBeaver安装使用说明

本文介绍如何使用DBeaver管理工具连接SinoDB数据库。 1. DBeaver下载 下载地址:Download | DBeaver Community 请根据需求选择对应自己操作系统的版本进行下载。本次示例使用Windows 64位操作系统进行安装配置。下载版本为:dbeaver-ce-23.0.2-x86_64-…

什么是SOL链跟单机器人与阻击机器人?

SOL链作为一个快速增长的区块链生态系统,为各种应用程序提供了丰富的发展机会。在SOL链上,智能合约的应用已经开始蓬勃发展,其中包括了许多与加密货币交易相关的应用。在本文中,我们将介绍在SOL链上开发的阻击机器人(S…

42.乐理基础-拍号-看懂拍号的意义

到这必然是已经知道 X、Y的意思了: 然后带入数字: 然后念拍号的时候,在国内,百分之九十的地方是从下往上念,念作四二拍,还有百分之十的地方是和国外一样,从上往下念,念作二四拍&…

DigitalOcean 应用托管平台级更新:应用端到端运行时性能大幅改进

DigitalOcean 希望可以为企业提供所需的工具和基础设施,以帮助企业客户加速云端的开发,实现业务的指数级增长。为此 DigitalOcean 在 2020 年就推出了App Platform。 App Platform(应用托管) 是一个完全托管的 PaaS 解决方案&…

如何自己快速的制作流程图?6个软件教你快速进行流程图制作

如何自己快速的制作流程图?6个软件教你快速进行流程图制作 自己制作流程图可以是项目管理、流程设计或教学展示中的重要环节。以下是六款常用的流程图制作软件,它们都提供了快速、简单的方式来制作流程图: 迅捷画图:这是一款非…

Java基础(三):Java异常机制以及底层实现原理

🌷一、异常 ☘️1.1 什么是异常 Java异常是程序发生错误的一种处理机制,异常的顶级类是Throwable,Throwable字面意思就是可抛出的,该类是所有的错误和异常的超类,只有Throwable类或者Throwable子类的实例对象才可以被…

超详细——集成学习——Adaboost实现多分类——附代码

资料参考 1.【集成学习】boosting与bagging_哔哩哔哩_bilibili 集成学习——boosting与bagging 强学习器:效果好,模型复杂 弱学习器:效果不是很好,模型简单 优点 集成学习通过将多个学习器进行结合,常可获得比单一…