摒弃“短板”——数据中心基础设施运维管理建议书

news2024/12/26 11:13:09

数据中心是数字基础设施的重要组成部分,同时也是一整套复杂的设施。它不仅仅包括计算机系统和其它与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接、环境控制系统、监控系统以及各种安全系统。运维管理又是数据中心在运营过程中历时最长的一个阶段。如何确保数据中心安全、可靠、高效的运行则是运维人员工作内容的重中之重。

在数据中心网络运维管理过程中,运维人员要对数据中心的网络构成、业务走向、设备相互连接关系等做充分的了解。据了解,现有的管理方式大多是将数据中心初建阶段的数据通过表格、图纸、文档等方式整理好,然后在以此为基础作为后续的变更规划,排障宝典。然而,事与愿违,实际工作中总会有不同的原因促使实施人员不按规范操作、数据变更不及时,重要文件丢失等,当遇到突发业务故障,手忙脚乱,翻遍表格、图纸,耗时耗力不说还影响客户对运维工作的满意度。

那么,既然现有管理方式并不是那么的有效,是否可以借助一些运维管理工具来完善我们的基础设施运维工作呢?

据了解,目前用于数据中心运维管理的工具有动环系统、监控系统、网管系统以及3D可视化系统,然而各个平台都是独立的,甚至不同品牌设备的管理系统也是独立的,运维人员日常维护需要登录多个系统,并且在其间来回切换。除此以外,以上都是针对有源设备开发的管理系统,然而往往造成系统故障的原因可能只是运维人员不小心碰掉了某根光跳线。可见仅仅只是管理硬件并不能解决根本问题。

“一只木桶盛水的多少,并不取决于桶壁上最高的那块木块,而恰恰取决于桶壁上最短的那块。”由此看来,高性能的设备可能会扩大计算、存储、分析以及灾备等能力,然而一根线缆的故障却能使其前功尽弃。由此可见,庞大的线缆管理难题始终都是数据中心运维管理这个木桶中最短的那块木块。

结合以上,小编认为有效的基础数据及线缆管理结合现有的有源设备管理系统,通过数据互通,相互补充汇总、进而分析报告,才能完善现有运维管理方式,使运维管理系统成为运维人员的股肱心腹。

一、基础数据管理

基础数据包括:地理位置、园区范围、建筑外观、楼层机房数量、机房内部设备位置、机柜类型、机柜U位、设备外观、设备板卡、设备/板卡端口、线缆等。

管理方式:运用地图、图纸、图片等素材以层次化的方式建立图形可视化的网络基础设施数据库。

管理内容:地理位置、外观、名称编码、品牌、类型、数量、占用情况、线缆连接关系、端口流量、维护人员等等相关需要记录、管理的信息。

实现方法:可根据情况选择手动创建或通过插件使用Excel/WPS批量导入创建。

实现效果:

  • 快速查询定位设备、板卡、端口、线路
  • 室外网络基础设施快速查询定位
  • 光纤状态显示与业务定义查
  • 前端点位—可视化定位查
  • 电力连接可视化查询
  • 设备文档关联查询
  • 对端分析—快速查看机柜内设备间连接
  • 链路分析—自动生成物理链路
  • 拓扑分析—自动生成物理拓扑
  • 路由分析—动态跟踪线缆桥架
  • 机房容量分析
  • 自定义多维度分析报表

二、线缆管理

  • 自动推荐链路
    新增设备时,系统可根据预设的设备模型端口类型及端口标准,自动推荐可以使用的线缆类型。
  • 自动线缆长度测量
    创建线缆连接的同时自动测量出两台设备之间应使用的线缆长度。
    规划人员无需经过繁琐的审批手续进行现场勘察工作,就可以获得较准确的线缆长度,规划的同时,即可定制出较准确的材料清单。
  • 自动生成标签编码打印
    系统每一根新增的线缆都可按照预设的标签规则(TIA 606B标准或用户自定义),自动生成标签编码,通过API接口实现编码列表自动传递至标签打印软件,运维人员可按需打印标签使用。
    众所周知,运维工作中标签的工作量巨大,人工编制百密一疏在所难免,有了这个功能运维人员即可从繁杂的标签工作中解脱出来,有效避免错误的同时,极大的提高了工作效率。
  • 自动生成任务工单
    对于规划新增的线缆,系统会自动生成工单任务,可以根据实际需要批量发送给实施人员。
    两台设备之间用什么样的线缆,长度多少,数量多少,起始端口,终止端口一目了然,工单任务清晰直观。实施工作也相对简单许多,无需反复沟通确认,只需在完工后拍照反馈即可。
  • 线路路由查询
    通过线缆可查找这根线缆连接的本端设备端口与对端设备端口。
    通过端口我们可以了解这条链路所承载的业务方向,端口通过SNMP协议可实现故障报警、流量监测等功能,当该业务终端出现故障时,可快速排查故障点,提高除障效率。

三、与有源设备管理系统结合

  • 开放的RESTful API,方便第三方系统导入和查询数据。
  • 基于AMQP的消息总线,实时发送资源变化消息至第三方系统。
  • 实时采集开启SNMP协议设备的数据。
  • 能够从系统内部启动外部应用程序和脚本。
  • 能够与IT服务管理ITSM、流程、网管、监控等系统快速集成。

通过与第三方系统对接,运维管理人员可以全方位的了解整个数据中心基础设施的运行状态,快速处理日常业务需求及故障排除工作。

数据中心基础设施运维工作道阻且长,为响应国家号召“加快数字化发展,建设数字中国”。我们运维管理人员也要时刻保持创新,不能让“短板”拖累了我们紧随时代发展的步伐。

文:孟敏


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1019.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于智能优化算法实现自动泊车的路径动态规划(Matlab代码实现)

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述 作为一种方便、快捷的交通工具,汽车已成为人们生活和工作的重要组成部分。随着汽车数量的逐年增加,有限…

在ubuntu上用QT写一个简单的C++小游戏(附源码)

最近老师让用Qt写一个可视化界面,然后就给了一个小视频,好奇的不得了,就照着做了一下 视频链接如下:C案例教学–一个类游戏小程序的设计与实现全过程–用到QT-简单的STL容器 创建项目 1、打开QT 如果不知道怎么下载的话&#xff…

【牛客网刷题】VL8-VL10 generate for语句、比较数大小、function的使用

👉 写在前面 👉 本系列博客记录牛客网刷题记录 👉 日拱一卒,功不唐捐! 目录 VL8 使用generate for语句简化代码 题目描述 输入描述 输出描述 RTL 设计 testbench 设计 仿真测试 VL9 使用子模块实现三输入数的大…

【C++ 程序设计入门基础】- Chapter One

目录 一、什么是 C? 1、概念 2、标准库 二、第一个 C 程序 1、下载 C 开发工具 2、开始下载好之后,我们先设置一下编码,解决中文注释不显示的问题。 3、下面我们就可以新建一个源代码 4、 编写完成后,我们就可以运行查看结果…

MyBatis:缓存机制详解

本篇内容包括:MyBatis 缓存机制概述、一级缓存与二级缓存的介绍、配置和具体流程。 一、MyBatis 缓存机制概述 在我们常见的 OLTP(on-line transaction processing,联机事务处理)类型的 Web 应用中,性能的瓶颈往往来源…

【Transformer 相关理论深入理解】注意力机制、自注意力机制、多头注意力机制、位置编码

目录前言一、注意力机制:Attention二、自注意力机制:Self-Attention三、多头注意力机制:Multi-Head Self-Attention四、位置编码:Positional EncodingReference前言 最近在学DETR,看源码的时候,发现自己对…

【码上掘金编程挑战赛】- 前端可冲【简历加分项】

【码上掘金编程挑战赛】1.比赛报名2. 比赛介绍赛题一:码上游戏赛题二:码上创意赛题三:码上文言文赛题四:码上10243.报名4.提交作品1.比赛报名 比赛报名链接 https://juejin.cn/challenge/1?utm_source3169 2. 比赛介绍 赛题一…

Spring5入门到实战------14、完全注解开发形式 ----JdbcTemplate操作数据库(增删改查、批量增删改)。具体代码+讲解 【终结篇】

Spring5入门到实战------12、使用JdbcTemplate操作数据库(增删改查)。具体代码讲解 【上篇】 Spring5入门到实战------13、使用JdbcTemplate操作数据库(批量增删改)。具体代码讲解 【下篇】 以上两篇采用的是注解开发形式xml配置…

自己动手写操作系统系列第3篇,实现时钟和键盘中断

对应labOS版本1.3 程序源码可以私聊我 picirq.h int 0x20~0x2f接收中断信号IRQ0~15,因为int 0x00~0x1f不能用于IRQ。 picirq.c pic0_mask0xfb即1111 1011;PIC1以外全部禁止。pic1_mask0xff即1111 1111;禁止所有中断 pic_enable函数就是将…

【Linux下安装jdk】Linux下安装jdk

Linux下安装jdk 1、-RPM安装 1.1、检查系统是否安装过jdk java -version 检查是否有安装包 rpm -qa | grep java 1.2、安装jdk 查看服务器版本: uname -a 下载jdk对应rpm包: https://www.oracle.com/java/technologies/downloads/#java8 上传安装包至任意目录下&…

用户登录权限校验 JWT【详解】

JWT (json web token)是当前最流行的用户登录权限校验(用户认证鉴权)方案。 官网 https://jwt.io/ JWT 的工作流程 客户端填写账号密码访问登录接口 login,将账号密码传给服务端服务端验证账号密码是否正确&#xff0c…

职言 | 校招面试有感,一个面试官的几点建议

职言: 最近一直在校招,我(作者)和同事说等这段时间结束,我不想再参与面试了,快面吐了。从校招开始,我团队前前后后陆续进了500多封学生简历,我经常一整天排满了面试,聊到…

【电子通识】芯片资料(数据手册/规格书)查询常用网站和方法

目录 1.AlldataSheet 网站(建议使用) 2.ICpdf 网站 3.CIC中国IC网 网站 4.datasheet(不建议使用) 5.半导小芯 (建议使用) 6.立创商城 (建议使用) 在做硬件的芯片选型、产品维修…

生物信息学笔记02 -- 研究的一般方法

生物信息学概述 以基因组DNA序列信息为源头,识别基因组序列中代表蛋白质和RNA基因的编码区,阐明非编码区的信息特征,破译隐藏在DNA序列中的遗传语言规律 生物信息学研究的内容与方法 研究主要内容 ⚫ 生物学数据的收集、存储、管理与提供 …

C++:继承

文章目录前言一、继承的概念及定义1.继承的概念2.继承的定义二、基类和派生类对象赋值转换三、继承中的作用域四、派生类的默认成员函数五、继承与友元六、继承与静态成员总结前言 本文介绍C中的继承。 一、继承的概念及定义 1.继承的概念 继承机制是面向对象程序设计使代码可…

厨电智能化趋势下,究竟什么才是真正的“用户思维”?

文|智能相对论 作者|佘凯文 近期2022年前三季度的各项经济数据在陆续发布,大环境依然承压,各个行业都在负重前行。 厨电行业在房地产下滑、疫情反复等因素影响下,前三季度同样一直承受着不小的压力,AVC数据显示,202…

【面试官说实现一个顺序表,但听到要求后我沉默了】

在很多人心里,顺序表是数据结构最基础最简单的东西了,如果面试让我们手撕一道顺序表,相信大家心里早就乐开了花,但是面试官真的会出这么简单的题吗? 答案是:当然会,哈哈。 我们来看看面试官的要…

【精选】ARMv8/ARMv9架构入门到精通-[前言]

快速链接: . 👉👉👉 个人博客笔记导读目录(全部) 👈👈👈 付费专栏-付费课程 【购买须知】: 【精选】ARMv8/ARMv9架构入门到精通-[目录] 👈👈👈 想不想一夜暴富&#xf…

python基于PHP+MySQL的高校公选课管理信息系统

随着我国教育质量提高,在校大学生的数量也在不断的增长。相对应的如何让学生根据自己的兴趣爱好进行在线选课,从而有目的的对学生进行培养,也是当前很多高校教务人员所关心的问题。能够让更多的大学生进行在线自主选课,选择自己所喜欢的课程和教师,我们开发了高校公选课管理系统…

强化学习论文分析3---蜂窝网络联合频谱和功率分配的深度强化学习--《Deep Reinforcement Learning for ......》

目录一、研究内容概述二、系统目标与约束1.系统描述2.系统目标三、DQN、DDPG网络设计四、性能表征本文是对论文《Deep Reinforcement Learning for Joint Spectrum and Power Allocation in Cellular Networks》的分析,若需下载原文请依据前方标题搜索,第…