网络弹性基础知识和实践

news2024/10/5 8:52:10

什么是网络弹性

弹性是网络处理中断并继续以可接受的标准向用户提供服务的能力。网络运营可能会受到配置错误、断电或操作员错误等问题的威胁。当这种可能性发生时,最终用户无法访问网络,从而对组织产生负面影响。高度弹性的网络可以通过在网络运行中断时恢复网络操作来防止这种情况。

  • 弹性网络在现代 IT 组织中的重要性
  • 冗余与弹性
  • 如何规划停机时间
  • 提高网络弹性的 7 个技巧
  • 使用工具监控网络弹性

弹性网络在现代 IT 组织中的重要性

现代 IT 组织中几乎没有停机的余地。Gartner计算出,一个组织每停机一小时就会损失约300万美元,还有其他研究发现这个数字是保守的。停机在两个层面上影响企业:由于业务中断而导致的实际资金损失,然后是经常被忽视的声誉损失;毕竟,人们讨厌看到蓝色错误屏幕或丢失他们输入的所有信息。

为了解决这个问题,公司在其 SLA 中提供了更好的条款;例如,五个 99 的可用性为网络操作提供高达 999.<>% 的正常运行时间。这提供了每天大约一分钟的停机时间。只有通过高度弹性的网络基础设施才能实现如此高的标准。

冗余与弹性

保证网络持续运行的一种方法是进行故障转移。这称为网络冗余。冗余网络具有多个能够执行相同操作的设备。当其中一个出现故障时,另一个将开始工作并恢复其正常的网络操作。

这方面的一个例子是防火墙,这些防火墙与它们所保护的网络有重复的连接。辅助防火墙定期接收来自主防火墙的运行状况报告。当它在一段时间内没有收到报告时,它会假定主数据库已关闭并接管其功能。次级设备假定主设备关闭并发挥其功能所花费的时间称为交叉。

虽然冗余是防止停机的严肃方法,但弹性更加微妙。它涉及恢复网络操作,而不是直接替换它们。网络每天都会遇到很多大大小小的问题。为所有这些计划冗余既困难又昂贵。我们可以通过减少故障识别和解决时间来解决此问题。

在这里插入图片描述

与网络冗余和弹性相关的一些术语:

  • 高可用性:这是一种冗余类型,通过立即切换到故障转移来最大限度地减少停机时间。例如,高可用性路由器经常检查其主要设备的状态。发生故障时,它们会接管操作。
  • 容错:有时,主设备可能出现故障,并且在辅助设备检查其状态并接管之前可能会有延迟。用户在此期间输入的信息可能会丢失。容错系统通过让主设备和辅助系统分担负载来消除这种延迟。两个服务器都检查彼此的状态。当其中一个发生故障时,另一个承担全部负载。这样,即使其操作受到限制,网络也不会完全瘫痪。
  • 复制:网络复制是一种通过将主数据库中的所有数据即时镜像到辅助数据库来实现冗余的方法。主服务器和辅助服务器将同步,数据丢失将降至最低。
  • 单点故障:该术语是指网络中可能中断其整个操作的漏洞。这可以是放置网络的防火墙,也可以是负载平衡器,也可以是将其连接到WAN的电缆线。网络管理员应尝试消除单点故障。

如何规划停机时间

停机通常有三个原因。已知原因是您知道并计划的原因。维护和升级属于此类别。您可以安排这些,以便它们不会以任何主要方式影响网络操作。

然后是已知的未知原因。这些原因不是有预谋的,但您确实知道当它们发生时在哪里寻找答案以及如何解决它们。这包括配置错误、人为错误、设备故障或网络中断。您必须快速找到问题的原因并纠正它。

最后,还有未知的未知数。这些是您无法控制的事件,例如飓风、洪水、雷击或人为灾难。处理未知未知的最佳方法是将数据存储在多个站点、云存储或数据中心中。

提高网络弹性的技巧

使网络能够防止停机是很困难的,即使完全遵循标准和准则,也可能存在一些管理员无法避免的问题。话虽如此,做好准备总是有帮助的。在此处列出了一些提示和措施,管理员可以遵循这些提示和措施来提高网络基础结构的弹性。

  • 在组织的所有级别实现冗余:冗余通常是提高网络弹性的最佳方式。您可以在组织的不同级别实现冗余,以最大程度地减少中断。在机器级别,这可以是冗余处理器、操作系统和数据备份。在设备级别,这是指单点故障设备(如路由器)或对网络操作至关重要的设备(如某些服务器)的冗余。通过数据中心或云存储在站点级别实现冗余 - 即使发生大规模停电或自然灾害,也能保证持续的网络运行。
  • 消除单点故障:无论您的安全措施多么先进,单点故障都可以将其全部摧毁。单点故障通常可以意外发现。例如,我们已经看到与网络防火墙的冗余连接通过同一条线路进入建筑物。这些电缆中的一些中断可以一举消除主防火墙和冗余防火墙。使用负载平衡器的容错系统也可能发生故障,因为负载平衡器通常是单点故障。您需要分析网络中的单点故障,并想出消除它们的方法。
  • 确保恒定供电: 停电可能随时发生,可能持续不可预见的时间,并可能完全中断您的网络运营。因此,发电机和不间断电源是一项不错的投资。您需要在维护操作期间定期检查不间断电源设备,以查看它们是否正常工作。安装备用发电机也是一个好主意,以防主设备在中断期间出现故障。
  • 执行定期升级和维护:定期升级和维护是健康的弹性网络的关键部分。如果不进行定期升级,您的软件可能会变得不受支持,并使您的运营面临风险。必须对路由器和交换机、操作系统、关键软件和反恶意软件等设备的固件进行定期升级。还需要定期进行计划维护,以保持设备处于最佳状态并平稳运行。
  • 测试备份:最好在维护操作期间检查数据备份,以查看数据是否已备份且安全。发现您的备份在发生中断后不起作用是一种非常令人沮丧的体验,可以很容易地避免。根据存储数据的性质,可以更改备份频率。应更频繁地备份关键数据,以减少数据丢失的可能性。备份也应存储在远程数据中心,以防止由于火灾或其他灾难而丢失备份。
  • 确保适当的冷却:设备在运行时会产生大量热量。冷却系统用于将其温度保持在可控的水平。拥有一个可靠的独立冷却系统,可以在停电或自然灾害(如大雨或洪水)期间运行,这是绝对必要的。
  • 遵循重要文件的正确命名约定:人为错误通常是由意外删除重要文件或密钥引起的。可以通过组织内适当的命名约定来避免这种情况。为重要文件启用软删除功能也有助于还原它们。

监控网络弹性的工具

使用网络监控工具监视网络是保护网络免受停机影响的最安全选择。这样管理员可以及早发现网络问题并主动修复它们。OpManager是一种网络监控工具,可监控网络中的所有组件,并生成有关任何差异的实时警报。对网络的这种深入可见性肯定会有所帮助。但是OpManager通过其先进的故障识别和解决功能,在提高网络弹性方面更进一步。

  • 自适应阈值:OpManager的ML支持的自适应阈值通过消除误报和警报洪水来帮助您优化故障排除。OpManager在为期三天的培训期内研究您的正常网络性能,然后设置每小时阈值以适应您当时的网络活动。
  • 自动化工作流程:通过自动执行基本故障排除操作来提高网络弹性。您可以为重新启动已停止的服务、清除冗余警报、检查设备是否响应以及执行脚本等操作创建工作流。
  • 根本原因分析:如果发生中断,管理员必须尽快找出导致中断的原因。OpManager的根本原因分析配置文件可帮助管理员关联多达20个实体的数据,以追踪中断背后的根本原因。

OpManager 提供全面的网络监控功能,可帮助管理员监控网络性能,实时检测故障隐患,保障业务系统高效运行。并且拥有强大的实时可视化监控功能,让管理员获得对整个网络基础架构的完全可见性和性能控制。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/495542.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

chatgpt官网拒绝访问怎么处理-chatGPT入口正确打开方式

chatgpt官网拒绝访问的原因有哪些 OpenAI是一家人工智能技术公司&#xff0c;其官网是OpenAI最重要的宣传与交流平台之一。但是&#xff0c;有时访问OpenAI官网可能会受到限制或拒绝访问。以下是可能导致OpenAI官网拒绝访问的几个常见原因&#xff1a; IP地址被封锁: OpenAI网…

【Python】只需2行代码,轻松将PDF转换成Word(含示范案例)

文章目录 一、前期准备二、pdf2docx功能三、限制四、案例 一、前期准备 可将 PDF 转换成 docx 文件的 Python 库。该项目通过 PyMuPDF 库提取 PDF 文件中的数据&#xff0c;然后采用 python-docx 库解析内容的布局、段落、图片、表格等&#xff0c;最后自动生成 docx 文件。 …

LFU缓存结构算法

设计LFU缓存结构 LFU&#xff1a;最近最少频率使用 基本思想&#xff1a; 当缓存满时&#xff0c;加入新数据&#xff0c;淘汰缓存中使用次数最少的key&#xff0c;当使用次数最少的key有多个&#xff0c;删除最早调用的key。 定义节点的数据结构 class Node{//使用频率int …

从零开始学习Linux运维,成为IT领域翘楚(八)

文章目录 &#x1f525;Linux进程管理&#x1f525;ps&#x1f525;top&#x1f525;htop &#x1f525;Linux进程管理 &#x1f525;ps 查看系统中所有进程 语法&#xff1a; ps [options] [--help]参数&#xff1a; &#x1f41f; -a 显示所有进程&#xff08;包括其他用…

Windows Server 安装docker

在windows 10 或windows 11 上使用docker&#xff0c;可以直接在docker 官网下载docker desktop安装即可。 但在windows server上则无法支持docker desktop&#xff0c;此时可通过如下方式安装&#xff1a; 以 管理员权限运行Power Shell&#xff0c;然后执行&#xff1a; 安装…

微软骚操作恶心Win10用户,上网得先看广告

IE 浏览器在几个月前被彻底禁用&#xff0c;预装了快30年的老古董也确实到了退役的时候。 而微软也早有准备&#xff0c;2015年随着 Win10 发布推出了 Microsoft Edge 浏览器。 2020年迁移到 Chromium 内核让其成为了主流浏览器之一。 和 Chromium 系其他浏览器一样支持扩展插…

【计算机视觉 | 自然语言处理】BLIP:统一视觉—语言理解和生成任务(论文讲解)

文章目录 一、前言二、试玩效果三、研究背景四、模型结构五、Pre-training objectives六、CapFilt架构七、Experiment八、结论 一、前言 今天我们要介绍的论文是 BLIP&#xff0c;论文全名为 Bootstrapping Language-Image Pre-training for Unified Vision-Language Understa…

Node.js 的安装

node.js 通用的安装方式&#xff08;单版本&#xff09; Node.js 可以用不同的方式进行安装。 第一种&#xff0c;可以在官网中&#xff0c;根据自己的操作系统&#xff0c;选择对应的安装包。 打开官网网址&#xff08;Download | Node.js&#xff09; 第二种&#xff0c;就…

php+vue网盘系统的设计与实现

该网盘系统的开发和设计根据用户的实际情况出发&#xff0c;对系统的需求进行了详细的分析&#xff0c;然后进行系统的整体设计&#xff0c;最后通过测试使得系统设计的更加完整&#xff0c;可以实现系统中所有的功能&#xff0c;在开始编写论文之前亲自到图书馆借阅php书籍&am…

吉时利Keithley6430/6485/6487皮安表测试软件NS-SourceMeter

软件概述 NS-SourceMeter皮安表上位机软件用于实现吉时利皮安表的上位机控制功能&#xff0c;通过在软件上的相应操作&#xff0c;控制皮安表进行配置或者测量&#xff0c;同时可以对测量的数据和图形进行保存。NS-SourceMeter皮安表软件由计算机和皮安表组成&#xff0c;通过计…

026 - C++ 可见性

本期我们讨论 C 的可见性。 可见性是一个属于面向对象编程的概念&#xff0c;它指的是类的某些成员或方法有多可见。 我说的可见性是指&#xff0c;谁能看见它们&#xff0c;谁能调用它们&#xff0c;谁能使用它们等这些内容。 可见性是对程序实际运行方式完全没有影响的东西…

Linux驱动开发:platform总线驱动

目录 1、为什么需要platform总线 2、设备端&#xff1a;platform_device 2.1 platform_device结构体 2.2 注册 2.3 注销 3、驱动端&#xff1a;platform_driver 3.1 platform_driver结构体 3.2 注册 3.3 注销 4、总线 4.1 bus_type 4.2 platform_bus_type 5、匹配…

2023第二届中国汽车碳中和国际峰会

会议背景 随着世界越来越认识到气候变化的破坏性影响&#xff0c;政府、组织和个人正在采取行动减少导致全球变暖的温室气体排放。随着电动化和互联技术的发展&#xff0c;汽车产业价值链正在经历变革。 汽车价值链的转型还为汽车行业创造了许多脱碳和更具可持续性的新机会。 …

vue3-admin-template页面

vue3-admin-template 本人学习视频网址为&#xff1a;视频地址源码:github 网页采用技术框架 本管理模板采用vue3开发&#xff0c;使用vue-router来作为路由跳转&#xff0c;将登录成功后产生的菜单&#xff0c;token放入到vuex中存储&#xff0c;通过axios来进行交互&#x…

深入理解 spring-boot-starter-parent

目录 一、前言二、Maven继承三、分析spring-boot-starter-parent四、Maven单继承问题五、不继承spring-boot-starter-parent需要注意的 一、前言 在idea当中创建springboot项目的时候都会继承一个spring-boot-starter-parent作为父类&#xff0c;假如不继承我们的项目就不能使…

Hudi的介绍与安装编译

Hudi的介绍 安装Maven 编译Hudi 执行编译 Hudi的介绍 Hudi简介 Hudi&#xff08;Hadoop Upserts Delete and Incremental&#xff09;是下一代流数据湖平台。Apache Hudi将核心仓库和数据库功能直接引入数据湖。Hudi提供了表、事务、高效的upserts/delete、高级索引、流摄取…

CentOS 7(2009) 升级 GCC 版本

1. 前言 CentOS 7 默认安装的 gcc 版本为 4.8&#xff0c;但是很多时候都会需要用到更高版本的 gcc 来编译源码&#xff0c;那么本文将会介绍如何在线升级 CentOS 的 gcc 版本。 2. 升级 GCC (1). 安装 centos-release-scl&#xff1b; [imaginemiraclecentos7 ~]$ sudo yum…

docker-compose搭建skywalking

SkyWalking 架构图 架构组成 SkyWalking Agent &#xff1a;负责从应用中&#xff0c;收集链路信息&#xff0c;发送给 SkyWalking OAP 服务器。目前支持 SkyWalking、Zikpin、Jaeger 等提供的 Tracing 数据信息。而我们目前采用的是&#xff0c;SkyWalking Agent 收集 SkyWalk…

测试知识总结

1.影响ui自动化稳定性 异常弹出对话框 --异常场景库 页面控件元素属性的细微变化--模糊匹配 延迟 --- retry 数据 -- 数据已被使用 2. 移动端应用细分为三大类&#xff1a;Web App、Native App&#xff08;原生应用&#xff09; 和 Hybrid App&#xff08;混合应用&…

Yjs + quill:快速实现支持协同编辑的富文本编辑器

大家好&#xff0c;我是前端西瓜哥&#xff0c;这次来看看 Yjs 如何帮助我们实现协同编辑能力的。 Y.js 是一个支持 协同编辑 的开源库。只要我们将自己的数据转换为 Y.js 提供的 Y.Array、Y.Map 类型&#xff0c;Y.js 就会自动帮我们做数据的一致性处理和同步。 一致性问题 …