云韧性,现代云服务不可或缺的组成部分

news2025/1/12 5:53:51

韧性,一个物理学概念,表示材料在变形或者破裂过程中吸收能量的能力。韧性越好,则发生脆性断裂的可能性越小。

如今,韧性也延伸到企业特质、产品特征等之中,用于形容企业、产品乃至服务的优劣。同样,随着云计算在全球范围内的普及与应用,云计算的韧性亦十分重要。所谓云韧性,即云应用程序抵御中断或从中恢复的能力,包括与基础设施、依赖服务、错误配置、网络问题和负载激增相关的中断。

毫无疑问,云韧性既是云服务商众多服务中的重要组成部分,也是云服务商自身技术能力的体现,更是用户选择云服务的关键参考标准。近期,全球云服务故障频发,更是引起众多用户对于云韧性的关注。作为全球云计算市场的头牌,亚马逊云科技如何看待云韧性的重要性?如何建设和实践自身的云韧性?云韧性未来有哪些关键趋势?

近日,在亚马逊云科技《2024亚马逊云科技云端韧性之道》沟通会上,亚马逊云科技揭秘了这一切。

云韧性都体现在哪些方面

IDC认为,在数字化的世界中,韧性是指利用数字化迅速适应业务中断的能力,不仅可以快速恢复业务运营,还可以利用变化情况通过创新寻找新的商业机会。

在快速变化的市场环境中,企业通常希望云服务具备出色业务连续性。尤其是随着企业的业务变得愈发复杂之际,当变化、故障或者风险发生时,企业更加希望云韧性来保障自身业务不受影响。

那么,一家云服务商的云韧性主要体现在哪些方面?在亚马逊云科技大中华区解决方案架构总经理代闻看来,云韧性主要包括基础设施、系统架构和运营机制三个方面来实现。例如,像数据中心等基础设施发生的锂电池着火事件,在现实中很难避免,一旦发生可能就会造成云服务商单点故障的影响范围扩大化。因此,通常云服务商将基础设施布局到多个地理区域,并且通过设置可用区来提升基础设施的可用性,一旦某个基础设施发生故障或者风险能够快速切换。

代闻介绍,云服务韧性的建设并非是一次性工作,而是一个持续的过程,并且需要业务需求、可靠性、成本和系统复杂度之间找到平衡点。亚马逊云科技在其云服务的设计与实现中,始终将韧性作为核心考量因素之一。

具体来看,在基础设施方面,亚马逊云科技在全球34个地理区域部署108个可用区,包括在中国大陆的北京和宁夏两大区域,每个区域均包含三个或更多独立电力、制冷及物理安全设施的可用区,且这些可用区之间距离适中,约同一区域内的可用区之间的物理距离也经过精心计算——通常是100公里以内。可用区的这种隔离机制,既能防止如供电、冷却等常见故障点,也能避免同时受到如地震、洪水等大规模灾害的影响。

“亚马逊云科技在基础设施的冗余、稳定性等方面一直都采用业界最高标准,处于绝对领先。”代闻表示道,“亚马逊云科技在基础设施方面非常重视中国用户的需求。除了国内基础设施之外,考虑到中国企业出海的趋势,亚马逊云科技刚刚在马来西亚新的可用区,在基础设施的选址、设计、网络等均采用极高标准。”

在系统架构设计方面,亚马逊云科技通过四大核心要素——区域隔离与多可用区布局、控制面与数据面的独立设计、单元化架构策略以及随机分片技术,确保云服务的高度稳定性和可用性。其中,区域隔离与多可用区策略依据故障隔离边界将服务精细划分为可用区级、区域级和全球级。

例如,通过将服务的控制面和数据面分离设计,即使控制面发生故障,数据面也能继续运行,这类似于出行系统中的指挥中心与车辆运行的关系。

代闻介绍:“控制面和数据面的隔离,类似于叫车软件和打车,两者其实是相对独立的。当你坐上车以后,如果一段时间叫车软件没有信号无法响应了,也不影响司机将你送到预定的目的地。很多故障失效的情况关键在于没有把数据面和控制面做到很好的隔离。”此外,亚马逊云科技还采用了“单元架构”设计模式,将服务分割为多个独立的单元,每个单元间不共享资源,从而进一步降低了故障发生时的影响范围。

在运营机制方面,亚马逊云科技采取服务责任模型、运营就绪审查、持续安全部署及纠错流程四大模块的核心机制。例如,在发布新服务前,严格的运营就绪性审查流程可保障服务复原力及最佳实践达标,随后通过每周运营会议持续监控性能与潜在问题。又如,纠错流程也很关键,一旦错误发现,如何快速纠错就成为恢复业务的关键能力。亚马逊云科技面对问题,纠错流程迅速启动,通过深入分析根本原因并推动全公司范围内的改进,不仅即时解决问题,还将其转化为未来服务优化的宝贵经验,避难重复错误。

“亚马逊云科技推行DevOps文化,强调开发与运维的紧密联系。通过打破传统开发与运维之间的壁垒,亚马逊云科技提升整体运营效率。此外,亚马逊云科技还提供资源部署、配置管理、性能监控、故障排查等丰富的自动化工具来支持运营机制的实施”代闻表示道。

用云韧性真正去赋能用户

作为云计算的领头羊,亚马逊云科技已经积累了丰富的云韧性建设经验,并且基于不断积累的经验开发出韧性系统建设生命周期框架,包括设定目标、设计和实施、验证和测试、持续运营以及响应和改进,通过正向循环,不断强化自身晕韧性,以应对不断变化的环境和需求。

毫无疑问,当前的市场中,结构性不确定性正在陡增,错综复杂的外部环境、极速发展的数字化技术浪潮都可能对产业格局带来根本性影响。如何与不确定性共存,甚至在不确定性的市场中保持高韧性、获得逆势成长,这是所有企业都在积极思考的话题。面对市场种种不确定性,企业需要具备“抗击打能力”,能够抵御各种冲击。

因此,亚马逊云科技在积极赋能客户利用“云韧性”提升“云中韧性”。亚马逊云科技致力于不断为客户提供一套全面而深入的架构策略、高效运营的最佳实践服务、前沿的技术工具以及专业的指导方案,旨在全方位助力客户在云端环境中构建出既稳定灵活,又能够迅速适应各种挑战与变化的韧性应用程序。

例如,客户可以使用 Amazon Resilience Hub 来设置目标,根据这些目标评估韧性状况,并根据Amazon Well-Architected Framework和 Amazon Trusted Advisor 的建议实施改进措施。

奇瑞捷豹路虎是亚马逊云科技赋能客户的典型例子。通过将SAP 系统迁移至亚马逊云科技上,利用亚马逊云科技独有的一个区域三个可用区特性,以及特有的自适应跨可用区高可用集群进行整体切换,实现高可用和同城灾备融合,最大限度地减少了停机时间和保障零数据丢失,故障切换时间从半小时缩短至 3 分钟。

“Everything fails all the time”(故障总在情理之中、意料之外)。亚马逊云科技将持续为客户提供广泛、深入的架构及运营最佳实践服务、工具和指导,帮助客户在云中构建和运行韧性的应用程序。”代闻最后表示道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2150530.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3. Internet 协议的安全性

3. Internet 协议的安全性 (1) 常用网络协议的功能、使用的端口及安全性 HTTP协议 功能:用于从服务器传输超文本到本地浏览器。端口:默认是80端口。安全性:不提供数据加密,存在数据泄露和中间人攻击风险。使用HTTPS协议(443端口)可以增强安全性。FTP协议 功能:实现文件的…

电脑录课软件哪个好用,提高教学效率?电脑微课录屏软件推荐

在当今这个数字化时代,教育领域也迎来了翻天覆地的变化。随着远程教学和在线学习的普及,教师们开始寻求更高效、更便捷的教学工具来提升教学质量和学生的学习体验。电脑录课软件,作为现代教育技术的重要组成部分,能够帮助教师轻松…

【CPP】类与继承

14 类与继承 在前面我们提到过继承的一些概念,现在我们来回顾一下 打个比方:在CS2中我们把玩家定义为一个类 class 玩家: 血量:100阵营(未分配)服饰(未分配)位置(未分配)武器(未分配)是否允许携带C4(未分配)是否拥有C4(未分配) 当对局创建时,会新生成两个类,这两个类继承自&qu…

【Linux庖丁解牛】—Linux基本指令(上)!

🌈个人主页:秋风起,再归来~🔥系列专栏: Linux庖丁解牛 🔖克心守己,律己则安 目录 1、 pwd命令 2、ls 指令 3、cd 指令 4、Linux下的根目录 5、touch指令 6、 stat指令 7、mkdi…

LabVIEW提高开发效率技巧----采用并行任务提高性能

在复杂的LabVIEW开发项目中,合理利用并行任务可以显著提高系统的整体性能和响应速度。并行编程是一种强大的技术手段,尤其适用于实时控制、数据采集以及多任务处理等场景。LabVIEW的数据流编程模型天然支持并行任务的执行,结合多核处理器的硬…

OrCAD使用,快捷键,全选更改封装,导出PCB网表

1 模块名称 2 快捷键使用 H: 镜像水平 V:镜像垂直 R: 旋转 I: 放大 O: 放小 P:放置元器件 W: 步线 B: 总线(无电气属性) E: 总线连接符(和BUS一起用&#xff09…

【网络通信基础与实践第四讲】用户数据报协议UDP和传输控制协议TCP

一、UDP的主要特点 1、UDP是无连接的,减少了开销和发送数据之前的时延 2、UDP使用尽最大努力交付,但是不保证可靠交付 3、UDP是面向报文的。从应用层到运输层再到IP层都只是添加一个相应的首部即可 4、UDP没有拥塞机制,源主机以恒定的速率…

基于JAVA+SpringBoot+Vue的学生干部管理系统

基于JAVASpringBootVue的学生干部管理系统 前言 ✌全网粉丝20W,csdn特邀作者、博客专家、CSDN[新星计划]导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末附源码下载链接🍅 哈…

力扣题解2376

大家好,欢迎来到无限大的频道。 今日继续给大家带来力扣题解。 题目描述(困难): 统计特殊整数 如果一个正整数每一个数位都是 互不相同 的,我们称它是 特殊整数 。 给你一个 正 整数 n ,请你返回区间 …

【Python报错已解决】SyntaxError invalid syntax

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 专栏介绍 在软件开发和日常使用中,BUG是不可避免的。本专栏致力于为广大开发者和技术爱好者提供一个关于BUG解决的经…

锐尔15注册机 锐尔文档扫描影像处理系统15功能介绍

锐尔文档扫描影像处理系统是一款全中文操作界面的文件、档案扫描及影像优化处理软件,是目前国内档案数字化行业里专业且优秀的影像优化处理软件。 无论是从纸质文件制作高质量的影像文件,或是检查已经制作好的影像文件,锐尔文档扫描影像处理…

Generative Models from the perspective of Continual Learning【小白读论文】

摘要: 本文在持续学习情况下评估各种生成模型。 本文研究了几种模型如何学习和遗忘,并考虑了各种持续学习策略:回放、正则化、生成重放和微调。 我们使用两个定量指标来估计生成质量和记忆能力。 我们在三个常用的持续学习基准(MN…

RabbitMQ08_保证消息可靠性

保证消息可靠性 一、生产者可靠性1、生产者重连机制(防止网络波动)2、生产者确认机制Publisher Return 确认机制Publisher Confirm 确认机制 二、MQ 可靠性1、数据持久化交换机、队列持久化消息持久化 2、Lazy Queue 惰性队列 三、消费者可靠性1、消费者…

新媒体运营

一、新媒体运营的概念 1.新媒体 2.新媒体运营的五大方向 用户运营 产品运营 。。。 二、新媒体的岗位职责及要求 三、新媒体平台

【redis-01】redis基本数据类型和使用场景

redis系列整体栏目 内容链接地址【一】redis基本数据类型和使用场景https://zhenghuisheng.blog.csdn.net/article/details/142406325 redis基本数据类型和使用场景 一,redis基本数据类型和使用场景1,String数据类型2,Hash数据类型3&#xff…

嵌入式linux系统中rk3588芯片引脚基本操作

第一:开发板中linux系统对应设备节点 进入用户 LED 设备文件夹: 1cd /sys/class/leds/usr_led该目录下的文件分别为 brightness、device、max_brightness、power、subsystem、trigger 和 uevent,需要注意的是 brightness、max_brightness 以及 trigger 文件,这三个文件都是…

共享单车轨迹数据分析:以厦门市共享单车数据为例(五)

先来聊聊啥是共享单车电子围栏? 共享单车电子围栏是一种基于地理位置技术的虚拟边界,用于管理和规范共享单车的停放和使用。这种技术通过在地图上划定特定区域,帮助用户了解哪些地方可以停车,哪些地方不能停车,从而减…

网关登录校验(2)----网关如何将用户信息传递给微服务

1.微服务获取用户信息 现在,网关已经可以完成登录校验并获取登录用户身份信息。但是当网关将请求转发到微服务时,微服务又该如何获取用户身份呢? 由于网关发送请求到微服务依然采用的是Http请求,因此我们可以将用户信息以请求头…

【数据结构】假设二叉树采用二叉链表存储,编写一棵二又树中序遍历的非递归算法。

编程题: 假设二叉树采用二叉链表存储,编写一棵二又树中序遍历的非递归算法。 分析: 算法描述: 非递归中序遍历二叉树的算法使用栈来辅助实现。首先,从根节点开始,沿着左子树不断向下, 将每个节点压入栈中。当到达最左端节点后,开始出栈并访问节点,接着转向右子树,重…

【Kubernetes知识点】HPA如何控制不同的资源实现自动扩缩容?

【Kubernetes知识点】HPA如何控制不同的资源实现自动扩缩容? 目录 1 概念 1.1 什么是HPA1.2 Deployment 与 HPA 的关系 1.2.1 工作原理 1.3 StatefulSet 与 HPA 的关系 1.3.1 工作原理 2 实验案例:HPA 控制 StatefulSet 进行扩缩容 2.1 部署一个有状态…