在过去的几年里,显而易见的是,尽管公有云具有所有优势,但它并不能大规模地节省成本。它在一定程度上提高了生产力,但不会降低您的成本。公有云的好处在于,它提供了一个非常强大的价值主张,即基础设施可以立即使用,而且规模恰到好处,从而提高了运营和经济效率。云还有助于培养创新,因为公司资源被释放出来,可以专注于新产品和增长。但是,仅仅与数据交互的行为就会产生出口成本,这已被证明是极其掠夺性的。当应用程序和工作负载是持久的、一致的和数据密集型的(高容量/速度/各种读写调用)或涉及高性能分析时尤其如此 - 随着它们的增长,它们在公共云中是不可持续的。
“…随着云计算行业经验的成熟,我们看到了云生命周期对公司经济状况的更全面了解,越来越明显的是,虽然云计算在公司发展的早期就明确兑现了承诺,但随着公司规模的扩大和增长的放缓,它对利润率的压力可能会开始超过收益。 安德森-霍洛维茨,2021 年这一观点虽然非常有先见之明,但却是在 2021 年拍摄的。到 2024 年,数据有所增长(根据 2022 年的 IDC 研究,平均每年 ~20%),工作负载变得更大,规模已成为问题。不是扩展技术,而是在公共云中扩展的成本。根据 David Linthicum 的说法,公共云被“踢到路边”的主要原因有 3 个:
成本 - 对于某些工作负载,在云中运行它们的成本太高。在过去的几年里,商品硬件价格已经下跌,硬件不再像以前那样巨大的资本支出。
失败的迁移 - 未以最佳方式重构或调整为云原生的工作负载最终成本是最初预计成本的 ~2.5 倍。事实证明,本地低效的应用程序在云中效率低下。让它们更有效率的成本太高,最终不值得。
需求减少 - 最初需要快速高效启动并能够扩展的应用程序已经在云中扩展,但现在只是一台重复性任务和数据存储的机器。这些应用程序不再受益于云可以提供的快速可扩展性,现在只是使用大量昂贵的存储。不再需要灵活、快速扩展的模型。硬件的商品化为运行这些工作负载提供了一种新的、经济高效的方式。根据巴克莱最近对首席信息官的调查,许多首席信息官都同意这一点。
来自同一篇 a2z 文章——
“2017年,Dropbox在其S-1中详细说明了在IPO前两年的累计节省,这要归功于其基础设施优化大修,其中大部分需要从公共云中转移工作负载。
当您的云成本开始徘徊在收入成本的 50% 或更多(如 Asana、Datadog、Prerender.io 等)左右时,是时候开始查看您的工作负载在公有云中执行了哪些操作。组织和业务领导层需要意识到这一点,以便他们能够进行调整。某些工作负载(例如运行数据分析多维数据集、内存中数据库或数据分析群集)更适合本地基础结构。但这些只是几个例子。
为了关注将受到此规模问题影响的特定趋势,让我们看一下 AI/ML,特别是 LLMs (大型语言模型)。如果您当前的 AI 计划需要构建自己的LLM模型或基础模型,请考虑在公有云中执行此操作的缺点:
1 . 规模成本高 - 大规模培训和运行LLMs成本高昂,而且随着LLM规模越来越大,公有云的成本也在增加
2 . 失去控制 - 您对实施、基础架构和性能的控制和可见性较低
3 . 供应商锁定 - 如果您在一个云平台上接受过培训LLMs,则很难移植到其他平台。此外,仅依赖单一云提供商会带来固有风险,尤其是在政策和价格波动方面。
4 . 数据隐私和安全 - 我还要在这里提到数据主权。最重要的是,您将数据信任给服务器遍布全球的提供商。
如果您的企业正在处理 PB 级或趋向于这种规模,那么私有云的经济优势更大。是的,这意味着建设基础设施(或从像 Equinix 这样的公司租赁),包括房地产、硬件、电力/冷却,但经济效益仍然非常有利。公有云是学习云原生方式和访问云原生应用程序组合的绝佳场所,但它并不是一个扩展的绝佳场所。
经济学的一个例子
那么,什么是经济学呢?为了说明这一点,让我们以一个 10PB 的现代数据湖为例,该数据湖使用 Kubernetes 来管理 Apache Spark 和 Dremio,以实现持久且一致的分析工作负载。这些类型的工作负载需要频繁地从对象存储读取和写入数据,以进行分析、更新和刷新以及显示。从成本结构的角度来看,我们将对主要成本动因使用一些假设:
-
如果我们不能使用数据,这些数据湖和工作负载的效用就会受到限制。这些数据提供见解,为其他应用程序提供服务,并且可能需要在存储环境之外进行处理。这需要将数据从存储中传输出来。如果我们假设每月访问500TB,则仅占每月访问数据的5%。
-
对于数据/对象请求(PUT、GET、HEAD 等),我们与具有类似一致和持久性工作负载的客户合作,这些客户每月看到超过 10b 个对象请求。因此,我们可以使用 10b 作为此类工作负载的保守假设。
-
同样,这些客户看到这些对象的加密请求数量大致相同,因此在我们的示例中再次使用 10b 作为保守假设。
有了这些假设,公有云的成本可能如下所示:
COST DRIVER | ANNUAL COST |
---|---|
STORAGE (STANDARD, NO TIERING, NO DISCOUNT) | $2.6M ($0.022/GB/MO) |
Data Transfer/Egress | $354k |
Object Requests | $648k |
Object Encryption | $3.6m |
Support (5%) | $130k |
10PB 的年度公有云成本 = $7.3m 或 $0.061/GB/月
上面的假设就是这样,有这么多的事实告诉你,根据特定的使用情况和工作负载因素,成本的可变性有多大。这给尝试预算带来了重大挑战。此外,没有分层或任何数据生命周期活动的情况也很少见,因为如果数据变得不那么“活跃”,组织通常会将数据移动到较冷的层。但所有这些都只会增加成本,因为不同的层每月每 GB 的价格不同,以及自动将对象移动到这些层的成本。
MinIO 允许您使用与公有云相同的技术在私有云(colo 或数据中心)上进行扩展:S3 API 兼容对象存储、密集计算、高速网络、Kubernetes、容器和微服务。一个主要区别是对象请求(GET、PUT等)没有成本,只要基础设施支持,请求数量也没有任何限制。此外,MinIO Enterprise 和 Community 版本中包含加密功能,并且对请求的加密对象数量没有限制。
这种可选性提供了运营成本、灵活性和控制的理想组合。诚然,您将承担硬件的资本支出,但通过从小处着手并利用关键的云经验教训(弹性、按组件扩展、将计算与存储分离),企业可以最大限度地减少初始支出并最大限度地节省运营成本。
当与商用硬件配对并在 colo 或专有数据中心运行时,MinIO 可以将这些公共云成本(以及与管理这些云成本相关的成本)降低 50% - 70%,在某些情况下甚至更高。
Cost Driver | Public Cloud Annual Cost | MinIO Annual Cost |
---|---|---|
Storage | $2.6m (Standard, No Tiering, No Discount) | $1.3M MinIO Enterprise License(10PB Usable Capacity) |
Data Transfer/Egress | $354k | $0 |
Object Requests | $648k | $0 |
Object Encryption | $3.6m | $0 |
Support (5%) | $130k | $0 |
Commodity Hardware | n/a | $200k (All NVMe storage, 10PB @$0.10/GB)$1.0M amortized over 5 years |
Colo Costs | n/a | $200k (interconnect, rack, power, maint.,etc.) |
10PB 的年度 Colo/MinIO 成本 = 每年 1.7 美元,或每 GB/月 0.014 美元
与公有云相比,这相当于 10PB 存储的存储成本降低了 ~77%。即使对于较小的存储容量需求(200TB - 2PB),节省的成本也值得探索。更不用说您可以获得业界最佳的存储性能、用于存储桶级安全性的内置防火墙、专为对象存储设计的可观测性,以及许多其他增值功能,这些功能在公有云中会花费您额外的费用。
资源因素
另一个值得快速分析的因素是资源(人类)。我们从客户那里听说,管理公有云基础设施所需的资源数量可能在 5-10 个 FTE 之间,具体取决于云基础设施的规模。这包括云工程师、云团队负责人、DevOps 工程师和云项目经理。 使用 Glassdoor 的工资范围和中位数,这些 FTE 成本的范围从每年 70 万美元到 1.5 美元不等,满载而归。
我们还从我们的客户那里(在最近的一项调查中,76%)那里了解到,MinIO的关键价值驱动因素之一是其易用性和可管理性。同一项调查发现,其中 60% 的人提到了 MinIO 提高运营效率的能力。
在内部,我们将 MinIO 用于许多不同的工作负载、存储需求、测试等,我们估计 MinIO 可以由 1 个 FTE - 3 个 FTE 管理 PB+ 基础设施。这允许以最少的资源大规模构建大规模基础设施。
开始
既然您已经了解了私有云的经济效益如何以及为什么起作用,我相信您想知道沿着这条道路开始的步骤是什么。我的同事们已经在这里和这里写过关于这个问题的文章,我建议你的云团队和DevOps团队查看这些博客,了解从公共云迁移的细节。
我们已经看到数十家客户使用商用硬件和他们自己的数据中心或 colo 遣返他们的数据,并从 MinIO 的高性能、简单的对象存储解决方案中实现了一些真正的节省和收益。
如上所述,通过将数据遣返到数据中心或托管服务中自己的硬件中,企业可以实现显著的成本节约,超过其现有隐含年度公有云 S3 账单的 50%。在上述情况下,只需 10PB,您的企业可以在未来五年内节省约 650 万美元。
事情的真相是,公共云在规模上成本过高。公有云固有的弹性使得在那里扩展看起来很有吸引力,但从经济角度来看,这几乎总是错误的选择。对于像 AI/ML 这样的数据密集型任务尤其如此,在这些任务中,公有云的成本和失控可能非常可观。随着数据规模的扩大,采用 MinIO 的私有云解决方案在经济上变得更胜一筹,以更低的成本提供同等(可以说是更好)的技术。通过利用商用硬件和私有云基础设施,与公有云相比,公司可以显著节省成本并实现性能优势,有时高达 70%。我们建议您探索从公有云迁移到您的工作负载,并使用 MinIO 实现关键业务应用程序的现代化和扩展。