来源:虹科云科技
虹科分享丨DevOps 是否已死?AI 和大语言模型给云计算和 DevOps 带来了哪些影响?云计算创新已经从革命性阶段过渡到了进化性阶段,重点在于迁移和重构工作负载。https://mp.weixin.qq.com/s/mx67vqxoEoMLMrbvE-D8_w
关键要点
云计算创新已经从革命性阶段过渡到了进化性阶段,重点在于迁移和重构工作负载。云计算已经发展到可以提供对可伸缩资源和托管服务的按需访问,并重视简化交互和减轻团队的认知负担。
通过降低认知负载和为即时管理、工单系统和代码生成等任务提供支持,人工智能(AI)和大型语言模型(LLMs)可能在云计算和 DevOps 领域发挥重要作用。主要的云计算供应商,如微软、谷歌和亚马逊云科技等,已经将 AI 集成到他们的产品和服务中,充分展示了行业在 AI 技术上的投入。
受基于 AI 和类似 ChatGPT 的产品的影响,低代码和无代码领域开始为业务用户和软件工程团队提供协作机会。平台工程采用了平台即服务的思维方式,正朝着简化和价值交付的方向发展。平台工程团队的角色正在从复杂基础设施的管理者转变为专注于用户满意度和价值创造的服务提供者。对可观察性、财务相关性和可持续性的考量正在成为平台工程不可或缺的部分。
OpenTelemetry 被广泛用于收集指标和基于事件的可观察性数据,成为行业事实上的标准。它的标准化特性促进了供应商之间的优化和创新。
对可持续性和绿色计算的关注推动了架构选择朝着效率和最小化碳足迹的方向发展。站点可靠性工程(SRE)团队在分析环境影响和推动可持续性倡议方面起到至关重要的作用。
趋势图更新
本报告的后面部分会有更多细节,但我们先来总结一下与去年的趋势图相比有哪些变化。
FinOps,即高效管理云成本的实践,正向着早期大众的方向发展。FinOps 基金会和一些云供应商,如微软、AWS 和谷歌,在推动 FinOps 实践的采用,这些实践符合可持续性和优化资源使用的目标。最近,谷歌成为了 FinOps 认证服务提供商,微软也作为首席成员加入了 FinOps 组织。
WebAssembly(Wasm)的持续演进正兑现着在云中实现“一次编写,到处运行”的承诺,提供了不同语言和平台之间的可重用性和互操作性。eBPF(Extended Berkeley Packet Filter)在可观察性和内核级别的安全性等领域受到关注。
我们发现,通用函数即服务(FaaS)和后端即服务(BaaS)的概念在“晚期大众”用户中受到了关注。无服务器技术的采用已经变得普遍。“我们是 100% 无服务器”的说法不再像以前那样令人感到惊讶,因为无服务器已经成为行业采用的主流方法。
云计算是否从革命转向了进化阶段?DevOps 是否已死?
在配套的云计算和 DevOps 趋势播客讨论中,与会者讨论了云创新和 DevOps 的现状。他们一致认为,云创新已经放缓,从“革命”转向了“进化”。虽然大量的组织已经采用了云技术,但还有许多企业想要迁移和重新架构工作负载。
至于 DevOps,它仍然还活着,但在一些组织中已经进入了停滞阶段。DevOps 旨在通过提供自主权来创造业务价值的概念仍然存在,但在实现方面面临着挑战。与会者表达了他们对通过价值流管理来解锁 DevOps 流程和价值实现的兴趣。
公有云供应商已经从他们最初的目标——提供对可伸缩资源的按需访问——转变为更加关注提供托管服务。这种转变使得云计算变得更加普遍。然而,技术围绕着已有的服务在迅速发生变化,新的业务需求和挑战随之涌现。团队必须在不断交付业务价值和采用、更新技术栈之间做出平衡。
InfoQ 首席 DevOps 编辑 Matthew Campbell 说:
企业也想快速演进和适应变化……我们现在处于这样的一个阶段,我们正在试图弄清楚我们如何能够可持续地利用我们发明和创造的所有东西和交互方式,并达到一种我们可以舒适地进行创新的阶段。
此外,云服务现在已经在小型和大型组织中得到了广泛的采用,甚至进入了晚期采用者阶段,而新冠疫情通常是其中的一个驱动因素。例如,自动化配置环境的演进——快速配置完整的开发和测试环境的能力现在已经变得很普遍。然而,弥合开发和运维之间的差距仍然存在挑战。身份和访问管理问题在开发和运维团队之间造成了一个感知上的边界。
AI 和大语言模型给云计算和 DevOps 带来了哪些影响?
与会者讨论了认知过载以及 AI 如何帮助降低认知负载。他们提到了一种特定的 AI 应用,叫作 AIOps,一种专注于 IT 运维的 AI,在即时管理和工单系统方面表现出了有效性。大语言模型提供了实实在在的好处,例如使用 ChatGPT 来验证信息、生成教学笔记、辅助写作和创作。微软已经将 AI 集成到其产品和服务中,展示了其在 AI 技术方面的重大投入。
InfoQ 首席云编辑 Steef-Jan Wiggers 说:
微软提供的很多服务,甚至最近的一些服务,如 Fabric,一个完整的 SaaS 数据湖解决方案,都充分融合了 AI。
Fabric 只是其中的一个例子,其他公有云供应商也推出了 AI 融合服务,如亚马逊的 Sagemaker 和谷歌的 Vertex AI 和 AutoML。想了解有关 OpenAI 的信息,可以关注 InfoQ 的这个主题。
基于 AI 和类似 ChatGPT 的产品给低代码和无代码带来了哪些影响?
将 AI 集成到低代码工具中是一个商业机会,AI 将为业务用户提供安全和有价值的知识。这缓解了人们之前对影子 IT 的担忧,并促进了产品管理和软件工程团队之间的协作。
此外,还有一个叫作“ClickOps”的概念,即用户在低代码平台上能够通过点击实现交互,同时生成可控制版本、声明式和可适应的代码。例如,一些改进了 AI 代码生成能力的工具,如 GitHub Copilot 和 Codeium,可以生成符合组织标准、具有可读性且可以不断演进的代码。大语言模型和 AI 驱动的代码生成能力的演进将为低代码领域带来令人兴奋的改变。
最后,低代码环境中的数据治理和访问管理是必不可少的。它带来了一些挑战,比如在确保适当的治理和合规性的同时,为业务用户提供数据访问能力。Campbell 指出,我们有必要在低代码增强平台工程中建立一个“DevOpsy”治理层,提供安全防护,防止超出某些配置边界。
此外,DevOps Institute 的 DevOps 战略顾问 Helen Beal 补充说:
我觉得很有趣的是,我们正处在一个转弯处,因为 AI 实际上是在支持商业人士,为他们提供可能是安全的知识。
平台工程将如何演进?
平台工程的演进涉及向简化、关注价值交付和采用平台即服务思维方式的转变。这种变化涉及提供自助式平台、隐藏复杂性并减少应用程序开发者的认知负担。平台工程团队的角色正在从复杂基础设施的维护者转变为对组织其他部分提供服务的服务提供者。他们现在专注于处理与开发者关系、营销和客户参与度相关的问题,提升用户体验和驱动价值创造。
Syntasso 首席工程师 Abby Bangser 解释说:
平台工程团队正在研究开发者关系和营销应该是什么样子的,研究如何与客户互动、获取反馈并制定能够满足他们需求的路线图。
一些技术,如 Kubernetes,正在被推到更底层的技术栈,开始越来越注重 API 接口和简化交互。此外,对可观察性的关注度也在提升,包括服务水平和关键性能指标,以及与平台使用和成本合理性相关的财务指标。总体而言,平台工程的未来在于构建能够增加价值和为用户创造愉悦体验的平台,同时满足不断变化的业务需求和约束。
想要了解更多关于平台工程的信息,可以关注 InfoQ 的这个话题。
FinOps 是否正在转向早期大众阶段?
FinOps,即有效管理云成本,正在转向早期大众阶段。越来越多的公司加入了 FinOps 基金会,也有许多工具可以支持 FinOps 流程。但需要注意的是,FinOps 不仅仅是工具,它还涉及流程,以及对成本价值的理解。FinOps 基金会和云供应商(如谷歌和微软)积极参与这个过程,并推动 FinOps 实践的采用。
人们对 FinOps 的认知也在发生改变,并引发了关于为什么要配置和运行某些云资源以及它们是否被有效利用的讨论。可持续性和 GreenOps 也与 FinOps 相关,因为成本优化的关注点与资源利用效率的目标是对齐的。AI 在 FinOps 方面发挥了重要作用,它可以识别未使用的数据、帮助优化存储,节省财务成本,提升环保效益。
在构建基于云的应用程序或采用 DevOps 实践时,架构师和开发人员是否面临着过多的安全问题?
架构师和开发人员在构建基于云的应用程序或采用 DevOps 实践时,面临着越来越多的安全问题。特别是开发人员,他们可能会感到左移策略让他们不堪重负,因为他们需要在整个开发过程中识别和优先考虑安全问题。
虽然组织对安全的重要性有了越来越多的认识,也有来自高层的推动力来解决这些问题,但开发人员往往需要在安全需求和交付新功能的压力之间做出平衡。
安全工具的不断演变也是这个领域的一个考量因素。早期的解决方案是由专家为专家而设计的,对开发人员来说不够友好。然而,越来越多的人认识到需要使用更易于访问和使用的安全工具。我们的目标是使安全成为一种赋能功能,构建出能够简化安全实现并为开发团队提供教育和支持的平台。这种方法旨在弥合专家驱动的安全实现和开发人员实际需求之间的差距。
WebAssembly(Wasm)是不是云端“一次编写,到处运行”的最终实现?
Wasm 是实现云端“一次编写,到处运行”愿景的重要一步。它承诺了可重用性和互操作性,允许开发人员用一种语言(如 Go)构建库,并在用其他可以编译为 Wasm 的语言(如 Rust)编写的应用程序中调用它们。
有了这种云端内部的组件模型,我们可以为多个目标平台创建应用程序,包括基于 ARM 架构的 CPU(因其性能和成本优势在云基础设施中颇受欢迎)。Wasm 的采用不仅限于应用程序开发,还涉及了云平台扩展格式。它被用来扩展云原生代理、API 网关和服务网格。
除了 WebAssembly,作为平台组件开发者工具的 eBPF 也受到了关注。虽然应用程序工程师可能不会广泛使用 eBPF,但我们确实可以在包含网络和安全用例的项目中找到它的身影。它允许开发人员访问内核级别的信息,并获得对容器系统操作的见解,提高可观察性和安全能力。
总而言之,WebAssembly 和 eBPF 为提升云应用程序的可移植性、可重用性和性能带来了有趣的可能性。
想要了解更多关于 Wasm 和 eBPF 的信息,可以关注 InfoQ 的相关话题。
OpenTelemetry 在收集指标和基于事件的可观察性数据方面的应用有多广泛?
作为一个收集指标和基于事件的可观察性数据的框架,OpenTelemetry 已经得到了快速的采用,并且正在成为行业事实上的标准。许多有才华的个人和供应商的协作促成了它的跨供应商支持和跨语言兼容性,让它成为应用程序的必要组成部分。OpenTelemetry 的广泛采用主要得益于它被纳入到主要云供应商的产品中,例如亚马逊云科技的 AWS Distro for OpenTelemetry、微软 Azure 的监控服务和谷歌云平台的 Google Cloud OpenTelemetry。
OpenTelemetry 的标准化特性带来了众多好处。它与供应商无关,支持导出遥测数据并利用各种工具对数据进行分析。这种标准化促进了供应商之间的优化和创新,因为他们在努力提供超出数据收集和可视化这些基本功能的高级特性。作为一个开放标准,OpenTelemetry 的出现标志着行业走向成熟,并促进了供应商之间的良性竞争,为行业提供有吸引力的解决方案,并获得市场份额。
想了解更多关于 OpenTelemetry 的信息,可以关注 InfoQ 的这个话题。
当前无服务器技术的采用状况是怎样的?
无服务器技术在采用方面发生了转变,它正在成为一种常见的选择,而不是一种独特的架构概念。“无服务器”这个词不太经常被用来讨论一个独立的概念,因为它几乎变成了一种与托管服务(提供可伸缩性、微计费和抽象化的基础设施)具有相同含义的词。一些主要的云供应商,如亚马逊、谷歌和微软,已经将无服务器组件集成到他们的服务中,例如数据库(DBaaS)和容器运行时(CaaS),带来了自动缩放和简化计费结构方面的好处。人们的关注点已经从基于无服务器函数构建架构转移到利用托管服务,与平台工程方法保持一致,减少开发人员的认知负担。
无服务器的价值,如伸缩至零费用和按请求计费,已经在传统的无服务器架构之外找到了新的表达。组织现在认识到了这些好处,并在各种架构决策中要求使用无服务器。虽然无服务器是获得这些优势的众多方法之一,但组织越来越多地要求他们的工程团队提供成本效益高的解决方案,并优化客户获取和支持成本。这种演变凸显了无服务器对更广泛的架构格局的影响。
想要了解更多关于无服务器的信息,可以关注 InfoQ 的这个话题。
对可持续性和绿色计算的关注对云计算和 DevOps 有怎样的影响?
对可持续性和绿色计算的关注对云计算和 DevOps 的实践产生了重大影响。越来越多的组织采用了关切应用程序和服务对环境和资源消耗的影响的定价模式。这种趋势鼓励组织做出优先考虑效率和可持续性的架构选择。托管服务受到组织的青睐,因为它们提供了优化的资源利用率和可伸缩性,使企业能够降低能耗,减少碳足迹。对架构定价的考量和对托管服务的采用与可持续性和绿色计算目标是对齐的。
关于责任,人们存在一种认识,即解决可持续性问题属于站点可靠性工程(SRE)及相关角色的范畴。这些团队善于分析技术决策对环境的影响,并推动可以促进效率和可持续性提升的举措。现在,架构讨论包含了组件化、隔离、安全和成本效益等方面的考虑。组织正在评估他们的需求,并寻求能够满足安全需求但又不涉及非必要高昂成本的折中解决方案。这反映了组织正在向更加务实的安全性发生转变,试图找到企业级特性和成本效益之间的平衡。
我们对云计算和 DevOps 领域的未来有怎样的预测?
专家们对云计算和 DevOps 领域未来的预测主要与简化、降低认知负担和专注创新有关。我们热切希望能够简化流程和工具,让团队能够专注于他们特定的专业领域并最大化他们的影响力。
AIOps、平台工程、可持续性和 FinOps 的融合是一种积极的转变,可能会让团队更专注、更有效和更愉快。这里的挑战在于要区分炒作和真正的机会,承认新兴趋势中的“价值点”,同时对“过度夸大”和广泛适用性的说法保持批判的态度。
开源技术的采用、由 OpenTelemetry 和 CloudEvents 等促进的标准化,以及 Copilot 和 ChatGPT 等 AI 融合服务的潜力,都是令人感兴趣的点。总而言之,人们对正在发生的演进和它们带来的机会充满了热情。
作者 | Steef-Jan Wiggers, Daniel Bryant 等
译者 |明知山
策划 |丁晓昀
原文链接:https://www.infoq.com/articles/cloud-devops-trends-2023/
本文转载自AI前线公众号