上期跟大家解读了Gartner 成熟度曲线报告,主要分享了影响中国IT使用的4大因素--自主可控计划、AI发展趋势影响、降本增效、IT基础设施现代化程度。新来的朋友点这里,一键了解具体内容。
Gartner 成熟度曲线报告解读(一)| 2024中国IT基础设施使用趋势、影响中国IT使用的4大因素https://eoitek.blog.csdn.net/article/details/142261356
本期主要跟大家分享重点 IT 基础设施技术【Open Telemetry 】,主要包括以下几个方面
OpenTelemetry 是什么?
OpenTelemetry为什么重要?
推动与阻碍OpenTelemetry发展的因素有哪些?
OpenTelemetry使用建议?
话不多说我们往下看。
一、Open Telemetry是什么?
影响力评级 : 较高
市场渗透率 : 目标受众覆盖率为 1%~5%
成熟度 : 成型阶段
OpenTelemetry (OTel)分布式追踪是一个可观测性框架和工具包, 旨在创建和管理遥测数据,如链路、 指标和日志。 重要的是,OTel是供应商和工具无关的,这意味着它可以与各种可观测性后端一起使用, 包括 Jaeger 和 Prometheus 这类开源工具以及商业化产品。我们可以使用它们来检测、生成、收集和导出遥测数据(指标、日志和链路追踪),以帮助分析应用的性能和行为。
二、OpenTelemetry为什么重要?
OTel引入了⼀种便携式方法,用于仪表化、生成、收集和导出有关应用运行状况和性能的遥测数据。该技术改变了应用性能监控( APM )解决方案的评估、部署和采用方式,让我们能够顺着请求链路查询整个分布式系统的问题,并了解复杂的互连系统中发生了什么。目前已获得广泛采用,是 CNCF(云原生计算基金会) 生态系统中发展速度位居第二的项目。
许多软件供应商、云供应商和可观测性工具供应商已在全球范围内推出工具,或宣布支持 OTel 。中国大型企业普遍通过云原生方式部署Kubernetes 。在CNCF生态系统中,中国企业通过云原生环境中的可观测性能力提高系统稳定性。
除此之外,它还有以下优点:
-
跨越应用和服务提供商的边界,可以更深⼊了解应用的运行状况和性能。
-
为不同数据源的数据监控与数据迁移提供了便利。
-
通过实现 “ 一旦仪表化,随时分析 ” ,提高了产品负责人、站点可靠性工程师( SRE )和平台工程师的工作效率。
-
实现了源头和目标之间的遥测编码和交付的标准化。与此同时,随着越来越多供应商遵循OTel协议,进一步提高了应用的可靠性和可扩展性。
三、影响OpenTelemetry发展的因素
1.推动因素
①统⼀仪表化:链路为分布式软件中的请求处理提供了丰富有序的视角,但并非总是能够完全识别和解决异常情况。 OTel可将指标和日志与链路相关联,为应用可观测性用例整合了更完整的数据集。
②软件架构:微服务、容器和函数是功能强大的构件,可作为现代应用的基础。松耦合有助于独立组件的开发、测试和发布。
③可观测性解决方案的成本:许多企业机构都在为使用商业可观测性产品,监控其全部应用而努力控制成本,比如减少监控足迹,和使用低成本的辅助解决方案。 OTel支持将相同遥测数据灵活地路由至不同的解决方案,促进了低成本辅助解决方案的发展。
④站点可靠性⼯程:在许多企业机构中, SRE负责运行状况和性能管理,最有可能要求OTel提供洞察。企业机构对于设立SRE岗位并采用SRE实践的兴趣与日俱增。
⑤项⽬稳定性: OTel项目已申请成为 CNCF 的 “ 毕业 ” 项⽬,这保证了项目的稳定性和成熟度,且足以广泛应用于生产。
2.阻碍因素
①成熟度:OTel发展迅速 ,并逐渐在实际工作中被广泛采用,但它还不是特别稳定和成熟。因此现在采用该技术可能会耗费一定时间和精力。即使随着时间的推移 ,这些使用成本会逐渐降低。
②实施差异: 由于需要支持一套新规范,⼀些供应商会对目前的工作进度做出假设,这可能会带来多供应商兼容性的风险。 2023年4月, Elastic将Elastic Common Schema 贡献给OTel项目,减少这⼀障碍影响度。
③路线图:虽然链路和指标规范是完全稳定的,但在本本撰写时, OTel日志仍处于部 分 “ 实验 ” 阶段。这些规范往往很早就固定下来,但在开发过程中,各类规范的执行程度参差不齐。将连续性能剖析作为第四种遥测类型的计划正处于早期阶段。
④⽣态系统:支持 OTel 的本土监控服务提供商数量有限。
⑤技能集:许多中国企业依赖供应商提供监控解决方案,因此内部团队往往缺乏在 DevOps 团队中采用 OTel 的技能。缺乏自动化能力是⼀个突出的障碍。
四、使用建议
-
通过 CNCF 利用开源解决方案,使中国企业能够构建供应商中立的监控解决⽅案,以 降低商业供应商锁定的风险。
-
在选择监控解决方案时,优先考虑采用OTel 的供应商。
-
在定制应用软件中构建链路仪表化时,采用 OTel 进行当前的分布式追踪。
-
根据企业机构所使用的语⾔和框架,利用 OTel SDK 仪表化云原生应用。
-
采用可支持混合工作负载的 OTel 技术,增强现有的 APM 解决方案。
-
通过体验 OTel 演示来熟悉 OTel ,该演示为⼀个基于服务的完整示例应用,包含解决方案场景。
-
与监控和可观测性解决方案提供商密切合作,建立部署框架,设计利用 OTel 数据进行分析的最佳方式。
五、OTel落地案例
关于OTel的应用,中国的这些企业可以说比较典型:阿里云、博睿数据、嘉为科技( ⼴州嘉为科技) 、道客网络、基调听云。gartner推荐阅读如下:
Monitoring and Observability for Infrastructure and Applications (基础设施和应用程序的监测与可观测性)
Solution Path for Modern Infrastructure and Application Monitoring (现代基础设施和应用程序监测的解决方案路径)
Magic Quadrant for Application Performance Monitoring and Observability (应用性能监测与可观测性魔力象限)
Critical Capabilities for Application Performance Monitoring and Observability Reference Architecture Brief: Software Observability(应用程序性能监控和可观测性的关键能力参考架构简介:软件可观测性)
以上就是今天的分享的全部内容了,大家如果有疑问的地方,欢迎评论区留言讨论。
擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司专注于通过提升企业客户对运维数据的洞见能力,为运维降本增效,充分体现科技运维对业务运营的影响力。
行业龙头客户的共同选择
了解更多运维干货与行业前沿动态
可以右上角一键关注
我们是深耕智能运维领域近十年的
连续多年获Gartner推荐的AIOps标杆供应商
下期我们不见不散~