如何缓解可观察性挑战?

news2025/1/20 1:57:44

可观察性正在成为当代 DevOps 实践的基石。即使传统上不属于 DevOps 的部门也看到了在可观察性团队的支持下带来的好处。然而,到 2023 年,组织发现采用之路比预期更加崎岖。以下是 DevOps 团队在可观察性方面面临的七个最大挑战以及一些缓解这些挑战的建议。

01

提高平均修复时间

MTTR(即平均恢复时间)是指系统在发生中断或错误后恢复并运行所需的时间。更长的 MTTR 意味着更多的停机时间和更差的客户服务。令人担忧的是,DevOps Pulse Report表明平均 MTTR 正在增加。今年,73% 的受访者表示 MTTR 为多个小时;去年这一数字仅为64%。

MTTR 通常是由于数据孤岛损害可观察性而无法诊断事件造成的。这可以通过可观察平台来改善,该平台允许工程师看到全局。

02

遥测数据的成本

随着 MTTR 的增加,许多组织必须应对高遥测数据量所产生的成本。这是一个大问题。IDC对 200 家公司的调查发现,53% 的受访者强调了存储日志数据的成本。

大部分问题是由于过时的分级定价模式造成的。许多供应商按每 GB 数据收费,因此如果您的数据量波动,您的数据成本也会波动。它们的定价模式也很模糊,这意味着许多组织发现很难知道他们支付的费用是什么。在 Coralogix,我们创建了一种新的业务模式,其成本仅为标准日志存储解决方案的三分之一。

03

工具蔓延

要理解为什么这是一个挑战,我们需要回答这个问题:什么是可观察性?有效的可观察性需要集成应用程序各个方面的数据。由于许多组织使用多种工具实施监控,因此他们遭受了工具蔓延的困扰。这会产生孤立遥测数据的效果,使得关联数据和深入了解系统性能变得更加困难。

缓解工具蔓延的方法有很多,例如在将工具纳入 DevOps 策略之前彻底评估工具的成本和收益。最有效的解决方案是“单一管理平台”工具,它将概要性的见解结合在单个仪表板上。

04

Kubernetes 复杂性

Elastic 报告称,组织越来越多地转向基于云的解决方案,例如 Kubernetes 来进行 DevOps。Kubernetes 可以根据需要动态扩展基础设施,从而消除专用服务器的成本开销,从而增强组织的能力。

然而,Kubernetes 很复杂,并且面临着一系列挑战。Kubernetes 的可扩展架构来自容器化,这是一种将应用程序托管在称为容器的对象中的范例。这意味着在 Kubernetes 中进行开发需要能够使用大量旋转板。

解决这个问题的一个好方法是在组织中进行更好的培训。此外,打破孤岛允许不同的团队转移知识。

05

安全挑战

Kubernetes 的流行带来了安全挑战。这些可能包括权限升级(用户设法获得写入访问权限等权限)和安全配置错误(开发人员忘记更改非安全默认配置)。

有多种降低 Kubernetes 安全风险的策略。其中包括将角色范围限定到特定命名空间、使用服务网格以及使用 Coralogix 的 Kubernetes Operator 增强安全性。

除了 Kubernetes 之外,还有一个更大的问题,即将安全性集成到可观察性策略中,这正成为越来越多IT 企业面临的挑战。为了解决这个问题,越来越多的企业开始将可观察性和安全监控整合到一起。基础设施和应用程序指标等解决方案可以增强安全性和监控。

06

扩展平台

为了应对不断上升的数据成本和不断增加的云复杂性带来的挑战,企业正在转向开源解决方案。然而,这些也有其自身的挑战。根据 DevOps Pulse 报告,大约 30% 的受访企业在基础设施管理、扩展和升级相关组件方面存在问题。由于许多开源平台需要专业知识来维护,因此企业很难为其获取技能和专业知识。

OpenTelemetry等工具可以通过与 Coralogix 等平台集成来简化扩展。

07

数据管道性能故障排除

实现可观测性需要拥有可靠且高性能的遥测数据管道。然而,使用开源平台的组织通常难以监控其数据管道的性能并对其进行故障排除。由于遥测数据质量较低,这可能会损害可观测性。

数据工程师 Abraham Alcantara建议了成功排除数据管道故障的十个关键步骤。其中包括识别数据管道软件和基础设施、重现和隔离问题以及自动化问题场景。另一种策略是应用机器学习,例如 Coralogix 使用的方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1269193.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

消息中间件——RabbitMQ(七)高级特性 2

前言 上一篇消息中间件——RabbitMQ(七)高级特性 1中我们介绍了消息如何保障100%的投递成功?,幂等性概念详解,在海量订单产生的业务高峰期,如何避免消息的重复消费的问题?,Confirm确认消息、Return返回消息。这篇我们…

hive里如何高效生成唯一ID

常见的方式: hive里最常用的方式生成唯一id,就是直接使用 row_number() 来进行,这个对于小数据量是ok的,但是当数据量大的时候会导致,数据倾斜,因为最后生成全局唯一id的时候,这个任务是放在一个…

Linux 进程(二)

1.当前工作目录 Linux 下使用 ls /proc 查看程序中的进程,其中这些蓝色的数字代表的就是进程。 其中cwd(current working directory)就是当前工作目录,那么为什么cwd 和 exe 是在同一级目录下呢因为 进程需要依赖可执行程序,可执行程序需要依…

局部内部类(内部类) - Java

局部内部类 说明:局部内部类是定义在外部类的局部位置,比如方法中,并且有类名。 LocalInnerClass.java 非常重要的几点!! 局部内部类本质还是一个类,该有的属性方法也都可以有。【举例a.见下文】可以直接…

KT1404C语音芯片为什么用着用着,声音就变大了,发指令设置音量?

一、问题简介 有客户反馈,使用KT404C语音芯片,每次主板上电的时候,都会发指令将音量设置为20级,但是实际到使用现场,就会有终端的客人反馈,机器的音量变大了,这个是什么情况呢,该如…

微服务API网关Spring Cloud Gateway实战

概述 微服务网关是为了给不同的微服务提供统一的前置功能;网关服务可以配置集群,以承载更多的流量;负载均衡与网关互相成就,一般使用负载均衡(例如 nginx)作为总入口,然后将流量分发到多个网关…

远程办公和密码管理的好伴侣

在当今快速变化的商业环境中,远程办公已经不再是一种简单的应急措施,而是被视为企业长期发展的关键战略之一。 随着科技的不断进步和全球化的推动,远程办公为企业提供了更大的灵活性和适应性,使得员工能够更好地平衡工作和生活。这…

ardupilot开发 --- ROS 篇

0. 前言 关于机载计算机; 关于ROS; 关于基于ROS的视觉SLAM和避障; 1. APSync 说到机载计算机Companion computer就不得不提另一个关键词APSync;APSync简化了机载计算机的设置,以便它可以为ArduPilot提供额外的功能,…

Debian arm系统安装wxPython

一、系统版本 二、安装wxPython-4.0.4.tar.gz 1、下载依赖 >sudo apt update >sudo apt-get install build-essential libgtk-3-dev libwebkit2gtk-4.0-dev libssl-dev libcurl4-openssl-dev libgstreamer-plugins-base1.0-dev libnotify-dev freeglut3 freeglut3-dev …

Python爬虫遇到重定向URL问题时如何解决?

什么是重定向 重定向是指当用户请求一个URL时,服务器返回一个中断请求的URL的响应。这种情况通常发生在网站对URL进行了修改或者重定向到其他页面的情况下。其中,如果处理不当开发,可能会导致爬虫无法获取所需的数据,从而影响爬虫…

激光切割机切割工件出现锯齿是什么原因?

金属激光切割机因切割速度快,效率高,切割效果好受到广大金属加工需求的厂家追捧,但在使用时不免出现一些小问题,如:在激光切割加工的时候出现锯齿的问题。 编辑搜图 请点击输入图片描述(最多18字&#xff…

传感器:探索Android中的传感器功能与使用

传感器:探索Android中的传感器功能与使用 一、传感器介绍1.1 Android 平台三大类传感器1.2 Android 平台支持的传感器1.3 传感器框架 二、传感器的使用2.1 识别传感器和传感器特性2.2 针对不同制造商的传感器或传感器的不同版本优化2.3 监控传感器事件2.4 处理不同的…

Docker中Alpine容器中配置MariaDB

1.更新镜像源 apk update2.安装 Mysql apk add --no-cache mysql mysql-client # 安装命令也可使用 apk add mariadb mariadb-client,alpine 中 mysql 就是 mariadb3. 安装openrc openrc是Alpine服务控制器,负责Alpine服务启动,添加、删除…

Linux 基本语句_13_消息队列

概念: 不同进程能通过消息队列来进行通信,不同进程也能获取或发送特定类型的消息,即选择性的收发消息。 一般一个程序采取子进程发消息,父进程收消息的模式 常用函数功能: fork(); // 创建子进程 struct msgbuf{ …

探索测试开发工程师的通往成功的秘密路径!

「作者说」随着近几年国内IT行业高速发展,对测试工程师的要求也越来越高,其作用也越来越重要,但很多测试工程师也迎来了个人发展的瓶颈,下一步该向哪个方向发展,该如何发展?本文将概述测试工程师的现状及发…

图片伪装,将RAR文件隐藏到图片里

下载链接 效果图: 代码: ECHO OFF TITLE PtoR MODE con COLS55 LINES25 color 0A:main cls echo.当前时间:%date% %time% echo.欢迎使用图片伪装,本脚本可以将RAR文件隐藏到图片里. echo.set /p "imagefile①请拖入图像文件…

Condition原码分析及实现原理

一、引言 Java作为一种广泛应用于企业级开发的编程语言,其内部机制和特性被许多开发者所关注。本文将深入分析Java Condition原码,以及Condition接口的实现原理,为大家提供一个更深入的了解。 二、Condition概述 Condition是Java并发编程中一…

tcp/ip协议 error=10022 Winsock.reg Winsock2.reg

tcp/ip协议 error10022 这2个注册表选项千万不能删除,否则上不了网。 按下windows键R键,输入regedit,打开注册表,在文件目录里找到如下两个文件夹,删除这两个文件夹。 路径:HKEY_LOCAL_MACHINE\System\C…

Python---练习:求某同学成绩的总分及平均分

需求: 已知某同学的语文(70)、数学(90) 、英语(80)、历史(75)、地理(85)五门课的成绩,编程求该同学的总分以及平均分。 思考: 要求是算总分和平均分,先看总分,已经知道了各科成绩,那么可以用把成绩赋值给每个学科的…

JVM——内存溢出和内存泄漏

目录 1. 内存溢出和内存泄漏内存泄漏的常见场景解决内存溢出的思路1.发现问题 – Top命令2.发现问题 – VisualVM3.发现问题 – Arthas4.发现问题 – Prometheus Grafana5.发现问题 – 堆内存状况的对比![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/058d113715b…