7月20日,Zabbix主办的MeetUp线下活动在济南圆满举行,众多技术大咖汇集现场,交流技术知识、分享先进的思想。乘云数字受邀参加此次盛宴,创始人兼CEO向成钢在现场发表了关于“DataBuff在打造可观测性数据底座上的探索”的主题演讲。
可观测建设的必要性和挑战
向成钢首先从可观测性与监控的区别谈起,并分享了自己的观点,提出:
· 可观测性技术是监控技术发展的必然趋势
· 可观测性技术将重构运维生态
过去单点的监控技术一直在沿着线性演进的技术路线上做“加法”,而云在做“减法”。传统的监控技术已经难以应对云原生带来的挑战。
数字化应用从业务需求的角度对实时性准确性提出了更高的要求,而底层基础设施云化微服务化的趋势,对稳定性提出了更大的挑战:如何构建端到端全链路跟踪?分布式跨云跨平台复杂场景,如何快速感知异常定位故障根因?云场景组件众多,数据呈指数级增长,如何实现低成本高性能存储云原生运维数据?这些都是巨大的问题。
我们注意到不少企业已经开始着手打造可观测性平台,同时也注意到打造可观测性平台的过程中有诸多挑战,比如:
基于这些,Databuff给出了自己的方案。
打造开放的可观测数据底座
接下来,向成钢分享了乘云在打造一款开放领先的可观测性底座DATABUFF的实践经验。这是乘云数字结合过去六年实践,踩过众多大小不同的“坑”换来的实战体验,也融合了乘云多项核心技术:OneAgent自适应数据采集、OneGate数据融合接入网关、MoreDB可观测性数据库、TracingX全量链路存储、SmartROOT根因定位算法模型等等。
▎OneAgent自适应数据采集
OneAgent技术支持一体化探针采集和第三方数据源开放采集。
OneAgent只需要一键安装命令就可以完成部署,在1分钟内即可采集到被监控对象的基础设施数据、应用服务指标,包括CPU使用率、内存使用率、服务响应时间、SQL耗时等。同时又支持第三方数据源的开放采集,包括Prometheus、Zabbix等。支持Java、.NET、Python、Go等多种语言。支持Spring Boot、Spring Web。
▎MoreDB可观测性数据库
MoreDB是乘云数字自主研发的数据库,专门用于可观测性平台,相较于同类产品,在查询性能、存储成本、压缩算法等方面表现出色,能够支持大规模数据写入、灵活查询和高效压缩。
▎TracingX全量链路存储
TracingX是针对调用链数据专门设计的存储系统,具备极高的单机写入性能,较高的数据压缩比,和极低的建设和维护成本。
▎SmartROOT - 根因定位
SmartROOT在故障根因定位方面的表现优异。
当故障发生时,Databuff SmartROOT能够在复杂的应用拓扑、链路中准确地找到发生故障的节点,并可以下钻定位到具体发生故障的接口请求、SQL请求,能够看到相关的错误栈,达到代码级别的定位。
在实际环境中,测试部门常常会通过故障演练的方式来发现和定位系统中可能存在的弱点和问题。Databuff SmartROOT可以很好地支持这一点。
结尾
乘云将过去在可观测性建设探索中积累的核心技术能力融入DATABUFF,采用开放的架构设计,一方面支持Zabbix、Prometheus等多种现有数据的采集接入,能够便捷地融入用户现有IT架构体系,同时也支持提供API供第三方调用,旨在构建开放领先的可观测性数据底座,帮助用户在可观测性建设过程中少踩坑。
未来,DataBuff会持续创新,带来更多先进的运维理念和实践,推动IT运维行业向更高效、更智能的方向发展。