前言:
嗨,今天是大年三十,大家是不是已经在家坐享团圆之乐了?还是说在奔向团圆的路上呢?不论如何,小编先祝大家新年如意安康,平安顺遂~
熟悉我们的朋友肯定都知道,关于《老杨说运维》这个系列,去年已经更新了好多期了,后台也收到了不少朋友的认可还有真诚建议。所以即便是大年三十,小编依旧有动力继续为大家更新。
此次给大家分享的主题为《AIOps如何助力实现全面可观测性》,将分两期呈现,希望能给各位带去一点思想火花。
一、AIops发展中存在的问题
随着数字化经济的飞速发展,企业数字化转型已经成为了必然趋势。从传统运维向智能运维(AIOps)建设发展的过程中仍存在诸多挑战。
从业务层面的表象上,比如监控的误报漏报多、趋势预测能力缺失、综合根因定界及定位分析的手段少、规划资源使用的方法少等等;
从运维系统的状况进行深层挖掘,又能发现运维数据数量庞大、类别繁多且分散,加之新旧格式的碰撞以及业务视角的断层,使得数据治理难、运营分析难。
除此以外,在数字化转型的过程中,运维双态(即敏态与稳态)共存的情况给企业的数字化业务也带来了极大的挑战。
二、AIops发展的市场背景
管理学大师彼得·德鲁克曾说过:“如果你不能度量它,你就无法管理它。”换在智能运维的管理决策中来讲就是想要做好管理,就要先对它进行度量,而这就是Gartner早先提出可观测性的概念。
Gartner在今年的报告中提到,可观测性正逐渐成为企业智能运维中的高优先级项目,之所以出现这样的情况,是由于企业的业务发展中具有很多不可预测的情况发生,这就要求企业数字化能力中要着重加强自动检测、可观测性和可修复性。可观测性作为之中极为关键的一环,正以其能大幅提高运维事务处理效率的优势,在逐步替代传统的监控仪表。Gartner预测未来的2-5年,可观测性将进入成熟期。届时,智能运维的整体水平将会得到变革性的提升。
三、什么是可观测性
从字面上来讲,可观测性即是通过检查其输出来衡量系统内部状态的能⼒。这种能力的雏形是在企业的数字化转型过程中,早先被看重的数据可视化能力,即通过决策大屏让数据通过视觉的形式呈现出来,比如图表、图形、地图等等,让运维人员更容易的理解数据、统计数据以及运用数据,进而更加准确有效的传达与沟通信息。
而可观测性,并不只是单纯的可视化,它是基于可视化的本质能力上,将三大支柱数据(指标、日志、追踪)关联并融合,使得业务决策有据可循、日志记录和解释更具根源性的分析,交易在业务组件中的流动过程更加清晰可见。同时,经过对CMDB的梳理可得到第四种支柱数据(资源拓补)。最终,这四种支柱数据共同形成以业务为顶,自上而下的观测模型。
四、可观测性能带来的价值
日益增长的业务价值关注度,让单纯的可见性必须向以数据为驱动的洞察能力升级,这个过程中可观测性的价值就会逐步体现。
(一)将数据转化为答案
在决策层面从业务视角出发观测全局状况,进而利用可人工干预的算法模型对告警进行收敛,对历史数据进行分析,聚焦定位根因来源,结合AI的短期趋势预测,再利用资源规划功能,获取对未来趋势的预判结果,实现主动的数据预测。
(二)数据处理过程更灵活
集合数据任务的编排和调试能力、可交互的检测模型调优及管理、场景化的编排引擎,使数据白盒化的接入、处理、输出,完成任务的诊断。并且能够及时反馈异常检测的结果,精细化调整日志的检测模式。最后形成多种运维场景下定制化的可观测编排引擎,灵活搭配业务场景实现数据的全面处理。
(三)实现跨团队协作的高效性
通过统一的观测视角,能够建立与运维业务相关的规则引擎,完成基于组织架构的权限配置,根据团队分工进行任务分派,形成有策略、按需求的协同协作体系,保持业务运营的高效性。
(四)实时大规模的观测
通过流批一体的高性能计算引擎以及集群化和多中心的部署,加之对异常检测模型的实时更新和训练,稳定且高效的适应多中心等复杂环境。在大规模的业务数据进入时,能够有效做出应对操作。
*本文部分内容来源于“双态IT联盟”
擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司致力于协助企业客户提升对运维数据的洞见能力,优化运维效率,充分体现科技运维对业务运营的影响力。
行业龙头客户的共同选择
更多运维思路与案例持续更新中,敬请期待
随手点关注,更新不迷路