基于多源数据的微服务系统失败测试用例诊断

news2025/1/18 6:57:15

简介

本文介绍由南开大学、华为云及清华大学共同合作的论文:基于多源数据的微服务系统失败测试用例诊断。该论文已被FSE 2024(The ACM International Conference on the Foundations of Software Engineering) 会议录用,论文标题为: Fault Diagnosis for Test Alarms in Microservices Through Multi-source Data。

作者:张圣林,朱俊,郝博文,孙永谦,聂晓辉,朱静雯,刘喜临,李小倩,马宇驰,裴丹


随着微服务系统规模的扩张,保障微服务系统的稳定性愈发重要,大量的测试用例被设计用于检测微服务系统相关功能的可靠性,随之而来的是测试用例失败产生的大量测试告警。手动诊断这些告警对测试人员来说非常耗时耗力,因此自动化的测试告警故障诊断应运而生。测试告警中的故障诊断包括测试失败的故障分类和根因定位,能够帮助测试人员更加高效地处理日益增多的失败测试用例。然而,由于微服务系统的复杂性,已有的诊断测试告警的方法无法满足测试人员对于诊断准确度和精度的要求。

因此,文章提出了一种针对微服务测试告警的新型故障诊断框架 SynthoDiag ,通过知识图谱联合分析微服务系统测试过程中产生的多源日志(执行机日志、Trace日志和测试用例信息等)进行故障诊断。同时提出了根因关联和位置价值(EFA-PV)算法,用于定位与测试告警相关的日志行,减少测试人员的分析量。此外,文章采用一种高效的基于日志块的过滤方法,筛除测试过程中与故障无关的日志内容,显著提升了故障诊断的整体性能。SynthoDiag在来自华为云的大规模数据集上进行了系统评估。结果显示,SynthoDiag在故障分类的Micro-F1和Macro-F1评分上分别比基线方法提高了21%和30%,并且在故障定位的Top-5准确率达到了81.9%,显著超过了之前的方法。

背 景

系统集成测试(SIT)阶段的测试用例,包括一系列操作及其相应的检查点,每个测试用例用于测试系统的特定功能或面对特定情况的处理能力。在SIT中,当测试操作的结果与预期不符时,测试用例视为失败并会触发告警。测试失败可能是由于不同的因素导致的,包括但不限于:网络环境不稳定、测试步骤设计错误或系统故 障等。而针对不同的失败原因,存在相应的处理方案,因此将失败的测试用例按照失败的原因进行分类, 能够帮助测试人员快速确定处理优先级和选择解决方案。

按照失败原因可以将失败测试用例分为四个类别:环境问题、脚本缺陷、工具缺陷和服务问题。环境问题涉及外部环境因素导致的故障,而脚本缺陷是由测试脚本设计的不合理引起的,而工具缺陷主要是由于测试工具的故障,这里三类问题并不会暴露系统自身的潜在问题,通常需要调试测试环境、更正测试脚本、更新测试工具等方式进行处理。服务问题是最关键的类别,主要是由于微服务系统本身的缺陷所导致的,深入分析这类失败测试用例,有助于发现潜在的服务问题并采取预防措施以避免严重事件。

微服务系统中的多源日志在诊断过程中起着关键作用,因为它们提供了有关服务和操作的信息。每个测试用例会生成三种来源的日志,如图1所示:位于用户侧的执行机日志、位于服务器侧的 Trace 日志和测试人员预先编写的测试用例信息。有效地对这三种来源的日志进行联合分析,将能够更加全面有效地对失败测试用例进行建模,并在此基础上实现更加精准的故障诊断。本文的故障诊断包含对失败测试用例进行故障分类和定位,其中故障分类是确定新用例属于哪一个现有的故障类别,而故障定位是识别和突出显示最有可能与根本原因相关的特定日志内容,从而帮助测试人员快速识别和解决故障。

图1:多源日志样例
图1:多源日志样例

研究挑战

挑战1:日志格式不统一

不同格式的多源日志使得之前的方法在利用这些日志上效果不佳,尤其是在整合半结构化的执行机日志与具有跨度的树结构化的 Trace日志时。

挑战2:失败无关日志内容的干扰

在失败的测试用例的日志中,并非所有日志内容都与测试失败相关。这些与测试失败无关的日志内容占了很大比例,会干扰提取故障特征。而现有方法不能有效地过滤掉这些无关的日志内容的同时保留相关的日志内容。

挑战3:失败相关日志内容定位不准确

由于微服务系统及其测试脚本频繁的软件升级和配置变更,即使是同一故障类别的测试用例,其故障日志的内容也可能不同。因此,历史测试用例中的故障日志内容可能与新失败的测试用例中的不同,导致现有方法无法提供足够的参考信息,以便在新失败的测试用例中定位故障日志。

结构设计

SynthoDiag框架包括三个主要组成部分:日志过滤、用例嵌入和故障诊断,如图2所示。在解析失败测试用例的日志时,SynthoDiag首先基于日志块过滤掉与测试失败无关的日志内容(解决挑战2)。然后,基于过滤后与测试失败相关的日志内容构建失败测试用例的知识图谱,有效整合不同来源的日志内容(解决挑战1)。接下来,SynthoDiag利用语义信息通过知识图嵌入技术将每个失败的测试用例嵌入到一个向量中,并将历史失败的测试用例的向量和标签将存储在用例分类库中。当需要诊断新的失败测试用例时,SynthoDiag使用相同的步骤获取该测试用例的用例向量和知识图谱,然后输出故障类别并定位测试用例中指示故障的日志内容(解决挑战3)。

在这里插入图片描述

图2:SynthoDiag整体工作流程

实验评估

文章将提出的 SynthoDiag 与四种基线方法在华为云某产品数据集上的应用进行比较分析,以评估方法的有效性。图3展示了 SynthoDiag与基线方法在F1分数、Top-5准确率方面的差异。总体来说,SynthoDiag 在所有基线方法中表现最佳,Micro-F1分数为 0.872,Macro-F1分数为0.891。这些分数比最佳基线方法分别高出21%的Micro-F1分数和30%的Macro-F1分数。具体而言,尽管 CAM 的 Micro-F1 分 数为 0.761,其Macro-F1分数为 0.587 较低,其他三个基线方法在 Macro-F1 分数上的表现也较 差,这显示了SynthoDiag在故障分类工作上的优越性。同时,SynthoDiag 在故障定位上也展示出最佳性能,Top-5 准确率为0.819,说明基于模板或基于字符串的定位方法不适合在微服务系统的失败测试用例中定位故障日志内容。

图片

图3:实验结果

总 结

为了提高针对微服务系统测试的测试用例失败告警故障诊断能力,文章提出的新型故障诊断框架SynthoDiag,利用测试过程中产生的多源日志进行故障分类和定位。SynthoDiag利用知识图谱整合执行机日志、Trace日志和测试用例信息,通过根因关联和位置价值(EFA-PV)来精确定位故障指示日志内容。该框架还采用了基于日志块的过滤策略来过滤掉与故障无关的日志内容,显著提升了故障诊断的整体性能。在华为云的一个大规模实际数据集上进行的系统评估显示,SynthoDiag在故障分类上的Micro-F1和 Macro-F1分数分别比基线方法提高了21%和30%,并且在故障定位的Top-5准确率达到了81.9%,显著优于以前的方法。总体而言,SynthoDiag通过创新地使用知识图谱技术联合分析测试过程中产生的多源日志,为微服务系统中的测试用例故障诊断提供了有效的解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1690617.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MVCC相关

文章目录 前情要点基于什么引擎并发事务产生的问题不可重复读和幻读区别Next-Key Lock的示例解决并发事务采用的隔离级别当前读(Current Read)快照读(Snapshot Read)参考 MVCC定义表里面的隐藏字段由db_roll_ptr串成的版本链ReadView可见性算法mvcc的可见性算法为什么要以提交的…

【哈希映射 字符串 乘法原理】2227. 加密解密字符串

本文涉及知识点 哈希映射 字符串 乘法原理 LeetCode 2227. 加密解密字符串 给你一个字符数组 keys ,由若干 互不相同 的字符组成。还有一个字符串数组 values ,内含若干长度为 2 的字符串。另给你一个字符串数组 dictionary ,包含解密后所…

2024年收集搜索引擎蜘蛛大全以及浏览器模拟蜘蛛方法

对于做SEOer来说经常和搜索引擎蜘蛛打交道,下面整理收集了最全的搜索引擎蜘蛛大全。供有需要的朋友使用,建议收藏。 搜索引擎蜘蛛大全 "TencentTraveler", "Baiduspider", "BaiduGame", "bingbot",//必应蜘蛛…

深入浅出递归算法

文章目录 递归思想递归的题目1.汉诺塔问题问题分析代码展示 2.合并两个有序链表问题分析代码展示 3.反转链表问题分析代码展示 4.两两交换 链表中的节点问题分析代码展示 总结 递归思想 递归就是将一个很大的问题拆分成子问题,然后再将子问题继续拆分,拆…

安全设计 | Microsoft 威胁建模工具Threat Modeling Tool安装及使用详解(文末附样例)

1. 概览 微软威胁建模工具(Threat Modeling Tool)是 Microsoft 安全开发生命周期 (SDL,Security Develop LifeCycle) 的核心要素。 当潜在安全问题处于无需花费过多成本即可相对容易解决的阶段,软件架构师可以使用威胁建模工具提…

C语言 | Leetcode C语言题解之第109题有序链表转换二叉搜索树

题目: 题解: int getLength(struct ListNode* head) {int ret 0;while (head ! NULL) {ret, head head->next;}return ret; }struct TreeNode* buildTree(struct ListNode** head, int left, int right) {if (left > right) {return NULL;}int …

力扣刷题---409. 最长回文串【简单】

题目描述 给定一个包含大写字母和小写字母的字符串 s ,返回 通过这些字母构造成的 最长的回文串 。 在构造过程中,请注意 区分大小写 。比如 “Aa” 不能当做一个回文字符串。 示例 1: 输入:s “abccccdd” 输出:7 解释: 我们可以构造的最长的回文串…

分享:大数据风险检测报告,哪里查询比较好?

随着大数据技术的发展,逐渐被运用到各个领域,基于大数据技术的个人风险检测也就是我们常说的大数据报告在金融环境中运用的十分普遍,那大数据风险检测报告哪里查询比较好呢?本文就为大家简单介绍一下。 大数据风险检测报告查询能查到什么? …

Leetcode刷题笔记3

18. 四数之和 18. 四数之和 - 力扣(LeetCode) 给你一个由 n 个整数组成的数组 nums ,和一个目标值 target 。请你找出并返回满足下述全部条件且不重复的四元组 [nums[a], nums[b], nums[c], nums[d]] (若两个四元组元素一一对应&…

骨位深间距小模具镶件如何走水路?3D打印让一切简单

在模具制造领域,骨位深且间距小的模具镶件由于结构复杂,传统加工方法难以制造出符合要求的冷却水路,导致模具在注塑过程中容易产生热量积聚,进而引发烫伤、缩孔等不良。然而,随着3D打印技术的飞速发展,这些…

爬虫逆向实例小记——某数据知识管理网站-DES-ECB模式

aHR0cHM6Ly9rZC5uc2ZjLmNuL2ZpbmFsUHJvamVjdEluaXQ 注意:本文是逆向部分比较少,主要为了流程走通,限于代码搬运工。 第一步:分析页面 此网站经过请求响应,可以看出响应内容为加密内容。 第二步:判断加密类型 在XHR …

【Linux】从零开始认识进程间通信 —— 管道

送给大家一句话: 人要成长,必有原因,背后的努力与积累一定数倍于普通人。所以,关键还在于自己。 – 杨绛 从零开始认识进程间通信 1 为什么要进程间通信2 进程如何通信3 进程通信的常见方式4 管道4.1 什么是管道4.2 管道通信的系…

postgresql insert on conflict 不存在则插入,存在则更新

向一张表执行插入动作,如果插入的字段数据已存在,则执行更新操作,不存在则进行插入操作。 1、创建一张表 CREATE TABLE "user_info" ( "id" int2 NOT NULL, "name" varchar(20) COLLATE "pg_catalog&quo…

近邻算法详细

近邻算法,特别是K-近邻算法(K-Nearest Neighbors, KNN),是一种基于实例的学习方法,广泛应用于分类和回归分析任务。下面是K-近邻算法的详细说明: 基本概念 K-近邻算法的核心思想是“物以类聚”&#xff0…

基于transformers框架实践Bert系列1--分类器(情感分类)

本系列用于Bert模型实践实际场景,分别包括分类器、命名实体识别、选择题、文本摘要等等。(关于Bert的结构和详细这里就不做讲解,但了解Bert的基本结构是做实践的基础,因此看本系列之前,最好了解一下transformers和Bert…

node版本管理nvm详细教程

安装 nvm 之前先清理node相关的所有配置,如环境变量、.npmrc文件、node_cache、node_global 等 一、下载nvm 任选一处下载即可 官网:Releases coreybutler/nvm-windows (github.com) 码云:nvm下载仓库: nvm下载仓库 百度网盘&#xff1…

基于GA遗传优化的CNN-GRU的时间序列回归预测matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1 CNN-GRU模型架构 4.2 GA优化CNN-GRU流程 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 MATLAB2022a 3.部分核心程序 ...........................................…

雷电预警监控系统:守护安全的重要防线

TH-LD1在自然界中,雷电是一种常见而强大的自然现象。它既有震撼人心的壮观景象,又潜藏着巨大的安全风险。为了有效应对雷电带来的威胁,雷电预警监控系统应运而生,成为现代社会中不可或缺的安全防护工具。 雷电预警监控系统的基本…

代码随想录算法训练营第14天 |● 理论基础 ● 递归遍历 ● 迭代遍历 ● 统一迭代

文章目录 前言二叉树的递归遍历💖递归算法基本要素代码 迭代遍历-需要先理清思路再写前向迭代法后序迭代中序迭代 迭代法统一写法总结 前言 理论基础 需要了解 二叉树的种类,存储方式,遍历方式 以及二叉树的定义 记录我容易忘记的点 题目…

打造AI虚拟伴侣 - 优化方案

第一部分:框架优化概述 1、精确定位: 构建一个高度灵活且用户友好的平台,旨在通过无缝集成多种大型语言模型(LLMs)后端,为用户创造沉浸式的角色交互体验。不仅适配电脑端,还特别优化移动端体验,满足二次元AI虚拟伴侣市场的特定需求。 2、核心功能强化: 增强后端兼容…