系统上线后暴露的问题也是一种财富,我们需要从中吸收经验教训,规避其他类似的问题。对于上线后的问题如何进行原因分析,我提供两个分析报告的模板,供大家参考。
模板案例1:共性现象的原因分析报告
模板案例二:单个问题的原因分析与处理报告模板
事件标题:网站搜索系统乱码事件报告 | |
填报人:*** | 事件信息来源:客户反馈 |
事件概述: 2020年6月28日下午16:03,客户反馈从官网首页搜索关键词中文显示乱码【现象描述】。16:20系统回退【应急措施】,未影响当日业务。经排查原因是搜索页面,搜索关键词中文特殊字符显示乱码。 | |
事件详情: 16:03,有客户反馈搜索关键词中文显示乱码,研发人员即刻开始排查所涉及的程序代码。 16:15,研发人员与管理部门协商后,准备回退系统。 16:20,回退完成。从官网首页搜索中文页面,展示恢复正常。 | |
影响分析: 通过回退发布流程,恢复页面展示,未对业务产生实际的影响。 | |
技术成因分析: 6月15日版本,测试环境测试完成,首页输入中文跳转搜索结果页展示正常。 6月20日版本,代码优化,执行特殊字符过滤,未覆盖首页输入中文跳转搜索结果页。【开发的技术原因】 6月21日回归测试时,未覆盖到搜索结果页面。【测试的技术原因】 | |
纠正措施【技术归零】: 1)对代码重新修改,7月1日之前完成,责任人***; 2)重新全量回归测试,7月3日之前完成,责任人***; 3)跟随下周的发布火车一起发布,7月5日之前完成,责任人***; 4)上线之后,测试人员再次线上确认问题的修复,7月5日,责任人***。 | |
横向排查: 1)对各个语种的类似功能都要进行检查一遍,7月1日之前完成,责任人***; 2)对其他分子公司的系统都要进行检查一遍,7月3日之前完成,责任人***; | |
预防措施: 1)在公用测试用例库中增加针对该类问题的测试用例,7月10日之前完成,责任人***;【技术归零】 2)完善测试范围的识别方法,从调用、被调用两个维度分别识别范围,7月10日之前完成,责任人***;【技术归零】 3)修改测试流程,规定:最后一次修改后,一定做一次全面回归才可以上线,7月10日之前完成,责任人***。【管理归零】 | |
固化措施【管理归零】:
|