为什么企业要做大规模敏捷?

news2025/1/11 5:53:44

背景

软件工程里一个重要的指标就是“可用的软件”,敏捷宣言里也同样告诉我们“工作的软件高于详尽的文档”,那“可用的软件”、“工作的软件”意味着什么呢?在我的理解里,可以经历用户 “千锤百炼”的软件就是一个“可用的软件”。曾经听到过这样的说法:“一个有Bug的软件怎么能叫软件呢?”虽然这话在我们业内人士听起来有些可笑,但是这就是使用软件用户最真实的需求。所以如何在提高代码质量,最大程度地减少软件中的Bug同时,平衡软件迭代速度与交付效率是我今天想跟大家讨论的问题。

我有幸在两种完全不同风格的项目上进行过交付,让我们且称之为项目A和项目B。

项目A是一个客户为主导的巨大项目组,管理为明确纵向层级管理,横向开发团队来自于不同的供应商,并且采用瀑布式开发,由另一个事业部进行测试反馈,部门墙极其严重。


项目B则是一个由业务主导,每个敏捷团队有对应相关的业务领域,客户则是和供应商共同组成一个个敏捷团队,共同达成业务目标。

好了,完成了简单的背景介绍,我就要来说说下面的故事了。

故事

总览

首先,假设我们所需要达到的目标是由一个个大大小小功能(颜色模组)组成一个完整的软件,为了达到我们的交付目标,我们需要将每个功能进行开发,测试,将功能模块进行累加,最终获得一个完整而达标的软件。

同时两个项目都使用了大致相同的开发流程,为了保证质量,项目中都有基础的代码审计,CI/CD,应用测试,用户测试,等基本质量保证,软件开发的基础流程如下图。

在这种基础流程都相近的情况下,每个环节在不同架构下执行的的方式却有巨大的差异。

在讨论项目A的流程前,让我们先看看我们熟知的敏捷开发是怎么保证质量的:

项目B的情况

项目b的每一个小敏捷团队将业务需求从路径图(Roadmap)拆解下来,落到各大的业务功能的Epic中,再拆解成具有小的业务价值的用户故事,最后再落到每个具有开发意义的任务,注意,这里提的一直是业务价值,我们还没有开始讨论如何进入开发。

Epic 更多是独立且较大的目标,用于我们识别在关键时间点需要实现的大型业务目标。而用户故事则是一个简短的描述、一个用于表达用户或客户的需求的角色和一个用于描述需求的价值或期望结果的价值陈述,在用户故事中比较关键描述是关于此价值点的**“静态““动态”与“非常态**“,静态更多的是对价值点的描述,在To C中往往是静态设计图(UI)的描述,动态则是交互,系统间的交互或者功能的用户旅程(UX),而非常态则是描述系统在错误或者误差情况下的表现,以确保当前的价值点在绝大多数情况下得以运行(AC)。最终用户故事将被团队中的技术领导拆解成可以单独执行的开发任务,最终没个独立的开发任务可以由不同的开发人员执行。

在一个大型的价值目标被拆解成了Epic->用户故事->开发任务的过程中需要全团队的多轮确认,多轮确认确保所有人达成统一共识 ,在最大的程度上解决沟通差带来的不确定性。最终需要通过迭代计划会议在团队内部对价值达成共识后,才会进行项目开发。

进入开发任务后每个阶段,参考下图:

我们可以看到4重质量保证:

  • 结对编程:两个人的脑子总比一个人想的全。(其他好处不用赘述)
  • 团队中的代码版本差异识别:每对Pair的代码在一天结束时会被整个开发团队审核(当然可以提高代码质量了)
  • 代码审计:当对应开发任务 - PR(每笔代码)完成后,会被整个团队提意见(我听过比较离谱的就是:Our PR is waiting for more comments),修正完成后代码才会进入测试阶段。
  • 测试: 最后的最后,才会进行测试,整个测试则是由小团队内部完成,在没有测试的情况下,“非常态”的AC就是整个测试的通过条件。

再这样一轮一轮的开发任务到用户故事的价值交付后,又组成了一个Epic价值交付,最终通过Bug Bash的方式最后确认价值以达到交付标准,我们可以上线整个Epic用于用户的检验。

总结一下敏捷开发的特点:

  • 业务 -> 开发 -> 测试由一个全职能敏捷团队完成
  • 大多数内容由团队内部确定
  • 由上向下“顺时针“开发
  • 尽可能的小型功能,快速迭代
  • 小型逆时针回调细节确认
  • 业务导向:业务决定质量

用图来表示最终内建的结果,在最终快要上线时,经过团队内质量把控后仅与实际有极少差距,仅需要在日常使用中进行基础运维即可达到我们的价值目标:

项目A的情况

这时候让我们再来看项目A,系统被产品部门完成设计后,交予开发部门进行任务划分,每个开发团队承担不同的功能开发任务,每个功能点再由单独开发人员进行开发并自行测试(本地),最后由客户方进行功能验收后(功能展示+代码审核),代码合入主线进行转测。

说到这儿,举个例子,产品部门提供了本次需要交付的20个功能的设计图,开发团队把设计图分给交付团队(大多由供应商组成),团队成员小王负责对其中一张设计图(类似于一个Epic)的功能进行开发,开发完成后开验收会议,对代码和功能进行审核验证,进入测试流程。所以开发阶段归纳下来的话,如图

这样乍一看确实没有什么问题,开发流程中的各种实践也在做,那这种项目研发模式问题出在哪儿呢?这个时候我们看项目A的关键质量保证动作:测试。

项目A的测试步骤:

先抛结论,在测试阶段,80%时间用于确定问题+定位问题(标红)。所以我们可以着重讨论一下这两个阶段。

确认问题: 在确认问题阶段, 往往由测试组发起,通过层层追溯,可以追溯到开发人员(也就是小王),跟小王确认表现层的“静态”/“动态”/“非常态”问题后,测试顺利成章地建立一个问题工单,并分配给小王,宣告此单插在了小王头上,小王需要修正再找测试回归。乍一看又没什么问题,是个好流程,但是执行起来此流程会出现:

  • 因为测试标准中有较多主观的感官感受,导致在跟开发确认问题时经常出现主观问题,此时需要产品介入,并用主观感受进行判定。(缺少用户旅程细节)

    举例:(一个电话拉会)“小王,我觉得这个页面帧数好低,你要优化一下。”“啊???”(此处省略battle的10分钟)终于电话给了产品,产品一句话:“是帧数有点低啊!小王,这你得改”“…”

  • 需要产品介入的场景往往流程会变得极长。测试在做测试中,会考虑很多“非常态“问题,在非常态问题中,往往会导致”静态“”动态“的变更,然后经过工单追踪,产品组漫长的重新设计,然后再由开发进行更改。

  • 当存在“扯皮”问题,又是另外一副光景。

    举例:测试打电话给小王,小王说“这不是我的问题,你找xx团队的小李 ”,小李接上电话,“这是你小王开发的啊”…(再次省略battle时间)最终问题很有可能上升到客户方确定问题边界,这样1个小时就过去了。

  • 开发的专注思考时间被切碎。在转测后,需要大量地确认问题,也就是跟测试打电话,测试往往是发现问题第一时间就会确认问题,这样导致开发人员每天专注于代码工作的时间被切碎,效率直接下降。

定位问题: 定位问题同样占据了开发人员的大量时间,总体来说:

  • 大量追溯代码:确认问题后,有时会需要确定整个功能代码中的问题点,问题很难定位,尤其遇到比较棘手的概率,性能问题需要对整个代码进行回顾与重构。
  • 涉及他方代码:当在长时间确认问题后,问题有时会涉及他人代码,比如框架代码,他人功能代码,硬件代码,这时候需要你找到相关人(打电话),解释,最终把工单走到他人名下(当然没人愿意接单,长时间Battle在所难免)。
  • 定位到无法修改的问题:当然在这里又有专门的流程做这件事,问题就出现在因为团队间的互相的部门/信任墙,需要长流程(COC:需求变更会议)来共同确认问题,需要引入大量具有决策权的角色:另外团队的架构师,产品经理,测试经理,还有可怜的小王。最终一个无法修改的工单往往需要2周或者更多的时间进行关闭。
  • 流程反复:当出现 确认问题->定位问题->确认问题->定位问题…这个如此反复的流程时,对开发和测试的神经都是一个极大的考验。

后续的修改流程往往较为顺利,但是也会出现一个工单反复无法通过回归的问题,这毕竟是少数,也不是我们主要探讨的范畴。项目在强流程驱动下最终的结果就是:

所有人每天都在加班,所有人每天都在增加流程以确保质量,所有人都很痛苦,当然这里包括小王。

用图来表示开发结束后的状态,空隙区域代表不确定问题,空隙部分需要测试->开发->产品逆流程更改

总结

说了这么多细节,我想现在跳出来问“为什么会出现这样的问题?”这个问题我也想留个大家做一点思考,我做了一些简单而又主观的总结,放在这里:

  • 共识缺失:当大家都在自己的职能部门做自己的工作时,往往会主观地做这件事儿,当这件事儿在后续流转时,没有通过一个整体共识的话,往往需要从底端流程不断向上确认达成共识。
  • 大规模“逆时针”回调:因为整体共识由测试发起,加上部门墙重,往往导致从测试->开发->产品的逆时针开发流程,代码重构与返工的工作量极大。
  • 价值产出慢:当最终功能在大量回调时,价值产出很慢,导致验证慢,最终导致逆向反馈增加。
  • 流程决定质量:还是由测试流程来确定质量的情况下,在产品只进行Happy Pass的情况下,所有人的弥合质量的成本都在成倍增加。

看完了项目A和项目B的整体, 我们最后再来聊聊效率,我们发现,在同等的质量要求下,敏捷效率反而高很多,在流程更短的情况下却交付出了同样质量很高的产品,最后我们通过对比总结一下,为什么敏捷在保证质量的同时还能有更高的效率?

敏捷团队 职能团队
业务决定质量 流程决定质量
回调(重构)路径短 回调(重构)路径长
快速产出价值并验证价值 慢速产出价值验证价值慢
团队成员共同决策->快速达成共识 单一角色决策->长流程确认共识
专注手头工作 分散精力处理流程
团队凝聚力强 职能部门间不信任
开心 痛苦

图片来源:SAFe

我们暂且停在这儿,我要引用SAFe中的一张图来结束我今天的阐述,也在用实例回答:“为什么企业要做大规模敏捷?”

我想答案是:质量高,效率快,大家都开心。

参考资料:

SAFe:How the Scaled Agile Framework® Benefits Organizations

SAFe for Lean Enterprises - Scaled Agile Framework

SAFe Lean-Agile Principles - Scaled Agile Framework

A Complete Guide About Scaled Agile Framework (SAFe)? - DZone


文/Thoughtworks 曾雪松
原文链接:https://insights.thoughtworks.cn/large-scale-agile-ensures-quality-and-efficiency/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/463443.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux 共享库 静态库 动态库

一、 静态库(后缀.a):程序执行前(编译)就加入到目标程序中去了 优点:运行速度快,发布程序无需提供静态库,因为已经在编译到目标程序中,运行的时候可以直接运行,移植方便 缺点&…

【Java】Eclipse的安装和JDK的安装与配置教程

Java是能够跨越多平台的、可移植性高的一种面向对象的编程语言,其简单易学、功能强大,越来越多的程序员喜欢加入Java的阵营之中。 一、前言 Java具有以下功能特点: 跨平台性:Java程序可以在任何支持Java虚拟机(JVM&am…

C. Increasing by Modulo(贪心 + 二分)

Problem - C - Codeforces Toad Zitz有一个整数数组,每个整数都在0到m-1的范围内。这些整数是a1,a2...an。 在一次操作中,,iz可以选择一个整数k和k个萦引1..k,使得1si i2. ..fiksn。然后他应该将每个选定的整数a刘j 更改为(aj 1lmodm)。整数m对于所有操作…

初识STL

长久以来,软件界一直希望建立一种可重复利用的东西,以及一种得以制造出”可重复运用的东西”的方法,从函数(functions),类别(classes),函数库(function libraries),类别库(class libraries)、各种组件,从模块化设计&am…

(C语言版)力扣(LeetCode)27.移除元素三种解法分析

移除元素 题目第一种解法:有效值前移第二种解法:双指针第三种解法:双指针优化结语 题目 给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素,并返回移除后数组的新长度。 不要使用额外的数组空…

【C++】vector OJ练习

文章目录 1. 只出现一次的数字思路讲解AC代码 2. 杨辉三角思路讲解AC代码 3. 只出现一次的数字 III思路讲解AC代码 4. 只出现一次的数字 II思路讲解AC代码 5. 删除有序数组中的重复项思路讲解AC代码 6. 数组中出现次数超过一半的数字思路讲解AC代码 这篇文章我们来做几道vector…

Jenkins学习笔记

Jenkins学习笔记 1、基本概念 Jenkins是一个开源软件项目,是基于Java开发的一种持续集成工具,用于监控持续重复的工作,旨在提供一个开放易用的软件平台,使软件项目可以进行持续集成。 2、安装 文件包:https://pan.…

半监督目标检测

有监督目标检测: 拥有大规模带标签的数据,包括完整的实例级别的标注,即包含坐标和类别信息;弱监督目标检测: 数据集中的标注仅包含类别信息,不包含坐标信息,如图一 b 所示;弱半监督目…

RHCE-防火墙

目录 一、防火墙介绍 1.1、什么是防火墙 1.2、防火墙的功能: 1.3、linux防火墙的架构 二、iptables 2.1iptables介绍 2.2名词术语: 什么是容器? 什么是Netfilter/Iptables? 什么是表(tables)&#x…

学历到底是敲门砖还是枷锁?—探讨“孔乙己文学”热搜背后的教育话题

序言 最近,“孔乙己文学”一度成为网络热门话题,引起了不少人的讨论。其中,一句“学历不仅是敲门砖,也是我下不来的高台,更是孔乙己脱不下的长衫”引发了广泛共鸣,让人深思。 敲门砖 or 枷锁? 对…

黑盒测试过程中【测试方法】详解4-因果图

在黑盒测试过程中,有9种常用的方法:1.等价类划分 2.边界值分析 3.判定表法 4.正交实验法 5.流程图分析 6.因果图法 7.输入域覆盖法 8.输出域覆盖法 9.猜错法 黑盒测试过程中【测试方法】讲解1-等价类,边界值,判定表_朝一…

大模型竞争加剧,国内外 AI 监管进一步升级

随着人工智能技术的不断发展,大模型已成为当下最热门的话题之一。不仅国内外的科技公司都在积极投入研发,各国政府也在加大监管力度,以确保人工智能技术的安全和可持续发展。本文将从三个层次分别探讨大模型的定义和热度、国内外AI监管的现状…

【STM32】基础知识 第八课 MDK 工程

【STM32】基础知识 第八课 MDK 工程 准备工作新建寄存器版本 MDK 工程步骤新建工程文件夹添加文件魔术棒设置绝对路径和相对路径对比测试程序 新建 HAL 库版本 MDK 工程CMSISHAL 库简介DriversMiddlewaresDevice 和 Include HAL 库文件介绍HAL 库 API 函数和比那辆命名规则HAL …

Fedora 38 正式发布

Fedora Linux 38 正式发布,用户可以访问官网下载安装最新版本。 新网站 如果你点击了上面的官网链接,你应该会注意到 Fedora 的官网看起来与之前有了很大不同。这是 Fedora Websites & Apps 团队与 Design & Infrastructure 团队以及广大社区合作…

HCIA-RS实验-ENSP搭建一个基础的IP网络

HCIA-RS是华为认证网络工程师(Routing & Switching)的缩写。通过考取HCIA-RS证书,可以证明自己有能力设计、实现和维护小型网络。而HCIA-RS实验则是考试的一部分,是考生必须要完成的实践环节。这将是第一篇文章,后…

Qt连接MySQL数据库最详细的教程

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 1.直接通过MySQL的驱动加载数据库1)所需代码2)解决QMYSQL driver not loaded 2.通过ODBC连接MySQL数据库1)官方解释2…

如何react中使用redux和react-redux

Redux Redux 是 JavaScript 状态容器,提供可预测化的状态管理。 可以让你构建一致化的应用,运行于不同的环境(客户端、服务器、原生应用),并且易于测试。 不仅于此,它还提供 超爽的开发体验,比…

指针可以这样认知

注:此篇文章仅限初步了解,本小白后续会持续进行详解指针的相关操作。 目录: 认知内存一个内存单元的大小地址的产生 理解指针用途 指针变量的大小💞结尾 了解指针为什么需要了解内存呢? 因为指针是用来管理内存&#x…

【k8s】ruoyi微服务迁移到k8s

书接上回【传统方式部署Ruoyi微服务】,此刻要迁移至k8s。 环境说明 31 master , 32 node1 , 33 node2迁移思路 交付思路: 其实和交付到Linux主机上是一样的,无外乎将这些微服务都做成了Docker镜像; 1、微服务数据层: MySQL、 R…

聊聊 IP packet 的 TTL 与 tcp segment 的 MSL

聊聊 IP packet 的 TTL 与 tcp segment 的 MSL 1 前言 - 网络知识的重要性 近几年在排查解决应用系统在客户现场遇到的复杂问题时,越来越觉得除了扎实的LINUX操作系统知识,对TCP/IP网络知识的深入理解也是至关重要的。 有鉴于此,后续笔者会…