AB测试——流程介绍(定义问题和指标选取)

news2025/4/19 18:29:45

前言: 作为AB测试的学习记录,本文主要介绍了AB测试的基本流程,以及指标类型和如何选取合适指标。
相关文章:AB测试——原理介绍

AB测试的基本流程是什么?

AB测试(也称为分流测试)是一种常用的实验设计方法,用于比较两种或多种不同的设计或策略,以确定哪种方案更有效。下面是AB测试的一般流程:

  1. 定义研究问题:确定要测试的问题或假设,并将其转化为可量化的指标。
  2. 设计测试方案:制定测试方案,包括定义测试组和对照组,确定样本量和测试时长等关键因素。
  3. 实施测试方案:实施测试方案,包括在测试组和对照组中分别应用不同的方案,并记录结果数据。
  4. 数据分析:统计分析收集的数据,比较测试组和对照组的差异,并确定哪种方案更有效。
  5. 结果解释和应用:根据数据分析结果,解释测试结果,并应用于实际业务中。
  6. 优化改进:根据测试结果和应用效果,进行优化改进,并持续跟踪测试方案的效果。

需要注意的是,AB测试的有效性取决于样本量和测试时长的设计,必须确保样本量足够大,测试时长足够长,才能保证测试结果的可信度和稳定性。此外,测试方案需要避免影响测试结果的偏差和干扰,例如排除不相关因素的影响。


1. 定义研究问题(Problem Statment)

首先,需要明确业务场景的背景现状,和产品经理沟通需要验证的方案是什么,目的是什么。

比如,我们先在需要上线一个新的APP的UI界面,目的为了吸引用户购买,提高用户的成交量。

  • 变量/变体:一个新的UI界面
  • 实验对象:APP用户
  • 目的:提高成交量

通过对问题的分析和理解,实验设计者需要将一个商业问题转换成一个可量化、可通过实验验证的数学问题。


2. 选取指标 (Metrics Selection)

确定好实验的背景和目的,接下来就需要确认需要追踪和验证的数据指标。

2.1 指标的两种分类

对于指标,我们可以有两种分类方法。

按计算方式区分:

第一种按计算方式区分:

  • 绝对值指标 : 单一的数值,比如利润总额、销售量、用户在线时间等。
  • 相对值指标 :两个有联系的现象数值相比得到的比率。例如用户转化率、ROI等。

按业务特性区分:

第二种是根据各类指标在业务中的分工特性区分:

  • 成功指标(Primary/Core/Success Metrics):

    • 最核心的度量指标,决定新功能是否有价值、实验是否成功的度量。
    • 比如:如果新的UI界面是为了提高用户的体验,那么用户在线时长、日活可以作为关键指标;如果是新的产品推送策略,为了提高销售和利润,那么利润就是最关键的核心指标
  • 跟踪指标(Secondary/Tracking metrics):

    • 跟踪指标不能直接测量新功能是否有效, 但是能帮助监测新功能是如何影响目标指标。 如果目标指标有异动,跟踪指标可以帮忙分析新功能是如何导致目标指标发生变化的。
    • 比如在新界面上线后,
      • 第一种情况: 用户购买量下降了,同时用户的浏览量和在线时长都减少了。UI界面设计不合理,令用户的使用体验变差,提前关闭APP,导致了购买下降。
      • 第二种情况:用户购买量下降了,但是用户的浏览量和在线时长都提高了。新的UI设计让用户更愿意花时间浏览APP。因为浏览时间拉长,用户发现了很多喜欢的商品,但是由于选择过多,反而让用户更难下定决心购买。
  • 护栏指标(guardrial metric):

    • 护栏指标,是用来限制新设计带来的负面影响。
    • 在这个UI界面的例子中,我们希望用户购买量能够上升,但同时不希望新的功能会影响日活量,如果新功能对日活量有一定的负面影响。那么表明有部分的用户不喜欢新的页面设计,这时我们就需要否决掉这个方案。
    • 再举个广告投放的栗子:
      • 许多APP都会使用不同的广告投放策略,在用户使用时推送广告。因为企业希望通过广告增加利润收入,所以广告投放策略的核心指标一般是广告盈利
      • 广告太多,或者广告质量不佳,就会直接导致用户在线时长、活跃度下降。若没有及时控制,可能会最终导致用户流失。 所以用户的在线时间、或者日活是需要监控的护栏指标。

2.2 如何找到合适的指标

AB测试的指标选择应该基于业务目标和测试假设,需要选择与目标直接相关、易于测量和可靠的指标,以确保测试的有效性和准确性。

选择指标的原则

下面是总结的一些基本原则:

  • 关注核心业务指标:应优先考虑关键业务指标,如转化率、收入、利润等。这些指标与业务目标直接相关,能够直接反映实验效果。
  • 考虑上下游指标:除了核心业务指标,还需要考虑与之相关的上下游指标。如用户满意度、页面停留时间、页面访问量等,以便全面了解实验效果。
  • 易于测量:选择易于测量的指标可以降低测试成本和复杂度。
  • 可靠性:需要选择可靠性高的指标,避免测量误差和偏差对测试结果的影响。
  • 敏感性:需要选择敏感性高的指标,能够反映出实验效果的变化。
  • 及时性:需要在短期内可以测量的指标,因为实验时长有限,我们要确保选择的指标可以在实验周期内测量完成。
  • 可解释 :对于指标的变化,我们需要找出并且解释变化的原因和影响因素。

利用用户旅程图找到合适的指标

**用户旅程图(Customer Journey Map)**是一个描述用户在使用产品或服务过程中所经历的各个阶段和关键转折点的图表。
在这里插入图片描述
使用用户旅程图可以帮助我们更好地理解用户需求和行为,定位AB实验所处的用户旅程阶段,进而确定核心指标以及关键转折点(上下游指标)。

根据指标的分析结果,可以确定测试的优化方向,如优化页面设计、提高页面加载速度、调整价格策略等。

参考资料:
https://zhuanlan.zhihu.com/p/374586706
https://zhuanlan.zhihu.com/p/34084243

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/396660.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

visual studio的team使用问题小结

visual studio的team使用问题小结一、visual studio(2017)默认浏览器打开team任务和bug二、visual studio(2017)上传team时,文件超过一万个会上传失败。三、visual studio(2017)拉取team代码时&…

C++面向对象编程之二:构造函数、拷贝构造函数、析构函数

构造函数和析构函数C利用构造函数和析构函数,完成对象的初始化和清理工作。对象的初始化和清理工作,是编译器强制我们要做的事情,如果我们不提供构造函数和析构函数,编译器会提供3个函数:默认无参构造函数默认拷贝构造…

004+limou+HTML——(4)HTML表格

000、前言 表格在实际开发中的应用还是比较多的&#xff0c;表格可以更加清晰地排列数据 001、基本结构 &#xff08;1&#xff09;构成 表格&#xff1a;<table>行&#xff1a;<tr>&#xff08;table row&#xff0c;表格行&#xff09;&#xff0c;由多少组t…

【每日随笔】中国当前社会阶层 ( 技术无关 | 随便写写 )

文章目录一、阶层划分根据收入划分的阶层根据分工逻辑划分根据权利划分二、根据社会地位和掌握的资源划分的阶层三、赚钱的方式四、如何进入高阶层看了一个有意思的视频 , 讲的是中国当前的社会阶层 , 感觉好有道理 , 搜索了一些资料 ; 参考资料 : 关于中国的社会阶层社会在分…

【一】【socket聊天室】-多线程,socket编程

本文主要实现基于socket编程的聊天室&#xff0c;主要分为下面三个步骤&#xff1a; &#xff08;1&#xff09;多用户聊天&#xff1a;一个服务器多个客户端&#xff0c;客户端信息显示在公共的服务端窗口&#xff0c;利用多线程实现&#xff1b; ——客户端双线程&#xff1a…

OpenCV基础(一)

1.认识图像&#xff08;彩色图中每一个像素点都包含三个颜色通道RGB&#xff0c;数值范围为0~255&#xff0c;0代表黑色&#xff0c;255代表白色&#xff09; import cv2 #opencv 读取的格式为BGRimg cv2.imread(cat.png) #读取图像 cv2.imshow(cat, img) #显示图像img&#x…

Matlab实现FFT变换

Matlab实现FFT变换 文章目录Matlab实现FFT变换原理实现手算验证简单fft变换和频谱求取功率谱结论在信号处理中&#xff0c;快速傅里叶变换&#xff08;FFT&#xff09;是一种非常常见的频域分析方法。本文将介绍如何使用Matlab实现FFT变换&#xff0c;并通过Matlab代码演示实际…

SAP ABAP 深度解析Smartform打印特殊符号等功能

ABAP 开发人员可以在 Smartform 输出上显示 SAP 图标或 SAP 符号。例如,需要在 SAP Smart Forms 文档上显示复选框形状的输出。SAP Smartform 文档上可以轻松显示空复选框、标记复选框以及 SAP 图标等特殊符号。 在 SAP Smartform 文档中添加一个新的文本节点。 1. 单击“更…

开发一款系统软件的流程步骤是什么

在如今的数字化时代&#xff0c;软件开发成为了一个重要的行业。无论是大型企业还是小型创业公司&#xff0c;软件开发都是不可或缺的一环。在本文中&#xff0c;我将介绍一些网上常见的软件开发步骤&#xff0c;以便开发者能够更好地理解和实践。1、需求分析需求分析是开发系统…

基于transformer的多帧自监督深度估计 Multi-Frame Self-Supervised Depth with Transformers

Multi-Frame Self-Supervised Depth with Transformers基于transformer的多帧自监督深度估计0 Abstract 多帧深度估计除了学习基于外观的特征外&#xff0c;也通过特征匹配利用图像之间的几何关系来改善单帧估计。我们采用深度离散的核极抽样来选择匹配像素&#xff0c;并通过一…

基于Jeecgboot前后端分离的ERP系统开发代码生成(六)

商品信息原先生成的不符合要求&#xff0c;重新生成&#xff0c;包括一个附表商品价格信息表 一、采用TAB主题一对多的模式 因为主键&#xff0c;在online表单配置是灰的&#xff0c;所以不能进行外键管理&#xff0c;只能通过下面数据库进行关联录入&#xff0c;否则online界面…

案例19-遇见问题的临时解决方案和最终解决方案

目录1、背景介绍2、两种解决方案的概念1、临时解决方案&#xff1a;2、最终解决方案&#xff1a;3、排查问题过程4、总结站在用户的角度思考作为软件开发者5、升华1、背景介绍 首先说明这是系统很早之前的时候的一个功能&#xff0c;当时和学习通还有很强的耦合关系。在学习通…

研究链表空间销毁问题

&#x1f4af;&#x1f4af;&#x1f4af; 1.研究链表空间销毁问题 当链表使用完后&#xff0c;需要将链表销毁&#xff0c;那么该如何销毁呢&#xff1f; void SLTDestroy(SLTNode* phead)//销毁单链表 {SLTNode* cur phead;while(cur){free(cur);cur cur->next;} }你…

Linux下Nginx安装使用

一、下载解压nginx # 进入要放安装包的目录 cd /opt/software # 下载安装包 wget https://nginx.org/download/nginx-1.20.2.tar.gz # 解压缩 tar -zxvf nginx-1.20.2.tar.gz -C /opt/modules # 进入解压后的目录 cd /opt/modules/nginx-1.20.2/二、安装nginx 1、安装编译器 …

剑指 Offer II 021. 删除链表的倒数第 n 个结点

题目链接 剑指 Offer II 021. 删除链表的倒数第 n 个结点 mid 题目描述 给定一个链表&#xff0c;删除链表的倒数第 n个结点&#xff0c;并且返回链表的头结点。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5], n 2 输出&#xff1a;[1,2,3,5] 示例 2&#xff1a; …

MySQL的多表操作

多表关系 介绍 实际开发中&#xff0c;一个项目通常需要很多张表才能完成。例如&#xff1a;一个商城项目就需要分类表(category)、商品表(products)、 订单表(orders)等多张表。且这些表的数据之间存在一定的关系&#xff0c;接下来我们将在单表的基础上&#xff0c;一起学习…

DolphinDB 机器学习在物联网行业的应用:实时数据异常率预警

数据异常率预警在工业安全生产中是一项重要工作&#xff0c;对于监控生产过程的稳定性&#xff0c;保障生产数据的有效性&#xff0c;维护生产设备的可靠性具有重要意义。随着大数据技术在生产领域的深入应用&#xff0c;基于机器学习的智能预警已经成为各大生产企业进行生产数…

logback无法删除太久远的日志文件?logback删除日志文件源码分析

logback无法删除太久远的日志文件&#xff1f;logback删除日志文件源码分析 最近发现logback配置滚动日志&#xff0c;但是本地日志文件甚至还有2年前的日志文件&#xff0c;服务器是却是正常的&#xff01; 网上搜索了一波没有发现&#xff0c;只找到说不能删除太久远的旧日志…

Leetcode. 21 合并两个有序列表

尾插 核心思路&#xff1a;依次比较 &#xff0c;取经过比较后较小值进行尾插 cur1 指向list1 ,cur 2指向list2 ,当cur1走完list1 或者cur2 走完list2 后停止 如果cur1走完list1 ,可以将cur2 整个拿下来尾插 如果cur2走完list2 ,可以将cur1 整个拿下来尾插 特殊情况 &#xff1…

c# 32位程序突破2G内存限制

起因 在开发过程中&#xff0c;由于某些COM组件只能在32位程序下运行&#xff0c;程序不得不在X86平台下生成。而X86的32位程序默认内存大小被限制在2G。由于程序中可能存在大数量处理&#xff0c;期间对象若没有及时释放或则回收&#xff0c;内存占用达到了1.2G左右&#xff…