数据分析——AB测试应用与实战

news2025/1/19 3:19:34

摘要

某电商公司非常注重自己的落地页设计,希望通过改进设计来提高转化率。以往该公司全年转化率平均在13%左右,现在希望设计的新页面能够带来更高的转化率,希望新页面的转化率能有2%的提升,达到15%。在正式推出新页面之前,该公司希望通过AB测试在小范围的用户中进行测试,以确保新页面的效果能够达到预期目标。

一、AB测试基本流程

了解了基本的背景之后,就可以进入AB测试了。在进行AB测试之前,需要梳理一下AB测试的基本流程,以确保实验的顺利进行。AB测试的基本流程包括以下几个步骤:

确定实验目标及衡量指标:在本案例中实验目标是通过AB测试确定新落地页是否可以提升2%的转化率。衡量指标即为页面转化率

设计实验方案:设计实验的具体方案,包括实验变量(即页面的具体改动点)﹑实验时间、实验样本量、划分实验组和对照组等。还需要确定实验数据的收集方法和分析方式。

一般分析方式:包括描述性统计、假设检验、置信区间估计、回归分析等等。在进行AB测试的时候,需要分析师根据实验的目标和具体情况选择合适的分析方法,并结合实际情况进行解读,提出合理的建议和决策。

执行实验并收集数据:按照实验方案进行实验执行,同事记录实验数据。

二、设计AB实验

在A/B测试实验设计这一步,通常需要完成以下6个步骤:

  1. 提出假设
  2. 确定实验分组
  3. 计算实验样本量及试验周期
  4. 上线AB测试并收集数据
  5. 数据分析及假设检验
  6. 得出结论及建议

2.1 提出假设

设计AB test实验的筏一步通常是提出假设。假设是对于某个特定变化我们所期望的结果,也是后续实验的基础,我们需要在后续实验中通过数据验证这个假设是否成立。如果验证成立,我们可以将这个变化推广到全部用户。如果验证不成立,则需要继续优化这个假设或者放弃这个修改方案,以寻找更好的变化。

在这个实验中,我们希望新页面可以提升2%的转化率,原则上我们应选择单尾检验,准确的说,应该选择右侧单尾检验,因为我们的假设是新页面的转化率要大于旧页面的转化率。但是,在本案例中,我们并不能确定新页面的性能一定比当前的页面更好。所以,这里选择双尾检验

补充说明:单尾检验和双尾检验是假设检验中的两种常见常见形式。它们的区别在于对假设的方向性不同:

在单尾检验中,研究者针对假设提出了明确的方向性,例页新设计的落地页转化率比原设计高"、“将按钮颜色从灰色改的为红色将导致更多的点击.....因此只检验这个方向是否具有统计显著性,被称为单侧检验。

在双尾检验中,研究者不确定假设所在的方向,例如新设计的落地页转化率与原设计是否存在差异"、“改变页面布局会影响用户的满意度....需要同时检验两个方向的统计显著性,被称为双侧检验。

在AB测试中,一般应根据实验目的、数据分布情况和统计分析方法等因素来确定单尾检验或双尾检验。例如,如果实验的目的是验证新设计的落地页转化率是否明显高于旧设计,就可以选择单尾检验。但如果不确定两种设计是否存在差异,则应选择双尾检验。

简单来说,可以这样辨别单尾/双尾检验:

  • 如果备择假设H1中是”",则是双尾检验;
  • 如果备择假设H1中是">“或者">”,则是右侧单尾检验;
  • 如果备泽假设H1中是”<“或者"≤”,则是左侧单尾检验。

此外,需要特别注意的是:想支持的结论通常放在备择假设上。所以在本案例中,原假设和备择假设分别是:

  • 原假设H0: P =P0
  • 备择假设H1: P≠P0

其中,P0代表的是旧版落地页的转化率,P1代表的是新版落地页的转化率。

2.2 确定实验分组

在此次AB测试中,我们分为实验组和对照组两组:

  • 对照组(control组)︰这一组用户将看到日版落地页。
  • 实验组(eatment组)︰这一组用户将看到新版落地页。

为了后续计算每一组的转化效率,需要记录每一位参与实验的用户的购买行为,也就是说无论用户看到的是新版落地页还是旧版落地页,都需要记录这位用户最终是否购买了产品。这可以通过在网站上添加相应的追踪代码来实现

  • 0:代表用户在测试期间没有购买产品
  • 1:代表用户在测试期间购买了产品

这样,后续就可以很容易地计算出每个组的均值,从而得到新旧两版落地页的转化率。

2.3 计算实验样本量及试验周期

实验样本量的确定

我们之前讲过,根据大数定律和中心极限定理,样本量越大我们的估计就会越精确,但同时也意味着成本越高,所以需要知道实验所需的最小样本量是多少,在成本可控范围里,选择合适的样本量即可。每一个实验组所需样本量计算公式如下:

N=\frac{\sigma ^2}{\varepsilon ^2}(Z(1-\frac{\alpha }{2})+Z(1-\beta ))))^2

在这个公式当中,a为犯第一类错误的概率,为犯第二类错误的概率,σ代表的是样本数据的标准差,δ代表的是预期实验组和对照组两组数据的差值。一般情况下,我们会设置:

  1. 显著性水平: a= 0.05,即在拒绝原假设之前,我们有95%的把握新版落地页的转化率比旧版落地页要高。
  2. 统计功效(1-β) : β= 0.2, 即表示测试检测特定效果的能力,如果该特定效果存在的话。在此案例中就是,如果新版落地页真的比旧版转换率要高,该测试有80%的概率能检测出这个状况。当衡量指标为比率类指标时,

标准差计算公式为:

σ2= Pa(1- PA)+ Pp(1- PB)

其中,PA和PB分别是对照组和实验组的观测值。在此案例中PA= 13%,PB= 15%,每个组所需的最小样本量为:

实验周期的确定:根据上面最小样本量的计算,我们知道此次AB测试至少需要9440个用户参与测试,假如该落地页以往每天的平均浏览量为1000,则实验周期至少需要的天数为:试验周期=9440/1000 = 9.4 ~10(天)

2.4 上线AB测试并收集数据

目前市面上大家熟知的大公司基本上都在做AB测试,比如:百度、阿里、腾讯、字节跳动、京东、滴滴、携程、美团等:百度:

  • 百度统计可视化A/B测试: https://baijiahao.baidu.com/s?id=1735048932168957887&wfr=spider&for=pc。
  • 字节跳动:巨量引擎「AB实验工具」:https://zhuanlan.zhihu.com/p/508366232
  • 阿里: 淘宝推出的AB测试平台,主要针对淘宝商家进行A/B测试
  • 腾讯: 腾讯云AB实验平台: https://abtest.qq.com/

大公司做AB测试的主要特点就是。一般都是自研系统。而对于规模不是那么大的企业,也有做AB测试的需求,比如互金、运动。、在线教育、SaaS的都有做A/B测试,但是这部分企业一般是使用第三方的A/B测试工具。目前市面上的第三方AB测试工具主要有:

  • 神测数据:https://www.sensorsdata.cn/features/ABTesting.html
  • ABtester:提供web网站A/B测试http://www.abtester.cn/
  • 热云数据:支持App、web、H5的AB测试https://www.appadhoc.com/

2.5 数据分析及假设检验

这里,我们使用的是Kaggle上的A/B测试数据集来模拟练习。

从上面的统计数据来看,新旧两版落地页的表现结果非常相近,相比于旧版落地页,新版落地页的转化率略微好一点点,高了0.3% 那么,这种差异在统计学上显著么?我们可以直接说,新版落地页更好么?

假设检验:我们分析的最后一步就是假设检验了。那么,具体选择哪一种假设检验呢?在统计学中,当样本容量较大时(一般是大于30),我们可以使用Z检验或者t检验。

在这个案例中,由于我们的样本非常大,所以我们使用Z检验。Python中的statsmodels.stats.proportion模块可以来计算P值和置信区间:

2.6 得出结论及建议

由于我们计算出来的P值=0.607远高于显著水平α =0.05,所以我们不能拒绝原假设H0.这意味着新版落地页与旧版落地页没有明显不同(更不用说更好了......)

此外,我们继续看置信区间,treatment组的置信区间为[0.117,0.136],可以看出:·它包括我们的转化率基准线13%。

它不包括我们的转化率目标值15%,也可以说明,新版落地页的真实转化率更有可能与我们的基线相似,而没有办法达到我们期望的15%。进一步证明了,新版设计并不是一个很好的改进。

博文参考

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/755057.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HCIA配置命令集

目录 扩展 交换机 路由器 路由器网关配置 DHCP服务器 Telnet &#xff1a;远程登录协议 静态路由配置 动态路由 OSPF RIP NAT—网络地址转换 ACL—访问控制列表 ACL的分类&#xff1a; 配置 配置基础ACL &#xff1a; 例一&#xff1a; 例二&#xff1a; 配…

微服务 云原生:K8S 核心组件

参考 Kubernetes 官方文档&#xff0c;简要概述 Kubernetes 中的核心组件用途及部分原理。 一个 K8S 集群&#xff0c;可以分为两个部分&#xff1a; 控制平面(Control Plane)。它是一套管理系统&#xff0c;专门来管理集群节点和服务&#xff0c;为集群做出全局决策&#xff…

apache doris数据库集群搭建(二)

1. 概述 该文档主要介绍了主要基于apache doris数据库搭建&#xff08;一&#xff09;的基础上进行集群搭建、升级、扩容操作讲解编写。 2.软硬件需求 Doris 作为一款开源的 MPP 架构 OLAP 数据库&#xff0c;能够运行在绝大多数主流的商用服务器上。为了能够充分运用 MPP 架…

java Exception输出错误详细信息

1、直接输出Exception try {//上传代码} catch (Exception e) {throw new RuntimeException("上传训练数据失败&#xff1a;" e);}输出结果&#xff1a;只输出错误原因&#xff0c;不输出错误发生的位置 2、e.getMessage() throw new RuntimeException("上…

Thymeleaf解析

thymeleaf是一个XML/XHTML/HTML5模板引擎&#xff0c;可用于Web与非Web环境中的应用开发 最开始网站开始发展时&#xff0c;使用HTML展示网页&#xff0c;随着技术的发展和需求变化&#xff0c;出现了前后端交互的页面&#xff0c;不需要使用多个页面去展示一个大同小异的页面。…

Android TvSettings Bug: 密码框无法点击唤起输入法

概述 Android 10 的Box方案&#xff0c; 默认使用的是TvSettings作为系统设置&#xff0c;输入操作的习惯上是使用鼠标&#xff0c;键盘&#xff0c;遥控&#xff0c;日常的场景是没有问题&#xff0c;也不会出现本文中提及的问题。当外接的USB触摸屏后&#xff0c;出现无法点击…

华润燃气牵手腾讯云 数字技术助力燃气行业高质量发展

7月13日&#xff0c;华润燃气与腾讯云正式签署战略合作协议。双方将充分发挥各自优势&#xff0c;探索AI大模型在燃气行业的深度应用&#xff0c;并深耕分布式计算、连接和客户运营等领域&#xff0c;不断提升燃气民生服务的效率、质量&#xff0c;共同推动行业数字化转型和高质…

echarts3D地图+3D柱状图+3D飞线图

echarts版本&#xff1a;5.4.0 echarts-gl版本&#xff1a;2.0.8 示例代码&#xff1a; <template><div><div ref"chinaMap" id"chinaMap" style"width: 90vw;height: 90vh;"></div></div> </template>&l…

【ArcGIS Pro二次开发】(49):村规数据入库【福建省】

之前用Arcpy脚本工具做了一个村规数据入库和主要图纸生成工具。 在使用过程中&#xff0c;感觉对电脑环境比较高&#xff0c;换电脑用经常会一些莫名其妙的错误&#xff0c;bug修得很累。近来随着ArcGIS Pro SDK的熟悉&#xff0c;就有了移植的想法。 这里先把村规数据入库工…

【量化课程】02_2.货币金融学基础概念

2.2_货币金融学基础概念 文章目录 2.2_货币金融学基础概念概述金融体系货币利率利率的风险结构与期限结构货币供给过程中国货币政策工具货币政策效果货币数量论、通货膨胀与货币需求总需求与总供给分析货币政策理论货币政策传导机制 概述 金融市场&#xff1a;资金从剩余方转向…

解决git每次提交都需要输入用户密码

一、背景 在github上贴上了服务器ssh的公钥后&#xff0c;在服务器上推送代码仍旧提示需要输入git的账号和密码。 二、原因 这是因为此时的仓库是http协议下载的&#xff0c;此时的链接并不是通过ssh的&#xff0c;因此在推送代码时&#xff0c;会提示输入git的账号和密码。…

基于Python编写一个B站全自动抽奖的小程序

本文将利用Python编写一个B站全自动抽奖的小程序&#xff0c;可以实时监控自己关注的UP主&#xff0c;如果关注的UP主中有人发布了抽奖的动态&#xff0c;就自动参与这个抽奖。这样就能不错过任何一个可以暴富的机会了。需要的可以参考一下 导语 应好友邀请&#xff0c;帮他写…

i.MX6ULL(十五) 根文件系统

Linux“三巨头”已经完成了 2 个了&#xff0c;就剩最后一个 rootfs( 根文件系统 ) 了&#xff0c;本章我们就来学 习一下根文件系统的组成以及如何构建根文件系统。这是 Linux 移植的最后一步&#xff0c;根文件系统 构建好以后就意味着我们已经拥有了一个完整的、可以运…

Python isdigit()函数使用详解

「作者主页」&#xff1a;士别三日wyx 「作者简介」&#xff1a;CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」&#xff1a;小白零基础《Python入门到精通》 isdigit函数使用详解 1、包含负数的情况2、包含小数的情况3、带圈的数字4、数字上…

重封装Ehcache与Redis模板以便于一二级缓存同步数据(二)

参考: 一级缓存二级缓存的获取与更新顺序&#xff08;一) 简单封装Ehcache与RedisTemplate模版 通常使用一二级缓存时,必须保持一二级缓存数据数据与数据库中数据保持一致 &#xff1b;此时可以简单封装下,一二级缓存的相关接口,便于我…

数据结构(王道)——线性表的存储结构之链表存储

线性表的链表存储&#xff1a; 一、单链表定义&#xff1a; 用代码定义一个单链表&#xff1a; 不带头结点的单链表定义&#xff1a; 带头结点的单链表定义&#xff1a; 单链表定义总结&#xff1a; 二、单链表的基本操作&#xff08;插入删除查找&#xff09; 1、插入 如何在…

手机图片怎么转pdf格式?这几个图片转换方式了解一下

手机图片怎么转pdf格式&#xff1f;将图片转换为PDF的应用场景非常广泛。例如&#xff0c;你可以将多张照片转换为PDF&#xff0c;然后将其作为一本电子相册保存。你也可以将多张图片转换为PDF&#xff0c;然后将其作为一份报告或文档的附件发送给他人。此外&#xff0c;许多人…

⌈C++⌋深度剖析构造、拷贝构造与赋值运算符重载——深浅拷贝、explicit、类型转换等

目录 一、认识拷贝构造函数 1、什么是拷贝构造 2、深拷贝与浅拷贝 3、编译器可以绕过拷贝构造函数&#xff08;C Primer P442&#xff09; 4、explicit修饰 二、认识赋值运算符重载 1、赋值运算符重载格式 2、默认赋值运算符重载 3、赋值运算符都必须定义为成员函数 …

内网使用JRebel及踩坑点

目录 前言外网正常使用JRebel下载安装插件授权 内网授权方式搭建本地授权服务器安装JRebel的电脑网络切换为手机热点 设置脱机离线模式设置自动重新部署时间间隔使用JRebel之前需要的配置项勾选compiler -> build project automatically设置代码热部署配置JRebel热部署的项目…

979.在二叉树中分配硬币

979.在二叉树中分配硬币 给定一个有 N 个结点的二叉树的根结点 root&#xff0c;树中的每个结点上都对应有 node.val 枚硬币&#xff0c;并且总共有 N 枚硬币。 在一次移动中&#xff0c;我们可以选择两个相邻的结点&#xff0c;然后将一枚硬币从其中一个结点移动到另一个结点…