AB试验(二)统计基础

news2025/1/9 15:41:56

AB试验(二)统计基础

随机变量

  • 均值类指标:如用户的平均使用时⻓、平均购买金额、平均购买频率等

  • 概率类指标:如用户点击的概率(点击率)、转化的概率(转化率)、购买的概率 (购买率)等

经验结论:在数量足够大时,均值类指标服从正态分布;概率类指标本质上服从二项分布,但当数量足够大时,也服从正态分布。

概率分布

  • 正态分布: X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) XN(μ,σ2)
    • 概率密度函数: f ( x ) = 1 σ 2 π e − ( x − μ ) 2 / 2 σ 2 f(x)=\frac{1}{\sigma \sqrt{2 \pi}} \mathrm{e}^{-(x-\mu)^{2} / 2 \sigma^{2}} f(x)=σ2π 1e(xμ)2/2σ2
    • 标准化: z = x − μ σ z=\frac{x-\mu}{\sigma} z=σxμ X ˉ − μ σ / n ∼ N ( 0 , 1 ) \frac{\bar X-\mu}{\sigma / \sqrt{n}} \sim N(0,1) σ/n XˉμN(0,1)
  • 二项分布: X ∼ B ( n , p ) X \sim B(n, p) XB(n,p)
    • 概率质量函数: P ( X = k ) = C n k p k ( 1 − p ) n − k P(X=k)=C_{n}^{k}p^{k}(1-p)^{n-k} P(X=k)=Cnkpk(1p)nk
    • 期望与方差: E ( X ) = n p E(X)=np E(X)=np D ( X ) = n p ( 1 − p ) D(X)=np(1-p) D(X)=np(1p)

中心极限定理

  • 定理:取样样本足够大,则样本均值的分布就趋近于正态分布

  • 样本量:约定俗成的,当样本量大于30时就属于足够大

  • 案例:通过二项分布近似正态分布

    • 某社交APP在网上投放了广告来吸引用户点击下载。因此一个用户下载情况只存在发生与不发生两种情况,符合二项分布

    • 通过一个月的数据观察,发现每分钟平均有10个人会看到广告,平均下载率10%

      1

    • 如何理解二项分布中的样本量30

      1. 概率在某种程度上也是平均值,可以把这里的下载率理解为“看到广告的用户的平均下载量”,那我们已经有 43200(602430 )个数据点了,样本量远远大于 30,但为什么下载率的分布没有像中心极限定理说的那样趋近于正态分布呢?这是因为在二项分布中,中心极限定理说的样本量,指的是计算概率的样本量。在社交 App 的例子中,概率的样本量是 10,因为平均每分钟有 10 人看到广告,还没有达到中心极限定理中说的 30 这个阈值。所以,我们现在要提高这个样本量,才能使下载率的分布趋近正态分布。

      2. 简单的进行样本量提高,可以考虑计算每小时的下载率,因为每小时平均有600人看到广告,样本量也就从10提高到了600。

        2

      经验结论:二项分布近似服从正态分布的公式:min(np,n(1-p)) >= 5

      • np或者n(1-p)中相对较小的一方大于等于5,只有二项分布符合这个公式时,才可以近似于正态分布。这是中心极限定理在二项分布中的变体
      • 每分钟下载率:np=10*10%=1,小于5,因此无法近似为正态分布
      • 每小时下载率:np=600*10%=60,大于5,因此可以近似正态分布

假设检验

  • 概述:选取一种合适的检验方法,去验证在A/B测试中我们提出的假设是否正确

  • 假设:零假设与备则假设

  • 检验

    • 从假设角度区分:单尾检验与双尾检验

      经验结论:A/B试验更推荐使用双尾检验

      • 双尾检验可以让数据自身在决策中发挥更大的作用
      • 双尾检验可以帮助我们全面考虑变化带来的正、负面结果
    • 从比较样本的个数区分:单样本检验、双样本检验、配对检验

      经验结论:A/B试验更推荐使用双样本检验

    • 从数据特征区分:t检验、z检验

      经验总结:均值类指标一般用t检验,概率类指标一般用Z检验(比例检验)

      • 样本量大的情况下均值类指标是正态分布,正态分布的总体方差的计算需要知道总体中各个数据的值,这在现实中几乎做不到,因为我们能获取的只是样本数据。所以总体方差不可知,选用t检验
      • 概率类指标是二项分布,二项分布总体方差可以通过样本数据求得总体方差。而且现实中A/B测试的样本量一般都远大于30,所以选用Z检验。这里的比例检验(ProportionTest)是专指用于检验概率类指标的z检验

    经验总结:对于A/B测试来说,要选用双尾双样本比例检验(概率类指标)或t检验(均值类指标)

决策

3

  • 两类错误
    • 第一类错误:拒绝了事实上是正确的零假设。发生第一类错误的概率用α表示,也被称为显著水平(Significance Level)。统计上把发生率小于5%的事件称为小概率事件,代表这类事件不容易发生。因此显著水平一般也为5%,而常说的置信水平为1-α。
    • 第二类错误:接受了事实上是错误的零假设。发生第二类错误的概率用β表示,统计上一般定义为20%。而常说的统计功效power=1-β
  • 推断
    • p值法:在统计上,p值就是当零假设成立时,我们所观测到的样本数据出现的概率。在A/B测试的语境下,p值就是当对照组和实验组指标事实上是相同时,在A/B测试中用样本数据所观测到的“实验组和对照组指标不同”出现的概率。
      • 如何判断:当P值小于5%时,我们拒绝零假设,接受备择假设,得出两组指标是不同的结论,又叫做结果显著。当P值大于5%时,我们接受零假设,拒绝备择假设,得出两组指标是相同的结论,又叫做结果不显著。
      • 如何计算:比例检验可以用Python的proportions_ztest函数,t检验可以用Python的ttest_ind函数。
    • 置信区间法:在统计上,对于一个随机变量来说,有95%的概率包含总体平均值(Population mean)的范围,就叫做95%的置信区间。可以直接把它理解为随机变量的波动范围,95%的置信区间就是包含了整个波动范围的95%的区间。
      • 如何判断:置信区间是否包括0。如果包括0的话意味着两组指标有可能相同,如果不包括0则说明两组指标不同
      • 如何计算:比例检验可以用Python的confint_proportions_2indep函数,t检验可以用Python的tconfint_diff函数。

总结

日常A/B最常见的就是分析概率类指标和均值类指标,经验上,概率类指标采用双尾双样本比例检验(z),可用proportions_ztest函数计算p值,confint_proportions_2indep函数计算指标差值的置信区间;均值类指标采用双尾双样本t检验,可用ttest_ind函数计算p值,tconfint_diff函数计算指标差值的置信区间。

共勉~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/999617.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vibro-meter VM600 200-510-041-021数字量控制板卡

Vibro-meter VM600 200-510-041-021 数字量控制模块通常用于振动监测和机械设备的控制系统中,以执行振动数据采集、分析和控制任务。以下是通常情况下数字量控制模块的一些产品特点: 多通道输入:这些模块通常配备多个输入通道,以接…

浅析数字孪生在科学研究中的作用和优势

在科学研究领域,数字孪生技术正迅速崭露头角,为研究人员提供了前所未有的工具和资源,以更深入、更全面地理解复杂的自然现象和系统。本文带大家探讨数字孪生对科学研究的作用: 1. 精准建模和仿真 数字孪生技术允许科学家创建真实…

【Minecraft】Lucky Block(幸运方块)mod介绍

文章目录 mod介绍支持版本mod作者合成方式幸运值使用方法总结 mod介绍 幸运方块模组虽然只是添加了一个方块,两种武器,一种药水,但拥有超过一百种可能性! 简单地打破幸运方块,它将开出意想不到的东西! 你可…

云原生安全性:构建可信任的云应用的最佳实践

文章目录 云原生安全性的重要性1. 数据隐私2. 恶意攻击3. 合规性要求4. 业务连续性 构建可信任的云应用的最佳实践1. 安全开发2. 身份验证与授权3. 容器安全性4. 监控与审计5. 持续集成与持续交付(CI/CD)6. 安全培训和教育 未来趋势:服务网格…

Swagger 使用教程

Swagger 官网&#xff1a; API Documentation & Design Tools for Teams | Swagger 整合swagger 依赖&#xff1a; springfox-swagger2 springfox-swagger-ui <dependency> <groupId>io.springfox</groupId> <artifactId>springfox-swagger2</a…

气象站:从气候预测到环境监测

在我们的日常生活中&#xff0c;气象站的存在可能并不显眼&#xff0c;但实际上&#xff0c;它对我们的生活产生了重要的影响。气象站是一种用于收集和监测天气数据的设施&#xff0c;通过它&#xff0c;我们可以获得各种关于气候和天气的宝贵信息。那么&#xff0c;气象站可以…

Selenium自动化测试框架常见异常分析及解决方法

01 pycharm中导入selenium报错 现象: pycharm中输入from selenium import webdriver, selenium标红 原因1: pycharm使用的虚拟环境中没有安装selenium, 解决方法: 在pycharm中通过设置或terminal面板重新安装selenium 原因2: 当前项目下有selenium.py,和系统包名冲突导致, …

飞行动力学 - 第20节-横向静稳定性 之 基础点摘要

飞行动力学 - 第20节-横向静稳定性 之 基础点摘要 1. 横向静稳定性2. 横向静稳定准则3. 横向静稳定性的组成4. 参考资料 1. 横向静稳定性 2. 横向静稳定准则 对于横向静稳定性飞机&#xff0c;右滚转扰动会产生正侧滑&#xff0c;飞机产生左滚恢复力矩(负)&#xff0c;即 Δ …

Python之数据库(MYSQL)连接

一&#xff09;数据库SQL语言基础 MySQL是一个关系型数据库管理系统&#xff0c;由瑞典MySQL AB 公司开发&#xff0c;目前属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一&#xff0c;在 WEB 应用方面&#xff0c;MySQL是最好的 RDBMS (Relational Database…

想入行视觉设计?先看这篇文章再说!

大家好我是设计师不知名设计师l1m0&#xff0c;今天要给大家分享的设计岗位是&#xff1a;视觉设计师。 在当今数字化时代&#xff0c;视觉设计师扮演着至关重要的角色。他们是创意世界的魔术师&#xff0c;通过各种视觉元素的精妙组合&#xff0c;为品牌、产品和项目赋予生命…

【微信读书】数据内容接口逆向调试02

需求爬取微信读书的某一本书的整本书的内容 增强需求&#xff0c;大批量爬取一批书籍内容 众所周知微信读书是一个很好用的app&#xff0c;他上面书籍的格式很好&#xff0c;质量很高。 本人充值了会员但是看完做完笔记每次还得去翻很不方便&#xff0c;于是想把书籍内容弄下…

专注写作,快速上线:Cpolar+Inis帮助你在Ubuntu上建立博客网站

文章目录 前言1. Inis博客网站搭建1.1. Inis博客网站下载和安装1.2 Inis博客网站测试1.3 cpolar的安装和注册 2. 本地网页发布2.1 Cpolar临时数据隧道2.2 Cpolar稳定隧道&#xff08;云端设置&#xff09;2.3.Cpolar稳定隧道&#xff08;本地设置&#xff09; 3. 公网访问测试总…

信息系统项目管理师(第四版)教材精读思维导图-第十一章项目成本管理

请参阅我的另一篇文章&#xff0c;综合介绍软考高项&#xff1a; 信息系统项目管理师&#xff08;软考高项&#xff09;备考总结_计算机技术与软件专业技术_铭记北宸的博客-CSDN博客 本章思维导图PDF格式 本章思维导图XMind源文件 11.1 管理基础 11.2 管理过程 11.3 规划成本管…

2023-简单点-怎么知道树莓派是什么cpu架构?

树莓派是几位&#xff1f; getconf LONG_BIT https://qengineering.eu/install-ncnn-on-raspberry-pi-4.html

Redis过期时间的思考

当我们把 Redis 当做缓存来使用时&#xff0c;设置过期时间是必须的&#xff0c;但具体设置多少的过期时间呢&#xff0c;针对不同的场景会有不同的决策。 虚假一个场景&#xff0c;我们基于用户的地理位置推荐附近的陌生主播&#xff0c;用户可以线下去找主播沟通。当系统第一…

【网络技术】心跳机制(入门讲解)

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化【获取源码商业合作】 &#x1f449;荣__誉&#x1f448;&#xff1a;阿里云博客专家博主、5…

GB28181,sdk,设备集成和平台测试

本文章主要测试记录集成gb28181的arm端&#xff0c;用公开的平台测试gb2818的视频传输等 系统: 平台:windows10 设备:arm-cortex-A7,1.3G 平台软件:SkeyeVSS gb28181的协议等&#xff0c;在这里就不具体讨论&#xff0c;网上有很多资料,可自行查阅。 本文只是测试一下&am…

抖音小店:庞大用户基数与强大商业化能力的未来发展

抖音小店作为抖音平台的一项新业务&#xff0c;已经取得了一定的成绩&#xff0c;并且具备着广阔的未来发展空间。以下是四川不若与众对抖音小店未来和发展的分析。 首先&#xff0c;抖音小店的用户基数庞大&#xff0c;这为其未来的发展提供了坚实的基础。截至2021年底&#x…

SpringBoot自动配置入门

文章目录 前言自动包规则原理及初始化自动配置1.SpringBootConfiguration2.ComponentScan3.EnableAutoConfiguration&#xff08;1&#xff09;AutoConfigurationPackage&#xff08;2&#xff09;Import(AutoConfigurationImportSelector.class) 4.修改默认配置 总结&#xff…

SAP ABAP根据网址跳转至对应的网页

SAP ABAP根据网址跳转至对应的网页 程序代码&#xff1a; DATA: lv_openurl TYPE c LENGTH 300,lv_tempurl TYPE char50." Url可由多个字符串组合lv_openurl https://www.baidu.com/.CALL FUNCTION CALL_BROWSEREXPORTINGurl lv_openurl * WINDOW_…