【Python实战因果推断】60_随机实验与统计知识2

news2024/12/26 9:24:52

目录

An A/B Testing Example


An A/B Testing Example

在许多公司中,一种常见的策略是提供廉价甚至免费的产品,这种产品本身可能并不盈利,但其目的是吸引新客户。一旦公司获得了这些客户,就可以向他们推销其他更盈利的产品,这一过程被称为交叉销售。假设你在一个咖啡配送公司工作,公司的主打产品是一种低成本的月度订阅服务,允许客户每周收到高质量、精心挑选的咖啡。除了这个基本且成本较低的订阅服务外,公司还提供一种更高端的订阅服务,包含优质的冲泡体验以及来自世界各地的顶级咖啡,例如巴西小镇Divinolandia的本地生产者提供的咖啡。这是公司最赚钱的服务,因此你的目标是增加向已经订阅了低成本入门产品的用户销售这项高端服务的数量。为此,公司有一个营销团队,主要通过发送交叉销售邮件来推销高端咖啡订阅服务。

作为因果推断专家,你的任务是评估这些邮件的有效性。当你查看现有的(非随机化)数据以回答这个问题时,可以明显看到收到邮件的客户更有可能购买高端订阅服务。在技术术语中,当客户购买你正在推销的产品时,可以说他们转化了。因此,可以说收到邮件的客户转化率更高:

E[Conversion|Email=1]>E[Conversion|Email=0]

不幸的是,你还发现营销团队倾向于向那些他们认为一开始更有可能转化的客户发送邮件。具体他们是如何做到这一点的并不完全清楚。也许他们寻找与公司互动最多的客户,或者是在满意度调查中给予积极反馈的客户。无论如何,这是一个强烈的信号,表明即使不发送邮件,

E\big[Conversion_0\big|Email=1\big]>E\big[Conversion_0\big|Email=0\big].

换句话说,即使不发送任何邮件,实际上被发送了邮件的客户群体会比其他客户群体有更高的转化率。因此,简单的平均值比较是无法准确估计交叉销售邮件的真实因果效应的,因为这样的比较是有偏见的。为了解决这个问题,你需要让接受处理和未接受处理的两组客户变得可比:

E\bigl[Y_{0}\bigr|T=1\bigr]=E\bigl[Y_{0}\bigr|T=0\bigr]

这可以通过随机分配邮件来实现。如果你成功做到了这一点,那么平均而言,接受处理和未接受处理的两组客户除了受到的处理(即是否发送邮件)之外,在转化率上应该是相同的。于是,假设你确实这样做了。你从客户基础中随机选择了三个样本。对其中一个样本,你没有发送任何邮件;对另一个样本,你发送了一封内容丰富、精心撰写的关于高端订阅的邮件;对最后一个样本,你发送了一封简短而直接的关于高端订阅的邮件。收集了一段时间的数据后,你得到了以下的结果:

 import pandas as pd # for data manipulation
 import numpy as np # for numerical computation
 data = pd.read_csv("./data/cross_sell_email.csv")
 data

你看到总共有323个观测值。虽然算不上大数据,但已经足够进行分析了。

为了估计因果效应,你只需简单计算每个处理组的平均转化率:

 (data
 .groupby(["cross_sell_email"])
 .mean())

确实就是这么简单。你可以看到,没有收到邮件的那组客户转化率为4.2%,而分别收到长邮件和短邮件的两组客户的转化率分别为5.5%和惊人的12.5%。因此,平均治疗效应(ATE),即每个治疗组与控制组之间的差异,计算公式为: ATE=E[Y|T=t]-E[Y|T=0], 对于长邮件和短邮件组,分别提高了1.3和8.3个百分点。

有趣的是,发送简洁明了的邮件似乎比精心编排的长邮件效果更好。

RCT(随机对照试验)的美妙之处在于,你不再需要担心营销团队是否以某种方式针对了可能转化的客户,也不必担心来自不同治疗组的客户在系统上存在任何差异,除了他们所接受的治疗外。按设计,随机实验旨在消除这些差异,使 Y0 和 Y1 在 T 上保持独立,至少理论上如此。

实践中,一个合理的检查方法是看随机化是否正确执行(或者你是否查看了正确的数据),即检查治疗前变量中治疗组与非治疗组是否相等。例如,你有性别和年龄的数据,可以查看这两个特征在各治疗组之间是否均衡。

当你查看年龄时,治疗组看起来非常相似,但在性别方面似乎存在差异(女性=1,男性=0)。收到短邮件的组别中,男性占比达到63%,相比之下,控制组和长邮件组的男性比例分别为54%和55%。这让人有些不安,因为你在转化效果最大的治疗组中发现了这种差异。即便在理论上RCT应该保证独立性,但实际上并不一定成立。你看到的短邮件产生大效果可能是因为某种原因,男性客户的基础转化率 E[Y0|man] 大于女性客户 E[Y0|woman]。

评价平衡性并没有明确的共识,但一个简单的建议是检查治疗组之间的标准化差异:\frac{\hat{\mu}_{tr}-\hat{\mu}_{co}}{\sqrt{\left(\hat{\sigma}_{tr}^{2}+\hat{\sigma}_{co}^{2}\right)/2}},

其中 μ 和 σ^2 分别代表样本均值和方差。由于你的例子中有三个治疗组,你只需计算相对于控制组的这个差异:

 X = ["gender", "age"]
 mu = data.groupby("cross_sell_email")[X].mean()
 var = data.groupby("cross_sell_email")[X].var()
 norm_diff = ((mu - mu.loc["no_email"])/
 np.sqrt((var + var.loc["no_email"])/2))
 norm_diff

如果这个差异太小或太大,你应该感到担忧。遗憾的是,没有一个明确的阈值来界定多大的差异是过多的,但0.5似乎是一个不错的经验法则。在这个例子中,你没有任何差异达到这么高的水平,但是短邮件组在性别上的差异较大,而长邮件组在年龄上的差异较大。

如果上述公式现在看来有些神奇,不必担心。一旦你复习完统计学部分,它会变得更清晰。现在,我只想提醒你注意小数据集下可能发生的情况。即使在随机化下,也有可能某个组由于偶然性与另一组不同。在大样本中,这种差异往往趋于消失。这也引出了一个议题:多大的差异足以让你得出结论,即治疗确实是有效的,而不仅仅是因为偶然性,这是接下来我将要讨论的内容

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1953884.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

k8s学习--k8s集群部署kubesphere的详细过程

文章目录 kubesphere简介k8s群集部署kubespere环境准备工作一、配置nfs二、配置storageclass三、kubesphere开启服务(devops) kubesphere简介 下面是官方文档描述 KubeSphere 是在 Kubernetes 之上构建的面向云原生应用的分布式操作系统,完全开源,支持多…

《程序猿入职必会(7) · 前端请求工具封装》

📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 CSDN入驻不久,希望大家多多支持,后续会继续提升文章质量,绝不滥竽充数…

足浴行业押金原路退回怎么开通?

一手机版和电脑版差别 手机版押金管理的优点: 1. 便携性:管理人员可以随时随地通过手机查看和处理押金相关事务,不受地点限制。例如,当不在店内时,仍能及时了解押金的收支情况,对突发问题进行处理。 2. 实…

深入解析食堂采购系统源码:打造高效食材供应链APP的核心

本篇文章,笔者将从系统架构、关键模块、技术选型和优化策略等方面,深入解析食堂采购系统的源码,为您揭示打造高效食材供应链APP的核心要点。 一、系统架构 食堂采购系统通常采用分层架构,以保证系统的可维护性和扩展性。主要包括…

糊涂工具包和commons包(Java)

工具包(Commons-io) 介绍: Commons是apache开源基金组织提供的工具包,里面有很多帮助我们提高开发效率的API 比如: StringUtils 字符串工具类 NumberUtils 数字工具类 ArrayUtils 数组工具类 RandomUtils…

记录|C#批量修改文件后缀

文章目录 前言一、.CHK 批量修改成 .mp3更新时间 前言 针对昨天博文:记录|cmd方式恢复U盘中的数据中的文件修复为.CHK格式后,如果将大量的.CHK后缀改为.mp3后缀的问题进行了编写。 主要是,现在网上的批量修改后缀的软件竟然要开会…

基于微信小程序的校园二手交易平台/Java的二手交易网站/基于Javaweb校园二手商品交易系统(附源码)

摘 要 使用校园二手交易平台管理校园二手物品交易,不仅实现了智能化管理,还提高了管理员的管理效率,用户查询的功能也需要校园二手交易平台来提供。 设计校园二手交易平台是毕设的目标,校园二手交易平台是一个不断创新的系统&…

大话成像公众号文章阅读学习(二)--- 下一代 AI-ISP会更好

系列文章目录 文章目录 系列文章目录前言一、AI-ISP1.1 定义与工作原理1.2 应用场景 二、展望总结 前言 这篇是 下一代 AI-ISP会更好 文章地址:https://mp.weixin.qq.com/s/N3YnkXF_stvP6k3jRTKCpQ 一、AI-ISP 1.1 定义与工作原理 定义:AI-ISP&#…

【docker】x host+ 是干嘛用的

先说结论: xhost 首先,xhost是允许外部应用程序连接到主机的X显示器: 其次,-v是挂载目录,用于在容器文件系统中挂载主机的X11显示器,以呈现输出视频。 那么x11显示器具体指的是什么? 在计算机…

谁说只有车载HMI界面?现在工业类的HMI界面UI也崛起了

谁说只有车载HMI界面?现在工业类的HMI界面UI也崛起了 引言 艾斯视觉作为行业ui设计和前端开发领域的从业者,其观点始终认为:工业自动化和智能化水平不断提高,人机界面(Human-Machine Interface,简称HMI&a…

铲屎官的必备好物——希喂、352、米家养宠空气净化器分享

对于每一位深爱着家中萌宠的铲屎官而言,无尽的温情往往也伴随着日常生活中的小烦恼。那些不经意间飘散在空气中的毛发,偶尔缠绕在鼻腔或口腔中的细微触感,以及偶尔袭来的不明异味,都是与宠物共度的日子里不可或缺的一部分。幸好随…

2024104读书笔记|《飞花令·田》——独出前门望野田,月明荞麦花如雪,雨中草色绿堪染,水上桃花红欲然

2024104读书笔记|《飞花令田》——独出前门望野田,月明荞麦花如雪,雨中草色绿堪染,水上桃花红欲然 《飞花令田》素心落雪 编著,飞花令得名于唐代诗人韩翃《寒食》中的名句“春城无处不飞花”,类似于行酒令,…

04-Charles中的Map Remote和Map Local介绍

Charles提供了Map Remote和Map Local两个功能。 Map Remote是将指定的网络请求重定向到另一个网址。Map Local是将指定的网络请求重定向到本地文件。 一、Map Remote 假设代码中调用了接口A,但是接口A的响应结果不能满足需求;此时,有另一个…

【传知代码】智慧医疗:纹理特征VS卷积特征(论文复现)

在这个无处不在的技术革新的时代,计算机视觉和机器学习成为了医疗领域中不可或缺的力量。在这篇文章中,我们将探讨两种突出的技术:纹理特征和卷积特征。它们如何在医学影像分析中竞争与协作,为医生提供更深入、更精确的诊断信息&a…

知,已经在行;知行是一件事,不是两件事

97天 知,已经在行;知行是合一并进的,不能把它们分作两件事;学习的开始,就已属于践行了。 真知,即为真行;知行的本体是合一的、并进的,后世学者却把知行一分为二( 近世的…

20.rabbitmq插件实现延迟队列

问题 前面谈到基于死信的延迟队列,存在的问题:如果第一个消息延时时间很长,而第二个消息延时时间很短,第二个消息并不会优先得到执行。 下载插件 地址:https://github.com/rabbitmq/rabbitmq-delayed-message-excha…

ASP.NET Core 6.0 角色授权 和 策略授权

角色授权 Authorize配置 AuthenticationSchemes配置 在授权时,先要鉴权:找出用户信息,如果能找到用户信息,那就证明用户一定登录过。这里要求不仅需要用户信息,而且还要有符合某些条件的用户信息,这样才能让请求访问资源。可以在某个方法/控制器,标记角色,如果要访问…

网络安全Sirius

关于Sirius Sirius是一款功能强大的通用漏洞扫描工具,该工具可以帮助广大研究人员在大多数场景下识别和验证应用程序中存在的安全漏洞。 现如今,信息安全社区仍然是收集网络安全情报数据最佳且最有利的来源,而且社区本身的表现经常会优于商…

【前端 11】初探DOM

JavaScript 对象 - DOM 初探 在Web开发中,DOM(Document Object Model,文档对象模型)是一个至关重要的概念。它不仅仅是一个API,更是Web页面与JavaScript代码之间的桥梁,允许开发者通过编程的方式动态地访问…

名家笔下的端午

文章目录 [北宋]苏轼《浣溪沙端午》[北宋]欧阳修《渔家傲五月榴花妖艳烘》梁实秋汪曾祺迟子建谈正衡苏童[北宋]苏轼《浣溪沙端午》 轻汗微微透碧纨,明朝端午浴芳兰。流香涨腻满晴川。 彩线轻缠红玉臂,小符斜挂绿云鬟。佳人相见一千年。 苏轼被贬惠州时,唯有王朝云矢志跟随…