【斯坦福因果推断课程全集】2_无混淆和倾向分1

news2025/1/12 18:50:59

目录

Beyond a single randomized controlled trial

Aggregating difference-in-means estimators

Continuous X and the propensity score


随机试验的一个最简单的扩展是无约束下的干预效果估计。从定性上讲,当我们想估计一种并非随机的治疗效果,但一旦我们控制了一组协变量Xi,其效果就和随机的一样好时,无边界性就与此相关。

本讲座的目的就是讨论在这种无边界假设下平均干预效果的识别和估计。与之前一样,我们将采用非参数方法: 我们不会假设任何参数模型的良好规范,平均治疗效果的识别将完全由设计(即与潜在干预结果和治疗相关的条件独立性声明)驱动。

Beyond a single randomized controlled trial

我们通过潜在干预结果来定义治疗的因果效应。对于二元干预 w∈{0, 1},我们定义潜在结果 Yi(1)和 Yi(0),分别对应第 i 个受试者在接受或不接受干预时会经历的结果。我们假设 SUTVA,Y_i = Y_i(W_i),并希望估计平均干预效果

\text{ATE}=\mathbb{E}\left[Y_i(1)-Y_i(0)\right]

在第一讲中,我们假设随机干预分配,\{Y_i(0), Y_i(1)\}\perp W_i,并研究了 ATE 的几个 √n 一致性估计器。

超越一个 RCT 的最简单方法是考虑两个 RCT。举个具体例子,假设我们对给予青少年现金奖励以阻止他们吸烟感兴趣。加利福尼亚州帕洛阿尔托市 5%的青少年和瑞士日内瓦 20%的青少年有资格参加这项研究。

在每个城市内,我们都进行了随机对照研究,事实上很容易看到干预有所帮助。然而,查看总体数据会产生误导,看起来干预会造成伤害;这就是有时被称为辛普森悖论的一个例子:一旦我们汇总数据,这就不再是一项 RCT,因为日内瓦人既更有可能接受治疗,也更有可能无论是否接受治疗都吸烟。为了得到一致的 ATE 估计值,我们需要分别估计每个城市的干预效果:\begin{aligned} &\hat{\tau}_{\mathrm{PA}}=\frac{5}{152+5}-\frac{122}{2362+122}\approx-1.7\%, \\ &\hat{\tau}_{\mathrm{GVA}}=\frac{350}{350+581}-\frac{1979}{2278+1979}\approx-8.9\% \\ &\begin{aligned}\hat{\tau}=\frac{2641}{2641+5188}\hat{\tau}_{\mathrm{PA}}+\frac{5188}{2641+5188}\hat{\tau}_{\mathrm{GVA}}\approx-6.5\%.\end{aligned} \end{aligned}

这个估计器的统计特性是什么?这个想法是如何推广到连续的x呢?

Aggregating difference-in-means estimators

假设协变量 Xi 在离散空间 Xi∈X 中取值,|\mathcal{X}|=p<\infty。再假设治疗分配是以 Xi 为条件的随机分配(即每组都有一个由 x 水平定义的 RCT):\{Y_i(0), Y_i(1)\} \perp W_i \big| X_i=x, \text{for all} x\in\mathcal{X}.

定义组内平均治疗效果为\tau(x)=\mathbb{E}\begin{bmatrix}Y_i(1)-Y_i(0)&X_i=x\end{bmatrix}

然后,如上所述,我们可以通过聚合组级治疗效果估计来估计ATE τ,

\begin{aligned}\hat{\tau}_{AGG}=\sum_{x\in\mathcal{X}}\frac{n_x}{n}\hat{\tau}(x),\quad\hat{\tau}(x)=\frac{1}{n_{x1}}\sum_{\{X_i=x,W_i=1\}}Y_i-\frac{1}{n_{x0}}\sum_{\{X_i=x,W_i=0\}}Y_i,\end{aligned}

其中 n_x=|\{i:X_i=x\}|\begin{aligned}n_{xw}=|\{i:X_i=x, W_i=w\}|\end{aligned}。这个估计值有多好?直观地说,我们需要估计 |\mathcal{X}|=p 个 "参数",因此我们可能期望方差与 p 成线性关系?

为了研究这个估计值,我们可以把它写成下面这样。首先,对于任何具有协变量 x 的组,将 e(x) 定义为在该组中得到治疗的概率,e(x)=\mathbb{P}\left[W_{i}=1 \big| X_{i}=x\right] ,并注意到

\sqrt{n_x}\left(\hat{\tau}(x)-\tau(x)\right)\Rightarrow\mathcal{N}\left(0, \frac{\text{Var}\left[Y_i(0) \big| X_i=x\right]}{1-e(x)}+\frac{\text{Var}\left[Y_i(1) \big| X_i=x\right]}{e(x)}\right)

此外,根据 \mathrm{Var}\begin{bmatrix}Y(w)&X=x\end{bmatrix} =\sigma^{2}(x) 不依赖于 w 的简化假设,我们可以得到

\sqrt{n_x}\left(\hat{\tau}(x)-\tau(x)\right)\Rightarrow\mathcal{N}\left(0, \frac{\sigma^2(x)}{e(x)(1-e(x))}\right).

接下来,对于集合估计器,将 \hat{\pi}(x) = n_x/n 定义为 X_{i}=x 的观测值的比例,将 \pi(x)=\mathbb{P}\left[X_i=x\right] 定义为其期望值,我们可以得出

把这些部分放在一起,我们得到了\sqrt{n}\left(\hat{\tau}_{AGG}-\tau\right)\Rightarrow\mathcal{N}\left(0,V_{AGG}\right)

\begin{gathered} V_{AGG} =\mathrm{Var}\left[\tau(X_{i})\right]+\sum_{x\in\mathcal{X}}\pi^{2}(x)\frac{1}{\pi(x)}\frac{\sigma^{2}(x)}{e(x)(1-e(x))} \\ =\mathrm{Var}\left[\tau(X_i)\right]+\mathbb{E}\left[\frac{\sigma^2(X_i)}{e(X_i)(1-e(X_i))}\right]. \end{gathered}

值得注意的是渐近方差 VAGG 并不依赖于组数 |\mathcal{X}|=p,正如我们稍后将看到的,这一事实在观察研究中有效地进行平均干预效果的半参数推断方面起着关键作用。

Continuous X and the propensity score

在上文,我们考虑了 X 是离散的、水平数有限的情况,治疗 Wi 如(2.1)中 Xi = x 的条件一样是随机的。在这种情况下,我们发现仍然可以通过汇总组内治疗效果估计值来准确估计 ATE,而且组的确切数目 |X | = p 并不影响推论的准确性。然而,如果 X 是连续的(或 X 的卡方数非常大),这一结果就不能直接应用--因为我们无法为 x∈X 的每个可能值获得足够的样本,从而无法像(2.3)中那样定义 τ (x)。

为了将我们的分析推广到离散-X 的情况之外,我们不能再简单地试图通过简单平均来估计每个 x 值的τ (x),而是要使用更间接的论证。为此,我们首先需要概括 "每组都有 RCT "的假设。在形式上,我们只需写出同样的内容

\{Y_i(0),Y_i(1)\}\perp W_i \big| X_i,\quad(2.6)

尽管现在 Xi 可能是一个任意的随机变量,对这句话的解释可能需要更加谨慎。从定性的角度来看,对(2.6)的一种理解是,我们已经测量了足够多的协变量来捕捉 Wi 与潜在结果之间的任何依赖关系,因此在给定 Xi 的情况下,Wi 无法 "窥视"{Yi(0), Yi(1)} 。我们称这一假设为unconfoundedness.

假设 (2.6) 似乎很难在实际中使用,因为它涉及到连续随机变量的条件。然而,正如 Rosenbaum 和 Rubin(1983 年)所指出的,通过考虑倾向得分 e(x)=\mathbb{P}\begin{bmatrix}W_i=1 \big| X_i=x\end{bmatrix}

从统计学上看,倾向得分的一个关键属性是,它是一个平衡得分:如果(2.6)成立,那么实际上

\{Y_i(0),Y_i(1)\}\perp W_i | e(X_i),\quad(2.8)

 也就是说,实际上只需要控制 e(X)而不是 X,就可以消除与非随机干预分配相关的偏差。我们可以通过以下方法验证这一说法:

\begin{aligned} &\mathbb{P}\left[W_{i}=w \big| \{Y_{i}(0), Y_{i}(1)\big\} , e(X_{i})\right] \\ &=\int_{\mathcal{X}}\mathbb{P}\left[W_i=w \big| \{Y_i(w)\} ,X_i=x\right]\mathbb{P}\left[X_i=x \big| \{Y_i(w)\} , e(X_i)\right] dx \\ &=\int_{\mathcal{X}}\mathbb{P}\left[W_i=w \big| X_i=x\right]\mathbb{P}\left[X_i=x \big| \big\{Y_i(w)\big\} , e(X_i)\right] dx\quad\text{(unconf.)} \\ &=e(X_{i})\mathbf{1}_{w=1}+(1-e(X_{i}))\mathbf{1}_{w=0}. \end{aligned}

(2.8)的含义是,如果我们能将观察结果划分为倾向得分 e(x)值(几乎)恒定的组别,那么我们就能通过 \hat{\tau}_{AGG} 的变体持续估计平均干预效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1921234.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python-小理与他的画(赛氪OJ)

[题目描述] 小理是个画家&#xff0c;他希望有一天他的画能让心仪的她看到。 只是后来她有了他&#xff0c;他却只有他的画&#xff0c;他望着他的画&#xff0c;默默的发呆。 可惜做题的你&#xff0c;画不出他画的她&#xff0c;所以&#xff0c;我们只好画点简单的画&#x…

MFC扩展库BCGControlBar Pro v35.0 - 可视化管理主题等全新升级

BCGControlBar库拥有500多个经过全面设计、测试和充分记录的MFC扩展类。 我们的组件可以轻松地集成到您的应用程序中&#xff0c;并为您节省数百个开发和调试时间。 BCGControlBar专业版 v35.0已全新发布了&#xff0c;这个版本改进类Visual Studio 2022的视觉主题、增强对多个…

土壤分析仪:解密土壤之奥秘的科技先锋

在农业生产和生态保护的道路上&#xff0c;土壤的质量与状况一直是我们关注的焦点。土壤分析仪&#xff0c;作为现代科技在农业和环保领域的杰出代表&#xff0c;以其高效、精准的分析能力&#xff0c;为我们揭示了土壤的奥秘&#xff0c;为农业生产提供了科学指导&#xff0c;…

只为拿证,软考中级哪个科目比较简单?

在探讨软考中级哪个最容易过时&#xff0c;我们首先需要了解软考的类别和具体的中级证书种类。软考全称为计算机技术与软件专业技术资格水平考试&#xff0c;是全国统一的考试&#xff0c;其证书由人力资源和社会保障部和国家工业和信息化部门联合颁发&#xff0c;具有很高的证…

cuda缓存示意图

一、定义 cuda 缓存示意图gpu 架构示意图gpu 内存访问示意图 二、实现 cuda 缓存示意图 DRAM: 通常指的是GPU的显存&#xff0c;位于GPU芯片外部&#xff0c;通过某种接口&#xff08;如PCIE&#xff09;与GPU芯片相连。它是GPU访问的主要数据存储区域&#xff0c;用于存储…

Git 详解(原理、使用)

git 快速上手请看这篇博客 Git 快速上手 1. 什么是 Git Git 是目前最主流的一个版本控制器&#xff0c;并且是分布式版本控制系统&#xff0c;可以控制电脑上所有格式的文档 版本控制器&#xff1a;记录每次修改以及版本迭代的管理系统 对于文本文件&#xff0c;可以记录每次…

AI就业指导机器人,你的专属职业导航灯!

本文由 ChatMoney团队出品 介绍说明 Hey&#xff01;亲爱的小伙伴们&#xff0c;今天我要给大家带来一个职场利器——AI就业指导机器人&#xff01;&#x1f916; 在这个充满变数的职场江湖&#xff0c;找到一份既能养家糊口又能实现自我价值的工作是多么重要。但是&#xff…

springCloud整合Dubbo案例

前言&#xff1a; 好久没有使用dubbo了&#xff0c;温习一下。 一、先搭建一个SpringCloud框架 整体框架如下图 1. 先创建一个父工程&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4…

【Qt 初识】QPushButton 的详解以及 Qt 中的坐标

文章目录 1. Qt 中的信号槽机制 &#x1f34e;2. 通过图形化界面的方式实现 &#x1f34e;3. 通过纯代码的方式实现按钮版的HelloWorld &#x1f34e;4. 设置坐标 &#x1f34e; 1. Qt 中的信号槽机制 &#x1f34e; 》&#x1f427; 本质就是给按钮的点击操作&#xff0c;关联…

Nodejs 第八十四章(ElasticSearch搜索)

ElasticSearch基本用法在之前的篇章介绍过了 这里不在过多阐述 模拟假数据 安装库 faker-js/faker 模拟假数据的一个库非常好用支持中文使用中文 locale: [zh_CN], 设置即可生成名字&#xff0c;邮箱&#xff0c;手机号&#xff0c;id&#xff0c;年龄&#xff0c;性别生成完成…

【自然语言处理】面向新冠肺炎的社会计算应用

面向新冠肺炎的社会计算应用 1 任务目标 1.1 案例简介 新冠肺炎疫情牵动着我们每一个人的心&#xff0c;在这个案例中&#xff0c;我们将尝试用社会计算的方法对疫情相关的新闻和谣言进行分析&#xff0c;助力疫情信息研究。本次作业为开放性作业&#xff0c;我们提供了疫情…

软件安装下载失败,常见问题汇总(微软软件必备运行库)

文章目录 前言一、卸载软件二、激活软件无法打开&#xff1f;三、安装软件必备运用库扩展&#xff1a;win64位操作系统跟win32位操作系统区别之处 前言 我们在安装激活一些常用的办公软件&#xff0c;如&#xff1a;visio、Matlab、office等等&#xff0c;经常会遇到各种问题&…

Feature Alignment and Uniformity for Test Time Adaptation--论文笔记

论文笔记 资料 1.代码地址 https://github.com/SakurajimaMaiii/TSD 2.论文地址 https://arxiv.org/abs/2303.10902 3.数据集地址 论文摘要的翻译 TTA在接收训练分布外的测试域样本时对深度神经网络进行自适应。在这样设置下&#xff0c;模型只能访问在线未标记的测试样…

在conda的环境中安装Jupyter及其他软件包

Pytorch版本、安装和检验 大多数软件包都是随Anaconda安装的&#xff0c;也可以根据需要手动安装一些其他软件包。 目录 创建虚拟环境 进入虚拟环境 安装Jupyter notebook 安装matplotlib 安装 pandas 创建虚拟环境 基于conda包的环境创建、激活、管理与删除http://t.cs…

云计算【第一阶段(29)】远程访问及控制

一、ssh远程管理 1.1、ssh (secureshell)协议 是一种安全通道协议对通信数据进行了加密处理&#xff0c;用于远程管理功能SSH 协议对通信双方的数据传输进行了加密处理&#xff0c;其中包括用户登录时输入的用户口令&#xff0c;建立在应用层和传输层基础上的安全协议。SSH客…

2个月拿下TOGAF证书的一点心得分享,干货很多!

人物背景介绍&#xff1a; 从报名TOGAF考试到拿证&#xff0c;只用了两个月不到的时间。 考试成绩&#xff1a;TOGAF L1L2通过&#xff0c;L1获得87分&#xff0c;L2 获得70分。 引言&#xff1a; TOGAF证书作为国际架构标准&#xff0c;不仅包括了架构顶点思维&#xff0c…

SpringBoot注解--11--@JSONField @JsonProperty

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 一个问题&#xff1a;后端实体类isXXX开头的属性&#xff0c;传到前端后自动去掉is解决方法&#xff1a; JsonProperty和JSONField1.简介2.注解的区别2.1 底层框架不…

使用pip或conda离线下载安装包,使用pip或conda安装离线安装包

使用pip或conda离线下载安装包&#xff0c;使用pip或conda安装离线安装包 一、使用pip离线下载安装包1. 在有网络的机器上下载包和依赖2. 传输离线安装包 二、在目标机器上离线安装pip包三、使用conda离线下载安装包1. 在有网络的机器上下载conda包2. 传输conda包或环境包3. 在…

基于QT开发的反射内存小工具

前言 最近项目需要需要开发一个反射内存小工具&#xff0c;经过2天的修修改终于完成了。界面如下&#xff1a; 功能简介 反射内存指定地址数据读取反射内存指定地址数据写入反射内存指定地址数据清理十进制、十六进制、二进制数据相互转换 部分代码 void RfmMain::setWOthe…

十七、计算机视觉-图像平滑处理

提示&#xff1a;云峰 文章目录 前言一、均值滤波&#xff08;Mean Filtering&#xff09;二、高斯滤波器&#xff08;Gaussian Filter&#xff09;&#xff1a;三、中值滤波器&#xff08;Median Filter&#xff09; 前言 在本节中&#xff0c;我们将探讨图像处理中的平滑处理…