【Python实战因果推断】38_双重差分9

news2025/1/11 22:47:51

目录

Doubly Robust Diff-in-Diff

Propensity Score Model

Delta Outcome Model

All Together Now


Doubly Robust Diff-in-Diff

另一种纳入干预前协变变量和时间不变协变变量以考虑条件平行趋势的方法是制作双稳健差分法(DRDID)。要做到这一点,您学习了如何制作双重稳健估计器。不过,您需要做一些调整。首先,由于 DID 采用的是 Δy 模型,因此您不需要原始结果模型,而是需要一个随时间变化的 delta 结果模型。其次,由于您只关心 ATT,您只需要从对照单位中重建治疗人群。当我向您展示建立 DRDID 的步骤时,所有这些都会变得更有意义。

Propensity Score Model

DRDID 的第一步是建立倾向得分模型 \hat{e}(X),利用干预前的协变量来估计一个单位来自干预组的概率。该模型不考虑时间维度,这意味着您只需要一个时期的数据就可以对其进行估算:

 unit_df = (mkt_data_all
 # keep only the first date
 .astype({"date": str})
 .query(f"date=='{mkt_data_all['date'].astype(str).min()}'")
 .drop(columns=["date"])) # just to avoid confusion
 ps_model = smf.logit("treated~C(region)", data=unit_df).fit(disp=0)

Delta Outcome Model

接下来,您需要 Δy 的结果模型,这意味着首先需要构建 delta 结果数据。为此,您需要求出干预前和干预后的平均结果之差。这样做之后,由于时间维度已经被区分开来,因此每个单位都会有一行数据:

 delta_y = (
 mkt_data_all.query("post==1").groupby("city")["downloads"].mean()
 - mkt_data_all.query("post==0").groupby("city")["downloads"].mean()
 )

现在您有了Δy,您可以将其加入到单元数据集,并在其中匹配结果模型:

 df_delta_y = (unit_df
 .set_index("city")
 .join(delta_y.rename("delta_y")))
 outcome_model = smf.ols("delta_y ~ C(region)", data=df_delta_y).fit()

All Together Now

是时候将所有数据连接起来了。让我们先将所有需要的数据收集到一个数据框架中。对于最终估计器,您需要实际 Δy、倾向得分和 delta 结果预测值。为此,您可以从用于建立结果模型的 df_delta_y 开始,同时使用倾向得分模型 \hat{e}(X) 和结果模型 \widehat{m}(x) 进行预测。 结果又是一个单级数据框:

 df_dr = (df_delta_y
 .assign(y_hat = lambda d: outcome_model.predict(d))
 .assign(ps = lambda d: ps_model.predict(d)))
 df_dr.head()

有了这些,让我们来想一想双重稳健性 DID 会是什么样子。与所有 DID 一样,ATT 估计值是在单位接受治疗后的趋势与在控制下的趋势之间的差值。由于这些都是反事实量,我将分别用 Δy1 和 Δy0 表示。因此,概括地说,ATT 的计算公式为

\hat{\tau}_{DRDID}=\widehat{\Delta y}_1^{DR}-\widehat{\Delta y}_0^{DR}

我承认这不算什么,但这是一个很好的开始。从这里开始,你需要考虑如何以双重稳健的方式估算 \Delta y_{D}\mathrm{s}

让我们关注 Δy1。要估计治疗后的反事实,您需要用倾向得分的倒数对 y-\widehat{m}(x) 进行加权,从而重构整个人群的 y1。在这里,由于您只关心 ATT,所以不需要这样做;您已经得到了干预人群。因此,第一项变为

\widehat{\Delta y_1}^{DR}=1/N_{tr_i\in tr}(\Delta y-\widehat{m}(X))

对于另一项,您可以使用权重 1/(1-\hat{e}(x)) 来重建对照组下的普通人群。但同样,由于您关心的是 ATT,因此需要重建对照下的干预人群。要做到这一点,您只需用权重乘以成为治疗单位的几率,方便地说,这就是倾向得分:

w_{co}=\hat{e}(X)\frac{1}{1-\hat{e}(X)}

定义了权重后,就可以利用它来获得 Δy0 的估计值:

\widehat{\Delta y}_0^{DR}=\sum_{i\in co}w_{co}(\Delta y-\widehat{m}(X))/\sum w_{co}

差不多就是这样。和往常一样,代码看起来比数学简单得多:

 tr = df_dr.query("treated==1")
 co = df_dr.query("treated==0")
 dy1_treat = (tr["delta_y"] - tr["y_hat"]).mean()
 w_cont = co["ps"]/(1-co["ps"])
 dy0_treat = np.average(co["delta_y"] - co["y_hat"], weights=w_cont)
 print("ATT:", dy1_treat - dy0_treat)
 
 ATT: 1.6773180394442853

它非常接近真实 ATT,也非常接近您之前在 DID 中添加协变量时得到的 ATT。这样做的好处是您可以两次获得正确的估计结果。如果倾向得分模型或结果模型都正确(但不一定都正确),DRDID 就会起作用。为了避免本章太长,我就不在这里做了,但我鼓励你尝试用随机生成的列替换 ps 列或 y_hat 列,然后重新计算前面的估计值。你会发现最终结果仍然接近实际结果。

就像您对横截面数据进行双重稳健估计一样,要得到 DRDID 的置信区间,您需要使用您之前实现的块引导函数,将整个过程--结果模型、倾向得分模型--放在一个单一的估计函数中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1930044.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

鸿蒙语言基础类库:【@system.brightness (屏幕亮度)】

屏幕亮度 说明: 从API Version 7 开始,该接口不再维护,推荐使用新接口[ohos.brightness]。本模块首批接口从API version 3开始支持。后续版本的新增接口,采用上角标单独标记接口的起始版本。 导入模块 import brightness from sy…

【接口自动化_13课_接口自动化总结】

一、自我介绍 二、项目介绍 自己的职责、项目流程 1)功能测试,怎么设计用例的--测试策略 2)功能测试为什么还有代码实现,能用工具实现,为什么还用代码实现。 基本情况 项目名称:项目类型:项目测试人员…

ubantu22.04安装OceanBase 数据库

1、管理员启动cmd,运行 sudo bash -c "$(curl -s https://obbusiness-private.oss-cn-shanghai.aliyuncs.com/download-center/opensource/service/installer.sh)" 2、提示如下代表安装完成 3、修改数据库配置文件的密码 sudo vim /etc/oceanbase.cnf 然后保存退…

如何申请自费访问学者?自费访问学者材料要哪些?

四、申请自费访问学者需要准备哪些材料 访问学者的申请材料应包括个人简历、推荐信、成绩单、研究计划或课题、语言能力证明等,资费访问学者需提交财务证明。 申请表格填写基本个人信息、访学时间、访学目的等。且应在个人简历详细列出教育背景、工作经历、学术成…

一张图生成绘画全过程,这下人人都成“原画师”了

玩过SD的应该都知道ControlNet吧,最近ControlNet的作者Lvmin Zhang 又搞了一个开源项目PaintsUndo,在Github刚上线就收获了2.7k Star。 只需要上传一张静态图像,PaintsUndo就可以根据提供的图像自动生成对应的绘画全过程视频。 展示从一张白…

【python报错已解决】Stack Overflow

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引言 在开发的旅程中,我们难免会遇到各种各样的报错信息,这些报错就像旅途中的绊脚石,阻挡…

GA-Kmeans-Transformer-GRU时序聚类+状态识别组合模型,创新发文无忧!

GA-Kmeans-Transformer-GRU时序聚类状态识别组合模型,创新发文无忧! 目录 GA-Kmeans-Transformer-GRU时序聚类状态识别组合模型,创新发文无忧!效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.GA-Kmeans-Transformer-GRU时…

0601大学物理电磁篇 静电场中的导体和电介质

静电场中的导体和电介质01 6-1静电场中的导体 6-1静电场中的导体

【Hot100】LeetCode—155. 最小栈

目录 题目1- 思路2- 实现⭐155. 最小栈——题解思路 3- ACM 实现 题目 原题连接&#xff1a;155. 最小栈 1- 思路 思路 最小栈 ——> 借助两个栈来实现 2- 实现 ⭐155. 最小栈——题解思路 class MinStack {Stack<Integer> data;Stack<Integer> min;public …

如何在Linux上部署Ruby on Rails应用程序

在Linux上部署Ruby on Rails应用程序是一个相对复杂的过程&#xff0c;需要按照一系列步骤进行。下面是一个基本的部署过程&#xff0c;涵盖了从安装所需软件到部署应用程序的所有步骤。 安装必要的软件 在部署Ruby on Rails应用程序之前&#xff0c;需要确保Linux系统上安装了…

etime:拓展time

拓展C库的time模块&#xff0c;时间格式转换、代码块计时器。

公司想无偿裁员,同事赖着不走

关注卢松松&#xff0c;会经常给你分享一些我的经验和观点。 这招好像也不错! 事情是这样的&#xff1a;某公司准备把成本高的员工都裁掉&#xff0c;主要包含研发部和程序员&#xff0c;总共18个人&#xff0c;准备裁掉10人&#xff0c;因为他们工资开的太高了&#xff0c;…

CH390H+STM32F1+LWIP

文章目录 1、CH390芯片介绍2、电路部分3、LWIP调试3.1修改点13.2 修改点2 4、结果展示参考 1、CH390芯片介绍 官网地址&#xff1a; 南京沁恒微电子股份有限公司 特点&#xff1a; 2、电路部分 CH390及接口&#xff1a; STM32F1引脚&#xff1a; 不含LWIP的demo及LWIP…

数据安全评估师CCRC-DSA:数据安全如何“护航”创新发展

在2024年的中关村论坛年会关于数据安全治理与发展的讨论中&#xff0c;新加坡资讯通信媒体发展局局长柳俊泓指出&#xff0c;根据预测&#xff0c;今年全球将产生约147泽字节的数据量&#xff0c;这意味着每个地球上的人都拥有相当于150部iPhone的数据量。 柳俊泓强调&#xf…

【Linux网络】poll{初识poll / poll接口 / poll vs select / poll开发多客户端echo服务器}

文章目录 1.初识pollpoll与select的主要联系与区别poll的原理poll的优点poll的缺点poll vs select 2.poll开发多客户端echo服务器封装套接字接口Makefile主函数日志服务聊天服务器 1.初识poll poll是Linux系统中的一个系统调用&#xff0c;它用于监控多个文件描述符&#xff08…

RocketMQ实现分布式事务

RocketMQ的分布式事务消息功能&#xff0c;在普通消息基础上&#xff0c;支持二阶段的提交。将二阶段提交和本地事务绑定&#xff0c;实现全局提交结果的一致性。 1、生产者将消息发送至RocketMQ服务端。 2、RocketMQ服务端将消息持久化成功之后&#xff0c;向生产者返回Ack确…

2. LangChain4j 之AI Services

一: AI Services介绍 LangChain4j提供了很多基础的组件&#xff0c;每次使用都需要你编写大量的样板代码&#xff0c;LangChain4j就提供了一个高级的组件AI Services&#xff0c;它可以简化与大模型(LLM)和其他组件交互的复杂度。让开发者更专注于业务逻辑&#xff0c;而不是底…

【JavaScript】聊一聊js中的浅拷贝与深拷贝与手写实现

前言 什么是深拷贝与浅拷贝&#xff1f;深拷贝与浅拷贝是js中处理对象或数据复制操作的两种方式。‌在聊深浅拷贝之前咱得了解一下js中的两种数据类型&#xff1a; 基本数据类型&#xff08;6种&#xff09;String、Number、Object、Boolean、null、undefined、symbol&#xff…

李秘书讲写作:面对交通违规处罚不当或误判时怎么办?

李秘书讲写作&#xff1a;面对交通违规处罚不当或误判时怎么办&#xff1f; #李秘书讲写作#在这节讲三个问题&#xff0c;最后一个问题对你非常有用&#xff01;不信请看&#xff1a; 一、个人交通违规处罚不当或误判一般有哪些情形&#xff1f; 在现代社会&#xff0c;交通违规…

框架设计MVP

重点&#xff1a; 1.presenter里面包含view和model 2.和MVP不同的是View和Model之间不进行交互 3.view包含presenter,view通过presenter反向处理逻辑。 链接&#xff1a; MVP简单实现_安卓mvp presenter-CSDN博客 Model.h #pragma once //Model数据处理器 class Model { …