合成控制法SCM

news2024/11/25 15:41:36

研究D的处理效应,找一个相似的样本,他们的差异就是处理效应。但:难点就在如何找到相似的样本。那么就通过合成法来合成一个虚拟的重庆。

案例:美国加州香烟法案出台

在这里插入图片描述
在这里插入图片描述

依靠权重来合成一个新的y

  • 假设我们不用SCM,直接靠着线性趋势外推的方式,似乎简单的能得到政策效果。但是存在的质疑:

  • 数据的起点该怎么选?选1970?1977?还是其他?
    在这里插入图片描述

  • DID的思想
    1983-1988年似乎满足平行趋势,假设20包,在对其他州减去20包,形成加州的反事实,在减去真实的加州的值,就是政策效应。
    局限:

  • 这是只有加州一个样本,无法做统计检验。

  • 人为干预选取的1983-1988样本点才满足平行趋势,再往前推一点,就不满足了,那么结论的稳健性呢(比如用1977-1983),也不能满足?
    在这里插入图片描述
    结论,从实验结果来看,线性趋势外推、DID与SCM的估计结果差别大不

SCM合成控制法

  • 用pre的38个样本,加权 y C A ′ y^{CA'} yCA使得与 Y C A Y^{CA} YCA完美重合。
  • 其实,与加州相似(GDP接近,地理位置接近…)的洲权重越大,不相似的越小。
  • post后的距离差就是政策效果。
    在这里插入图片描述
合成结果

两者很接近,表明合成结果很好
在这里插入图片描述

权重结果
  • 注意,单个个体的权重,一定不能太大,否则结果可能出现偏误(估计过大过小)。一般权重(不超过0.5)太大,太大就删掉,再重新估计。
    在这里插入图片描述
最重要的图形分析
  • 此图就是合成的差值相减得到的。

在这里插入图片描述

  • pre前,趋于0
  • post后,表现出差异,越大越好(与0的距离越大)
检验(头发图)
  • 安慰剂检验
    就是对其他的州也进行与CA相似的合成控制法,画得下图。
    如果CA的线与其他的线,差别不大的话,那么就有问题了(红色)。
    如果CA的与其他的线,差别很大,结论ok(黑色)。
第一次:做38次,38个州,

在这里插入图片描述
去掉在pre阶段合成不好的州

第二次:34次,剩下34个州

在这里插入图片描述

第三次:29次,剩下29个州

在这里插入图片描述

第四次:19次,剩下19个州

此时的结果比较好了
在这里插入图片描述

理论

反事实架构的建立

在这里插入图片描述

估算方法

在这里插入图片描述

因子模型解释

在这里插入图片描述

  • δ i \delta_i δi,控制共同的时间趋势。
  • λ t ∗ μ i \lambda_t*\mu_i λtμi,考虑到每个州都有自己的时间趋势,加上一个变系数 μ \mu μ,或者叫异质性。
  • θ t Z i \theta_tZ_i θtZi,控制变量的 Z Z Z取的是时间的平均值,没有下标 t t t
    机器学习的局限:解释变量的个数不多,不好整,并且解释变量在时间维度也有趋势,也不好整。

在这里插入图片描述
A、B、C部分的期望,理论上都为0

模型评估

在这里插入图片描述

  • 指标为MSPE
  • 事前小(合成误差越小越好),事后大(政策效果明显)
  • 或者用RMSPE(MSPE开根号)

在这里插入图片描述

stata演示-代码

  • 画图 最初的样子
    在这里插入图片描述
    #d ;表示告诉stata 看到;换行
    #d cr表示告诉stata 看到cr换行
    在这里插入图片描述
  • 画黑白图的代码
    在这里插入图片描述
  • 补充一点:尽量把控制组的ID设成1,为了后面的for语句好写。
    在这里插入图片描述
合成控制的代码
  • 为何要加y的滞后项?
  • 因为可以使得pre阶段的两条线越接近
    trunit(3):CA的ID是3,是实验组
    trperiod(1989):政策开始的时点,注意,有些政策是1989年6月以后,取1989,反之去1988年。但也不一定,也要根据研究目的来定。【开通高铁的例子】
    在这里插入图片描述

xperiod(1980(1)1988):公共变量(比如lnincome、retprice)的样本期
在这里插入图片描述

  • 通常我们做的pre线是波动大,差异大的,这时就需要调整。尽量多加一些解释变量,然后再适当调整,似乎带有一些的成分。
  • fig 是否画图
  • nested 模型结果计算优化命令
  • allopt 模型结果计算优化命令【但结果很慢】
table、fig结果

注意命令keep('result')
在这里插入图片描述

  • 调入内存,查看权重table2、以及table1的值。图3
  • SCM核心的几部分结果都可以根据上面的代码进行计算了。
    在这里插入图片描述
组合检验(permutation test)-算MSPE

在这里插入图片描述

  • 算MSPE
    在这里插入图片描述

在这里插入图片描述

安慰剂检验

在这里插入图片描述

  • 问题,不同的州(个体)有不同的特征,那么都按实验组的特征(当解释变量)是否对其他的个体(公平)?
  • 不合适,常见的想法:尽可能 多家解释变量,用Lasso的方式挑选出变量。
    在这里插入图片描述

在这里插入图片描述

  • 这里执行的是39个部分的安慰剂检验。

在这里插入图片描述

  • 数据合并
    在这里插入图片描述
  • 画图

在这里插入图片描述

  • 介绍一下经验P值

(不依靠分布,就是一个频率近似替代概率)
在这里插入图片描述

  • 关于此问题(加州禁烟令)的假设检验问题
    在这里插入图片描述
  • 代码
    在这里插入图片描述
  • 结果
    在这里插入图片描述
  • 关于论文安慰剂检验中,如何出掉“分叉”的州,即fig5怎么来的。
    在这里插入图片描述
    keep if MSPE>20*MSPE3这里调节倍数
  • 续上张图
    在这里插入图片描述

levelsof命令:列出非重复的数的ID

  • 思考:关于安慰剂检验的诟病
  • 文章在安慰剂检验中,删掉20、10、4州等,他没有根据~,为啥不删除21、9、3呢?加入人为干预,缺失一定标准。
  • 办法:在每一个州加上一个自己的MSPE。相当于一个加权惩罚迭代。
推断平均政策效果

论文图8
为了回避安慰剂检验的诟病,作者从总体的角度去进一步说明平均的政策效应。
就是看MSPE的前后Ratio比。图中可以发现,大部分都集中在[0,3]左右,差异是比较小的,但是我们的CA,差异最大。特别明显。

在这里插入图片描述

总结

  • 如何确定control组的,如何选取赶紧的Donor pool
  • 关于Z(控制)的选择,很重要,本文的随意性很大,目的都是为了调整pre线完全融合, M S P E p r e MSPE_{pre} MSPEpre近似为0
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2129040.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

文心快码前端工程师观点分享:人机协同关系总结与展望

🎁👉点击进入文心快码 Baidu Comate 官网,体验智能编码之旅,还有超多福利!🎁 本系列视频来自百度工程效能部的前端研发经理杨经纬,她在由开源中国主办的“AI编程革新研发效能”OSC源创会杭州站1…

CloudberryDB 内核分享:Directory Table 底层逻辑与实现原理讲解

在之前的直播中,我们向大家介绍了🔗,为企业AI应用创新提供更高质量的非结构化数据语料输入和知识库支持,感兴趣的朋友可以点击链接阅读。 随着我们的开源数据仓库产品Cloudberry Database(简称“CloudberryDB”&#…

杂七杂八-系统环境安装

杂七杂八-系统&环境安装 1. 系统安装2.环境安装 仅个人笔记使用,感谢点赞关注 1. 系统安装 Windows安装linux子系统WSL2:使用windows系统跑linux程序(大模型) 2.环境安装 目前仅专注于 NLP 大模型 机器学习和前后端的技术学习和分享 感谢大家的关注…

基于spring的博客系统(总)

通过前⾯课程的学习, 我们掌握了Spring框架和MyBatis的基本使⽤, 并完成了图书管理系统的常规功能 开发, 接下来我们系统的从0到1完成⼀个项⽬的开发; 1. 项⽬介绍 使⽤SSM框架实现⼀个简单的博客系统 共5个⻚⾯ 1. 用户登录 2. 博客发表⻚ 3. 博客编辑⻚ 4. 博客…

零工市场小程序是灵活就业的新趋势?

人力资源社会保障部曾发文《人力资源社会保障部 民政部 财政部 住房和城乡建设部 国家市场监管总局关于加强零工市场建设 完善求职招聘服务的意见》。 找零工在传统情况下会有比较多的困难,比如能能够掌握的信息较少、不知道工作单位是否靠谱等等的问题&#xff0c…

心觉:如何打破用脑学习的瓶颈?教你用心学习,实现真正蜕变!

Hi,我是心觉,与你一起玩转潜意识、脑波音乐和吸引力法则,轻松掌控自己的人生! 挑战每日一省写作167/1000天 我们经常听到父母对孩子说要“用心学习,用心学习” 大概意思是告诉孩子学习的时候要专注,要认真…

【9月持续更新】国内ChatGPT-4中文镜像网站大全

一、国内大模型与ChatGPT的区别 🧠 国内大模型:专注于国内市场,支持本土企业及用户,适用于中文语境下的客服、教育、内容生成等应用场景。ChatGPT:全球适用性强,但在中文环境下的本地化程度不如国内大模型…

Arm GIC-v3中断原理及验证(通过kvm-unit-tests)

一、参考连接 gic-v3相关原理可参考https://zhuanlan.zhihu.com/p/520133301 本文主要通过开源测试工具kvm-unit-tests,针对GIC的中断进行一系列验证,这样可以直入中断底层,熟悉整个原理。 kvm-unit-tests官网为kvm-unit-tests / KVM-Unit…

『 Linux 』协议的定制

文章目录 协议的概念序列化和反序列化网络计算器套接字接口的封装服务端大致框架协议的定制Request的序列化与反序列化Response的序列化与反序列化报头的封装的解包网络服务服务端的封装已提取报文的移除客户端的封装客户端的调用服务端接收多个请求 JSON 自动序列化反序列化使…

QT打开摄像头采集

QT打开摄像头采集 今天好不容易把opencv的环境装好,然后想学习一下人脸识别的功能,但是在图书馆坐了4个多小时了,屁股疼就先写个摄像头采集的功能,明天继续学习吧,废话不多,嚼个奶片开始发车!&…

3.安卓逆向-java语言控制流和数据类型

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 内容参考于:图灵Python学院 上一个内容:2.安卓逆向-初识java语言 上一个内容里写了编写java语言代码的环境搭建,也就是下载…

你的个人生成式AI创新课程

我曾经写过许多博客文章,讨论如何使用生成式AI(GenAI)工具,例如OpenAI ChatGPT、微软Copilot和Google Gemini来提升专业效率和个人发展。然而,我们必须从仅仅使用这些GenAI工具来提高生产力的思维模式,转变…

echarts 关系图 legend 图例不显示问题

关系图希望显示图例,如下效果: 按照常规echarts图表的配置,配置完legend,图例居然不显示。 legend: {show: true,icon: circle,left: left }经过一番查找和思考,原来是因为series配置中没有设置categories项&#xf…

通信工程学习:什么是SLF签约数据定位功能

SLF:签约数据定位功能 SLF(Subscription Locator Function)即签约数据定位功能,是IMS(IP Multimedia Subsystem)IP多媒体子系统体系结构中的一个关键组成部分。其主要功能是在网络运营商部署了多个独立可寻…

Android平台RTMP|RTSP播放器如何回调YUV或RGB数据?

技术选型 我们知道,Android平台一般RTMP|RTSP播放器通常不直接提供回调YUV或RGB数据的功能。如果播放端有视觉分析或类似的需求,需要播放端,能支持YUV或ARG的数据回调,一般来说,可参考的方法如下: 1. 使用…

尚硅谷的尚乐代驾项目

项目源码 乐尚代驾项目: 重做乐尚代驾项目 (gitee.com) 一 项目介绍 1 介绍 【**乐尚代驾**】代驾是一种新型的出行服务模式,主营业务:酒后代驾、商务代驾、长途代驾,其主要特点是通过线上平台为用户提供代驾服务,伴随中国家…

Node.js学习记录(二)

目录 一、express 1、初识express 2、安装express 3、创建并启动web服务器 4、监听 GET&POST 请求、响应内容给客户端 5、获取URL中携带的查询参数 6、获取URL中动态参数 7、静态资源托管 二、工具nodemon 三、express路由 1、express中路由 2、路由的匹配 3、…

Navicat备份数据库

Navicat备份数据库 📔 千寻简笔记介绍 千寻简文库已开源,Gitee与GitHub搜索chihiro-doc,包含笔记源文件.md,以及PDF版本方便阅读,文库采用精美主题,阅读体验更佳,如果文章对你有帮助请帮我点一…

【Hot100】LeetCode—300. 最长递增子序列

目录 1- 思路题目识别动规五部曲 2- 实现⭐最长递增子序列——题解思路 3- ACM 实现 原题链接:300. 最长递增子序列 1- 思路 题目识别 识别1 :给出一个数组输入 nums识别2:严格递增的子序列,子序列可以是不连续的 动规五部曲 …

数据处理与统计分析篇-day02-Linux进阶

day02-Linux进阶 补充昨日内容 Linux基础 文件编辑 命令模式 编辑模式 esc回到命令模式 正常编辑 底行(底线)模式 查看Linux命令帮助文档 # --help 可以查看命令的详细信息 命令名 --help ​ # 例如: ls --help ​ # man 可以查看命令的主要(简单)信息 man 命令名…