工具变量模型及 Stata 具体操作步骤

news2024/11/23 10:57:09

目录

一、引言

二、文献综述

三、理论原理

四、实证模型

五、程序代码及解释

六、代码运行结果


一、引言

在实证研究中,我们常常面临内生性问题,即解释变量与误差项相关,这可能导致估计结果的偏差和不一致。工具变量(Instrumental Variable,简称 IV)方法是解决内生性问题的一种常用手段。本文将对工具变量模型进行文献综述,介绍其理论原理,构建实证模型,并通过 Stata 软件进行具体操作,包括稳健性检验。

二、文献综述

工具变量方法在众多学科领域的实证研究中都扮演着至关重要的角色。在经济学领域,Angrist 和 Krueger(1991)利用出生季度作为教育年限的工具变量,巧妙地解决了教育对收入影响研究中的内生性问题,为后续相关研究提供了经典范例。Card(1995)在研究教育回报率时,也采用了创新的工具变量策略,进一步丰富了工具变量在劳动经济学中的应用。

在社会学研究中,Manski(1993)探讨了工具变量在社会网络分析中的应用,为理解个体行为和社会结构之间的关系提供了新的视角。此外,Sobel(2002)强调了在社会交互作用研究中正确选择和运用工具变量的重要性,以获得更准确和可靠的结论。

在医学领域,研究人员常常面临治疗措施选择的内生性问题。例如,Rosenbaum 和 Rubin(1983)提出使用工具变量来评估某种治疗方法对患者康复效果的真实影响,从而避免因患者自身特征导致的偏差。

这些研究都充分展示了工具变量方法在解决内生性问题、揭示变量之间真实因果关系方面的强大能力。然而,工具变量的选择并非易事,需要深入的理论思考和对研究背景的充分了解。如果工具变量不符合相关性和外生性的严格条件,可能会导致估计结果的偏差甚至错误的结论。因此,在应用工具变量方法时,研究者必须谨慎选择,并通过一系列的检验来验证工具变量的有效性。

三、理论原理

 

四、实证模型

假设我们旨在研究教育水平(edu)对个人收入(income)的影响,然而,由于诸如个人能力(ability)等难以观测的因素可能同时作用于教育水平和收入,从而导致内生性问题。为解决这一问题,我们选取个人所在地区的平均教育水平(avg_edu)作为工具变量。


 

通过构建这些不同形式和考虑不同因素的实证模型,我们能够更准确地探究教育水平对收入的影响,并揭示潜在的经济机制和规律。

五、程序代码及解释

// 导入数据
use "your_data_file.dta", clear

// 第一阶段回归:工具变量对内生变量的回归
reg edu avg_edu  // 此代码执行普通最小二乘回归,以工具变量 avg_edu 作为自变量,内生变量 edu 作为因变量,估计两者之间的线性关系。

// 保存第一阶段回归的预测值
predict edu_hat  // 这一步骤基于上一步的回归结果,生成内生变量 edu 的预测值,并将其命名为 edu_hat 。

// 第二阶段回归:被解释变量对预测值的回归
reg income edu_hat  // 这里以被解释变量 income 作为因变量,第一阶段得到的预测值 edu_hat 作为自变量,进行普通最小二乘回归,从而得到最终关于被解释变量和预测值的估计结果。

// 弱工具变量检验
ivregress 2sls income edu (avg_edu = )  // 此代码执行两阶段最小二乘法回归,并同时进行弱工具变量检验。其中,2sls 表示两阶段最小二乘法,income 是被解释变量,edu 是内生解释变量,avg_edu 是工具变量。

estat firststage  // 此命令用于查看第一阶段回归的详细统计结果,包括 F 统计量、R-squared 等,以评估工具变量的解释能力和相关性。

// 过度识别检验
ivreg2 income edu (avg_edu = ), overid  // 这一代码执行过度识别检验,用于判断工具变量是否满足过度识别约束。如果检验结果不拒绝原假设,说明工具变量的选择是合理的。

六、代码运行结果

运行上述代码后,将得到一系列结果,包括回归系数、标准误、t 值、p 值等。

第一阶段回归结果可以判断工具变量对内生变量的解释程度。具体会得到回归系数、标准误、R-squared 等统计量。R-squared 较高说明工具变量对内生变量有较好的解释能力。

第二阶段回归结果给出了教育水平对收入影响的估计值。我们重点关注 edu_hat 的回归系数,其大小和显著性反映了教育水平对收入的影响程度和统计显著性。

弱工具变量检验结果可以判断工具变量是否足够强。常见的判断指标是第一阶段 F 统计量,如果 F 统计量大于经验阈值(通常为 10),则可以认为不存在弱工具变量问题。

过度识别检验结果可以判断工具变量的有效性。如果 p 值大于显著水平(如 0.05),则不拒绝工具变量有效的原假设。

需要注意的是,在实际应用中,要根据数据的特点和研究问题的具体情况选择合适的工具变量,并对结果进行仔细的分析和解释。

实证中常见的五类工具变量文献回顾梳理,为研究中寻找工具变量提供参考 (qq.com)icon-default.png?t=N7T8https://mp.weixin.qq.com/s?__biz=MjM5OTMwODM1Mw==&mid=2448091140&idx=1&sn=5922643d61e355db3c1a0ef48954489e&chksm=b323352a8454bc3cca4574c7204b642071b703afe0f9c90195943516139126231f50e67f8e4b#rd 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1986818.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

<数据集>agv仓储机器人识别数据集<目标检测>

数据集格式:VOCYOLO格式 图片数量:1514张 标注数量(xml文件个数):1514 标注数量(txt文件个数):1514 标注类别数:3 标注类别名称:[G1PB2000_Paleteira_AGVS BYD, G1RB5000, AGV-P] 序号类别名称图片数…

Web性能监测的利器Performance Observer!!

前言 前段时间在研究前端异常监控平台,在思考性能监控时,想到了浏览器自带的观察者以及页面生命周期API 。于是在翻查资料时发现了,Performance ObserverAPI。正好趁着这个机会给大家好好讲讲Performance Observer API Performance Observe…

ArcGIS基础:二维面要素生成三维体模型

如下,为处理前的二维数据图斑以及需要用到的字段【高度】 使用ArcScene软件打开,找到【拉伸】设置,按照下述顺序进行设置参数,在【拉伸值或表达式】里选择【高度】字段 如下所示,就可以完成二维数据的三维表达&#x…

国产版Sora复现——智谱AI开源CogVideoX-2b 本地部署复现实践教程

目录 一、CogVideoX简介二、CogVideoX部署实践流程2.1、创建丹摩实例2.2、配置环境和依赖2.3、上传模型与配置文件2.4、开始运行 最后 一、CogVideoX简介 智谱AI在8月6日宣布了一个令人兴奋的消息:他们将开源视频生成模型CogVideoX。目前,其提示词上限为…

2020C题 中小微企业的信贷决策论文分析复现笔记

比赛题目: 在实际中,由于中小微企业规模相对较小,也缺少抵押资产,因此银行通常是依据信贷政策、企业的交易票据信息和上下游企业的影响力,向实力强、供求关系稳定的企业提供贷款,并可以对信誉高、信贷风险…

“MySQL中的空间索引技术深度解析:利用Spatial Key优化地理空间数据查询“

目录 简介 空间数据类型 GEOMETRY(抽象基类) POINT LINESTRING POLYGON MULTIPOINT MULTILINESTRING MULTIPOLYGON GEOMETRYCOLLECTION 总结 函数 ST_GeomFromText() ST_X ST_Y ST_AsText 空间函数 总结 坐标系 WGS 84坐标系&#x…

03 LVS+Keepalived群集

3.1 Keepalived 双机热备基础知识 Keepalived 起初是专门针对 LVS 设计的一款强大的辅助工具,主要用来提供故障切换(Failover)和健康检査(HealthChecking)功能--判断LVS 负载调度器、节点服务器的可用性,当 master 主机出现故障及时切换到 backup 节点保…

(二十二)【Jmeter】深入刨析监听器:常用监听器常用使用场景、优缺点及操作实例

简述 在Jmeter中,监听器(Listener)是一个重要的组件,用于收集和显示测试结果。监听器的作用包括: 收集测试结果:监听器可以实时收集JMeter测试执行过程中的数据,包括请求和响应的各种信息。显示测试结果:监听器可以将收集到的测试结果以不同的方式展示出来,例如以树状…

【第七节】python多线程及网络编程

目录 一、python多线程 1.1 多线程的作用 1.2 python中的 threading 模块 1.3 线程锁 二、python网络编程 2.1 通过socket访问网络 2.2 python2.x中的编码问题 2.3 python3的编码问题 一、python多线程 1.1 多线程的作用 多线程技术在计算机编程中扮演着重要的角色&a…

五大避坑要点,让你轻松避开99%的雷区!随身wifi京东口碑排行榜,随身wifi推荐第一名!

在数字浪潮中,随身WiFi成为我们不可或缺的伴侣,但市场纷繁复杂,如何挑选成为难题。以下五大避坑要点,让你轻松避开99%的雷区! 1.避小就大,信赖旗舰店:远离无名小品牌,选择知名品牌的…

Javacript 高级程序设计(系统学习)

以下为阅读 《Javacript 高级程序设计》部分笔记,待继续完善,后续会进行章节拆分。 第1章 什么是 javascript 历史回顾js 实现 / es / dom / bomjs 版本 javascript 最初为什么设计为单线程? JavaScript 最初设计为单线程的主要原因是出于简…

体验 Whisper ,本地离线部署自己的 ASR 语音识别服务

需求背景 最近看视频,过几天后经常忘记内容,所以有了把重点内容总结提炼到自己知识库的需求,这涉及到了提取视频中的音频数据、离线语音识别等功能。 提取视频中的音频数据,可以使用格式工厂或 FFmpeg 等工具, FFmpe…

详细解析socket

我最近开了几个专栏,诚信互三! > |||《算法专栏》::刷题教程来自网站《代码随想录》。||| > |||《C专栏》::记录我学习C的经历,看完你一定会有收获。||| > |||《Linux专栏》&#xff1…

书生大模型实战营第三期——入门岛——Git基础知识

第三关:Git基础知识 任务如下: 任务描述 破冰活动:自我介绍 每位参与者提交一份自我介绍。 提交地址:GitHub - InternLM/Tutorial: LLM&VLM Tutorial 的 camp3 分支~实践项目:构建个人项目 创建一个个人…

PDF发票解析并将信息回填到前端(2)前端页面

本人前端基础薄弱,此处的前端仅仅是一个练习展示 1. 创建一个前端项目 打开终端使用以下命令创建一个基于webpack模板的新项目 vue init webpack my-project输入命令之后一直点击enter知道项目创建完成即可 进入项目,安装并运行 $ cd my-project //…

ExtJS生成日历组件

文章目录 1.添加日历组件代码2.引入日历组件,创建了补签和取消签到,以及翻页显示的事件 1.添加日历组件代码 首先找到自己项目中对应的Ext的目录,并将日历组件添加到calendar这个目录下,我的是KwDatePicker.js 日历组件代码如下: Ext.define(Ext.calendar.KwDatePicker, {ex…

python six模块是什么

six模块是Python2和3兼容性库,它是为了解决Python2和Python3代码兼容性而产生的,众所周知Python2和Python3版本的分裂给Python开发者们带来了很大的烦恼,为了使代码同时兼容两个版本,往往要增加大量的代码,典型的就有u…

著名人工智能新经济数字经济新能源新质生产力讲师培训师教授专家唐兴通分享人工智能社会学商业模式创新人工智能就业工作与教育学习出海跨境数字化转型数字营销数字销售

添加图片注释,不超过 140 字(可选) 2024 年是人工智能在工作中真正应用的一年。根据微软和领英进行的调查(2024年5月),在过去六个月中,生成式人工智能的使用量几乎翻了一番,全球75%的…

领夹麦克风哪个品牌音质最好?八月领夹式麦克风排行榜

随着移动互联技术的飞速发展,视频内容的消费与创作正以前所未有的速度增长。从直播带货的兴起,到短视频平台的火爆,音频质量作为内容体验的重要组成部分,越来越受到创作者的重视。在这一背景下,无线领夹麦克风凭借其小…

6-8 残差网络(ResNet)

随着我们设计越来越深的网络,深刻理解“新添加的层如何提升神经网络的性能”变得至关重要。更重要的是设计网络的能力,在这种网络中,添加层会使网络更具表现力, 为了取得质的突破,我们需要一些数学基础知识。 残差网络…