内生性检验与过度识别检验

news2024/11/14 6:57:04

目录

一、文献综述

二、理论原理

三、实证模型

 四、程序代码


一、文献综述

内生性问题在经济学和社会科学研究中一直是一个关键挑战,众多学者致力于寻找有效的方法来解决这一问题并确保研究结果的可靠性。

Angrist 和 Krueger(1991)在研究教育回报率时,巧妙地运用了工具变量法,为解决内生性问题提供了经典范例。他们利用出生季度作为工具变量,成功地分离出教育对收入的因果效应。这一研究不仅展示了工具变量法的强大潜力,也为后续研究提供了重要的思路和方法借鉴。

Wooldridge(2010)在其著作中系统地阐述了内生性问题的产生原因、影响以及各种解决方法。他详细介绍了工具变量法、固定效应模型、差分法等在处理内生性问题中的应用,并通过实际案例进行了深入分析。这本书成为了许多研究者在处理内生性问题时的重要参考书籍。

Stock 和 Watson(2011)则在计量经济学的教学与研究中强调了内生性检验的重要性。他们指出,在进行实证研究时,必须对可能存在的内生性问题进行严格的检验,否则得出的结论可能是不准确的。他们介绍了多种内生性检验方法,如豪斯曼检验等,并讨论了这些方法的优缺点和适用范围。

在过度识别检验方面,Hansen(1982)提出了 Hansen J 检验,这一检验方法在小样本下具有较好的性质,被广泛应用于工具变量的有效性检验。Sargan(1958)提出的 Sargan 检验在大样本下渐进有效,也是常用的过度识别检验方法之一。

过往的研究表明,内生性问题和过度识别问题在实证研究中不可忽视。学者们通过不断探索和创新,提出了各种有效的方法和检验手段,为提高实证研究的质量做出了重要贡献。

二、理论原理

  1. 内生性问题

    (1)内生性产生的原因

    • 遗漏变量:在建立回归模型时,如果遗漏了某些重要变量,这些被遗漏的变量可能同时影响解释变量和被解释变量,从而导致内生性问题。例如,在研究企业绩效与研发投入的关系时,如果遗漏了企业的管理水平这一变量,而管理水平既可能影响企业的研发投入决策,又可能直接影响企业绩效,就会产生内生性问题。

    • 测量误差:当解释变量或被解释变量的测量存在误差时,也可能引发内生性问题。如果测量误差与误差项相关,那么估计结果就会出现偏差。比如,在调查居民收入时,由于受访者可能隐瞒真实收入或者记忆不准确等原因,导致收入变量的测量存在误差,这种误差如果与影响居民消费的其他因素相关,就会使消费与收入之间的关系出现内生性问题。

    • 双向因果关系:当解释变量和被解释变量之间存在双向因果关系时,也会产生内生性问题。例如,经济增长可能会促进教育水平的提高,而教育水平的提高又反过来促进经济增长,在这种情况下,直接用普通最小二乘法估计教育对经济增长的影响,就会得到有偏的结果。

     

    (2)内生性对估计结果的影响

    当存在内生性问题时,普通最小二乘法(OLS)估计结果是有偏且不一致的。这是因为内生性使得解释变量与误差项相关,违反了 OLS 估计的基本假设。具体来说,如果存在内生性,OLS 估计量的期望值不再等于真实参数值,而且随着样本量的增加,估计量也不会收敛到真实参数值。这会导致我们对变量之间关系的估计出现错误,从而影响研究结论的可靠性。

    (3)解决内生性问题的方法 —— 工具变量法

    工具变量法是解决内生性问题的常用方法。其基本思想是找到一个与内生解释变量相关,但与误差项不相关的变量作为工具变量,通过两阶段最小二乘法(2SLS)进行估计。

    • 工具变量的选择条件:一个有效的工具变量需要满足两个条件。一是相关性,即工具变量与内生解释变量相关;二是外生性,即工具变量与误差项不相关。例如,在研究教育对收入的影响时,如果存在内生性问题,可以考虑使用家庭所在地的平均教育水平作为工具变量。家庭所在地的平均教育水平与个人的教育水平相关(相关性条件),同时又不太可能直接影响个人的收入(外生性条件)。

    • 两阶段最小二乘法的步骤:第一阶段,用工具变量对内生解释变量进行回归,得到内生解释变量的拟合值;第二阶段,用被解释变量对内生解释变量的拟合值和其他外生解释变量进行回归,得到估计系数。通过这种方法,可以消除内生性对估计结果的影响。

  2. 过度识别检验

    (1)过度识别的概念

    当工具变量的个数多于内生解释变量的个数时,就会出现过度识别的情况。例如,在一个回归模型中有一个内生解释变量,我们选择了两个工具变量,这时就需要进行过度识别检验,以确定这些工具变量是否都是有效的。

    (2)过度识别检验的目的

    过度识别检验用于检验工具变量的有效性。其目的是判断我们所选择的工具变量是否满足外生性条件,即是否与误差项不相关。如果工具变量不满足外生性条件,那么估计结果仍然是有偏的。

    (3)常用的过度识别检验方法

    • Sargan 检验:Sargan 检验在大样本下渐进有效。它的基本思想是通过比较工具变量的估计值与真实值之间的差异来判断工具变量的有效性。如果工具变量是有效的,那么估计值与真实值之间的差异应该很小,检验统计量的值也应该较小。在 Stata 中,可以使用 “estat overid” 命令进行 Sargan 检验。

    • Hansen J 检验:Hansen J 检验在小样本下也具有较好的性质。它通过构造一个 J 统计量来检验工具变量的有效性。如果 J 统计量的值较小,且对应的 p 值大于给定的显著性水平,就说明工具变量是有效的。在 Stata 中,可以使用 “ivregress 2sls Y Z (X = W), robust overid” 命令进行 Hansen J 检验,其中 “robust overid” 选项表示进行稳健的 Hansen J 检验。

 

三、实证模型

假设我们要研究企业创新投入(Y)与企业盈利能力(X)之间的关系,同时考虑到可能存在的内生性问题。我们建立如下回归模型:

Y = β0 + β1X + β2Size + β3Age + ε

其中,Y 表示企业创新投入,可以用企业研发支出占营业收入的比例来衡量;X 表示企业盈利能力,用净资产收益率(ROE)来表示;Size 表示企业规模,用企业总资产的自然对数来衡量;Age 表示企业年龄。ε 是误差项。

如果企业盈利能力(X)与误差项(ε)相关,就存在内生性问题。例如,可能存在一些未观察到的因素同时影响企业盈利能力和创新投入决策,导致内生性。

我们可以寻找一个工具变量 W,比如企业所在行业的平均盈利能力。这个工具变量满足以下两个条件:一是相关性,即企业所在行业的平均盈利能力与企业自身的盈利能力相关;二是外生性,即行业平均盈利能力不太可能直接影响单个企业的创新投入决策,而是通过影响企业自身的盈利能力间接发挥作用。

然后,通过两阶段最小二乘法进行估计。

第一阶段回归:用工具变量 W(行业平均盈利能力)和外生解释变量 Size(企业规模)、Age(企业年龄)对内生解释变量 X(企业盈利能力)进行回归,得到拟合值 X̂。

回归方程为:X = γ0 + γ1W + γ2Size + γ3Age + η

其中,γ0、γ1、γ2、γ3 是待估计的系数,η 是第一阶段回归的误差项。

第二阶段回归:用 Y(企业创新投入)对 X̂(企业盈利能力的拟合值)和外生解释变量 Size(企业规模)、Age(企业年龄)进行回归,得到估计系数。

回归方程为:Y = β0 + β1X̂ + β2Size + β3Age + ε'

其中,β0、β1、β2、β3 是待估计的系数,ε' 是第二阶段回归的误差项。

 

 四、程序代码

假设我们有一个数据集,包含变量 Y、X、Size、Age 和 W。首先,我们需要导入数据到 Stata 中。

use "data.dta", clear // 使用 clear 选项确保数据环境干净

描述性统计

查看数据的基本情况,包括变量的均值、标准差、最小值和最大值等。

summarize Y X Size Age W

还可以进一步使用 tabstat 命令获取更详细的统计信息:

tabstat Y X Size Age W, statistics(mean sd min max) columns(statistics)

内生性检验(工具变量法)

  1. 第一阶段回归:用工具变量 W、外生解释变量 Size 和 Age 对内生解释变量 X 进行回归,得到拟合值 X̂。

reg X W Size Age
predict X_hat, xb // 使用 xb 选项生成拟合值 X̂

可以使用 estat vce 命令查看第一阶段回归的方差协方差矩阵:

estat vce

  1. 第二阶段回归:用 Y 对 X̂、Size 和 Age 进行回归。

reg Y X_hat Size Age

可以使用 est store 命令存储第二阶段回归结果以便后续使用:

est store second_stage

过度识别检验

  1. Sargan 检验

ivregress 2sls Y Size Age (X = W)
estat overid

可以使用 return list 命令查看 Sargan 检验的统计量和相关信息:

return list

  1. Hansen J 检验
ivregress 2sls Y Size Age (X = W), robust overid

同样可以使用 return list 命令查看 Hansen J 检验的统计量和相关信息:

return list

通过这些详细的程序代码,可以更加全面地在 Stata 中进行内生性检验和过度识别检验,并获取更多关于回归结果和检验的信息。在实际应用中,还可以根据具体情况进行进一步的调整和扩展。

 

 IV专题- 内生性检验与过度识别检验 (lianxh.cn)icon-default.png?t=O83Ahttps://www.lianxh.cn/details/988.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2161624.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

信用卡存量经营读书笔记

信用卡的各项收益和损失分析表 用杜邦分析法拆利润如下 信用卡要不要烧钱?不要,因为没有网络效应(用户量增加带来的优惠比较少)和赢家通吃的情况 线上获客的几种方式:引流分成、某个项目的联名信用卡、营业收入分成 …

828华为云征文 | 使用Linux管理面板1Panel管理华为云Flexus云服务器X实例

828华为云征文 | 使用Linux管理面板1Panel管理华为云Flexus云服务器X实例 一、华为云Flexus云服务器X实例介绍1.1 Flexus云服务器X实例简介1.2 Flexus云服务器X实例特点 二、1Panel介绍2.1 1Panel 简介2.2 1Panel 特点 三、本次实践介绍3.1 本次实践简介3.2 本次环境规划 四、购…

【machine learning-17-分类(逻辑回归sigmod)】

分类问题 先说一下什么是分类问题,举个例子: 判定一封邮件是否是垃圾邮件; 判定图片是不是一直猫; 等等 这些问题的答案都是有限的,而不像是线性回归,是存在无限可能的不确定值。 这种问题就是分类问题&am…

分区与分桶

分区 分区字段大小写: 在hive中,分区字段名是不区分大小写的,不过字段值是区分大小写的。我们可以来测试一下 导入数据 load data local inpath /home/hivedata/user1.txt into table part4 partition(year2018,month03,DAy21); load data …

Mysql——初识Mysql

目录 数据库基础 创建数据库 服务器,数据库,表关系 数据逻辑存储 MySQL架构 SQL分类 存储引擎 mysql服务端是一个网络服务器,采用的是TCP协议在应用层 ,mysql有自己的协议。 数据库基础 mysql不是数据库,是mysql的…

18.1 k8s服务组件之4大黄金指标讲解

本节重点介绍 : 监控4大黄金指标 Latency:延时Utilization:使用率Saturation:饱和度Errors:错误数或错误率 apiserver指标 400、500错误qps访问延迟队列深度 etcd指标kube-scheduler和kube-controller-manager 监控4大黄金指标 …

从手动测试菜鸟,到自动化测试老司机,实现自动化落地

虽然许多伙伴是一个测试老人了,但是基本上所有的测试经验都停留在手工测试方面,对于自动化测试方面的实战经验少之又少。 其实,究其原因:一方面是,自动化方面不求上进,觉得会手工测试就可以了,自…

【计算机基础】用bat命令将Unity导出PC包转成单个exe可执行文件

Unity打包成exe可执行文件 上边连接是很久以前用过的方法,发现操作有些不一样了,并且如果按上述操作比较麻烦,所以写了个bat命令。 图1、导出的pc程序 如图1是导出的pc程序,点击exe文件可运行该程序。 添加pack_project.bat文件 …

基于 SpringBoot 的在线考试系统

专业团队,咨询就送开题报告,欢迎大家私信留言,联系方式在文章底部 摘 要 网络的广泛应用给生活带来了十分的便利。所以把在线考试管理与现在网络相结合,利用java技术建设在线考试系统,实现在线考试的信息化管理。则对…

PX4固定翼控制器详解(五)——L1、NPFG控制器

之前已经讲解了TECS高度与速度控制器,今天是PX4固定翼控制器系列讲解的最后一期,主题是PX4的位置控制器。PX4 1.12及其之前的版本,使用的位置控制器为L1控制器。1.13及其之后的版本,PX4更新了NPFG控制器。NPFG控制器在较强风速下有…

活动目录安全

活动目录安全 1.概述2.常见攻击方式SYSVOL与GPP漏洞MS14-068漏洞Kerberoast攻击内网横移抓取管理员凭证内网钓鱼与欺骗用户密码猜解获取AD数据库文件 3.权限维持手段krbtgt账号与黄金票据服务账号与白银票据利用DSRM账号利用SID History属性利用组策略利用AdminSDHolder利用SSP…

宠物空气净化器去浮毛哪家强?希喂、美的和米家实测分享

要说养宠物后里最让我感到幸福感飙升的家电,必须是宠物空气净化器,没有之一。很多人都喜欢宠物,但应该没有人喜欢清扫,特别是家里宠物多,或者一群宠物在自己家聚在一起之后,要疯狂清除浮毛,真的…

剖解相交链表

相交链表 思路:我们计算A和B链表的长度,求出他们的差值(len),让链表长的先多走len步,最后在A,B链表一起向后走,即可相逢于相交节点 实现代码如下: public class Solution {public …

单链表进阶

之前已经介绍过单链表及其一些简单的功能 这次来简单介绍单链表一些的其他接口 1.在指定位置之前插入数据 具体原码,三个参数,phead是链表的指针,pos是节点的地址,x是需要插入的数据。 pos不能为空指针,因为pos为空…

React启动时 Error: error:0308010C:digital envelope routines::unsupported

错误信息: 错误原因:通常与 Node.js 的新版本中 OpenSSL 的默认行为变化有关。从 Node.js 17 开始,OpenSSL 默认启用了 OpenSSL 3.0 的一些新特性,这可能会影响到一些旧的或未更新的库。 解决办法:可以通过设置环境变…

基于STM32设计的室内育苗环境管理系统(物联网)

文章目录 一、前言1.1 项目介绍【1】项目开发背景【2】设计实现的功能【3】项目硬件模块组成 1.2 设计思路1.3 系统功能总结1.4 开发工具的选择【1】设备端开发【2】上位机开发 1.5 模块的技术详情介绍【1】ESP8266-WIFI模块【2】MQ135传感器【4】DHT11传感器【5】B1750传感器 …

【Diffusion分割】FDiff-Fusion:基于模糊学习的去噪扩散融合网络

FDiff-Fusion: Denoising diffusion fusion network based on fuzzy learning for 3D medical image segmentation 摘要: 近年来,去噪扩散模型在图像分割建模中取得了令人瞩目的成就。凭借其强大的非线性建模能力和优越的泛化性能,去噪扩散模…

Flexus X实例全方位指南:智能迁移、跨云搬迁加速与虚机热变配能力的最佳实践

目录 前言 一、云迁移关键挑战 1、企业实例选型关键挑战 2、云算力关键挑战之一 3、云算力关键挑战之二 二、本地IT及其他云搬迁到Flexus X实例上的独有优势 1、Flexus X实例超强性能,遥遥领先同规格友商实例 (1)底层多重调优&#x…

网络编程——TCP网络通信

通信步骤: 1、连接 2、传输数据 3、关闭连接服务端的创建流程: 1、创建服务端socket对象 socket_family:网络地址类型AF_INET--代表的是ipv4地址类型 socket_type:套接字类型SOCK_STREAM--代表的是tcp套接字SOCK_DGRAM--代表的是udp套接字 2、绑定自己的…

新房安装了约克VRF中央空调真的是明智的选择!

夏天越来越热,新房安装了中央空调真的是太明智了!当初装修时,考虑到家里空间大,我就决定装一个中央空调。对比了好多品牌后,朋友推荐了约克VRF中央空调。装好以后,简直惊喜不断!      强效除…