理解控制变量、内生变量、外生变量、工具变量

news2024/9/28 9:32:34

文章目录

  • 前言
  • 一、控制变量
  • 二、内生变量、外生变量
  • 三、工具变量(IV)


前言

1.解释变量(或自变量):解释变量是指作为研究对象,用于解释某个现象或行为模式的变量。其中有些解释变量是直接影响被解释变量的,有些则是间接或中介影响的。在回归分析中,解释变量通常被放在方程的右边。

2.被解释变量(或因变量):被解释变量是指通过解释变量来解释其变化产生的影响的变量,也可以称为因变量。在回归分析中,被解释变量通常被放在方程的左边。

3.控制变量(或干扰变量):控制变量是指在控制所研究的解释变量和被解释变量之间的关系时,需要控制的可能具有影响的变量。例如,我们希望研究教育对收入的影响,但同时需要将一些其他因素(例如性别、年龄、工作经验等)视为控制变量。通过对这些变量进行控制,可以更准确地估计教育对收入的影响。

一、控制变量

先看一个例子:
理解:喝可乐会变胖吗?
控制:其他与特征相关的因素没,比如:锻炼强度日常饮食年龄
实验设计
保证实验组(treatment group)和控制组(control group)
锻炼强度相同、饮食相同,年龄相同等其他因素。

解释
在计量经济学中,控制变量是指通过对所研究的因素进行控制,来消除可能影响研究变量之间关系的其他因素。具体来讲,研究者想要控制某个变量时,就要尽可能地与其他可能的影响因素(控制变量)隔离,以便能够更准确地研究所需的变量之间的关系。

例如,假设我们想研究吸烟与肺癌之间的关系。为了消除其他因素对这种关系的影响,我们需要控制一些变量,如年龄、遗传因素、长期吸入有害气体等等。通过对这些变量进行控制,我们可以更加准确地估计出吸烟和肺癌之间的关系。
为什么要控制:如果不控制模型会生病,结论不可靠,估计参数有偏,产生内生性。
怎么确定控制变量:看前人的研究,找相关文献。

二、内生变量、外生变量

举个例子
有一个模型简单表达为: Y = a + b X + ϵ Y=a+bX+\epsilon Y=a+bX+ϵ
内生变量:Y、X,模型决定的,也就是因变量、自变量。
外生变量:a,b,模型外的因素决定的,已知的,参数。
通常由内生性决定外生性
在计量经济学中,我们经常把变量分为内生变量和外生变量。

内生变量是指模型中的被解释变量或者解释变量,与其他变量的因果关系存在研究偏误和混淆的可能性,是需要解释和控制的变量。

举个例子,假设我们研究驾驶员的车祸率与使用手机的频率之间的关系。在这个模型中,车祸率是被解释变量,而使用手机的频率是解释变量。然而,这个模型的研究结果可能存在研究偏误,因为许多其他因素可能会影响车祸率,比如驾驶员的年龄、性别、驾驶经验等等。因此,这些影响车祸率的因素就是内生变量。

在计量经济学中,外生变量是指对被研究现象或行为结果有影响,但不受研究对象影响的变量。这些变量是在研究要素之外并且在研究对象之前就存在的,通常是定量测量的,其值不依赖于被研究的行为或结果。

举例来说,对于一个销售额的研究,外生变量可能包括经济总体,竞争对手行业的价格和促销活动,天气,人口统计学数据等因素。这些变量不受销售团队的控制,但会对销售额产生影响。

区分内生性
内生性:模型中一个变量或多个变量与随机扰动项相关
理解
假设这是一个真实无误的模型:
Y = β 1 X 1 + β 2 X 2 + μ Y=\beta_1X_1+\beta_2X_2+\mu Y=β1X1+β2X2+μ
β 1 = 1 \beta_1=1 β1=1 β 2 = 1 \beta_2=1 β2=1 c o v ( X 1 , X 2 ) = 0.5 cov(X_1,X_2)=0.5 cov(X1,X2)=0.5
但你的估计模型却是:
Y = β 1 X 1 + ϵ Y= \beta_1X_1+\epsilon Y=β1X1+ϵ
如果, X 1 X_1 X1变动1单位,真实情况下, X 2 X_2 X2会变0.5,带入真实模型, Y = 1.5 Y=1.5 Y=1.5
这是,你的估计模型 β 1 \beta_1 β1的估计系数却为1.5,真实的为 β 1 = 1 \beta_1=1 β1=1
这就造成了偏误。
这就是遗漏变量造成的内生性
常见造成内生性的原因以及处理方式
见B站大佬-在这里插入图片描述

内生性处理方式总结【传送门】
在这里插入图片描述

三、工具变量(IV)

工具变量由工具变量法引入,其实是一种方法。
在某些情况下,模型中的某个变量可能受到未观测到的外部因素的影响,这就会造成内生性问题。为了解决这个问题,我们可以引入一个工具变量,它与内生变量相关,但与模型中其他变量无关
在这里插入图片描述
这是1)、2)满足工具变量的两个条件.
举个例子,假设我们想研究健康对收入的影响,但是健康本身很可能会受到其他因素(例如遗传、家庭背景等)的影响,从而对收入产生间接的影响,
我们可以使用居住地的污染水平作为工具变量,来解决这个问题。通过引入污染水平作为工具变量,我们可以确保收入被正确地归因于健康,从而避免了内生性问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/503822.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

自学黑客(网络安全),一般人我劝你还是算了吧

一、自学网络安全学习的误区和陷阱 1.不要试图先成为一名程序员(以编程为基础的学习)再开始学习 我在之前的回答中,我都一再强调不要以编程为基础再开始学习网络安全,一般来说,学习编程不但学习周期长,而…

重塑未来:AI对教育行业的深远影响与挑战

自从AI人工智能的发展进入“iPhone时刻”以来,我们已身处一个日新月异的时代。在众多领域,AI已经大放异彩,而教育作为培养下一代的关键领域,自然也受到了这场科技革命的影响。 AI对教育行业重大影响 最近可汗学院(Kh…

图论网络模型及求最小路径和造价实战

学习知识要实时简单回顾,我把学习的图论简单梳理一下,方便入门与复习。 图论网络 图论网络简介 图论起源于 18 世纪。第一篇图论论文是瑞士数学家欧拉于 1736 年发表的“哥尼斯堡的七座桥”。1847 年,克希霍夫为了给出电网络方程而引进了“…

《Netty》从零开始学netty源码(五十五)之PooledByteBufAllocator

PooledByteBufAllocator 通过前面的学习我们大体了解了PooledByteBufAllocator管辖下的数据结构,整体情况如下: PooledByteBufAllocator主要管理了三类内存,堆内存heapArenas、直接内存directArenas、线程缓存PoolThreadCache,前…

Java笔记_18(IO流)

Java笔记_18 一、IO流1.1、IO流的概述1.2、IO流的体系1.3、字节输出流基本用法1.4、字节输入流基本用法1.5、文件拷贝1.6、IO流中不同JDK版本捕获异常的方式 二、字符集2.1、GBK、ASCII字符集2.2、Unicode字符集2.3、为什么会有乱码2.4、Java中编码和解码的代码实现2.5、字符输…

直方图均衡化与规定化原理解释以及matlab实现

直方图均衡化(HE) Histogram Equalization (HE) 设灰度水平在 r k , k ∈ [ 0 , L − 1 ] r_k,k\in[0,L-1] rk​,k∈[0,L−1] 内 一幅图像 f f f 的非归一化直方图定义为 h ( r k ) n k h(r_k)n_k h(rk​)nk​ s T ( r ) sT(r) sT(r)为…

【统计模型】心脏病患病影响因素探究

目录 心脏病患病影响因素探究 一、研究目的 二、数据来源和相关说明 三、描述性统计分析 四、数据建模 4.1 全模型 (1)模型构建 (2)模型预测 4.2 基于AIC准则的选模型A 4.3 基于BIC准则的选模型B 4.4 模型评估 五、结论…

Vector - CAPL - CANoe硬件配置函数 - 02

Hardware Configuration 硬件配置中包含CAN或者CANFD的参数配置,其中包含波特率、时间片1、时间片2、时间量子中的同步跳跃宽度、采样点数等信息;随着研发系统中各类型的平台化,测试想要跟上研发的进度,也必须进行平台化&#xff…

linux【网络编程】之网络套接字预备

linux【网络编程】之网络套接字 一、必备知识1.1 端口号1.2 端口号方面疑问及解决方案 二、TCP/UDP协议三、网络字节流四、socket编程4.1 认识接口4.2 浅析sockaddr结构 一、必备知识 在【网络基础】中我们提到了IP地址,接下来了解一下网络通信中其他方面的知识 1…

浏览器的渲染

浏览器的渲染 浏览器的渲染过程分为两大阶段,八大步骤,由两个线程完成, 下面是总的过程 第一个 渲染主线程 它包括5个步骤, 1、html解析 parse 解析我们的HTML,生成DOM树结构 2、样式计算 computed style 比如我们…

系统运维(Git篇)

Git基础 Git Git是一种分布式版本控制系统,可以帮助我们管理代码的版本和变更。通过学习Git,我们可以更好地理解版本控制的原理和应用,同时也可以掌握Git的使用和管理技巧。 Docker Docker是一种容器化平台,可以将应用程序及其依赖…

华为OD机试真题2023(JAVA)

目录 华为OD机试是什么?华为OD面试流程?华为OD机试通过率高吗?华为OD薪资待遇?华为OD晋升空间? 大家好,我是哪吒。 本专栏包含了最新最全的华为OD机试真题,有详细的分析和Java代码解答。已帮助…

web前端的同源策略是什么?

一、同源策略 1995年,同源政策由 Netscape 公司(网景公司)引入浏览器。目前,所有浏览器都实行这个政策。同源政策的目的,是为了保证用户信息的安全,防止恶意的网站窃取数据。随着互联网的发展,“同源政策”越来越严格…

深入理解java虚拟机精华总结:运行时栈帧结构、方法调用、字节码解释执行引擎

深入理解java虚拟机精华总结:运行时栈帧结构、方法调用、字节码解释执行引擎 运行时栈帧结构局部变量表操作数栈动态连接方法返回地址 方法调用解析分派静态分派动态分派 基于栈的字节码解释执行引擎 运行时栈帧结构 Java虚拟机以方法作为最基本的执行单元&#xf…

栈在表达式中的应用(中/后前缀的转换)机算,手算模拟。

一.中缀表达式转后缀表达式 初始化一个栈,用于保存 暂时还不确定的运算顺序的“运算符” 。 从 左往右 依次扫描,会遇到三种情况: 1.遇到 操作数,直接加入后缀表达。 2.遇到 界限符:     ①遇到 “(” 入栈。  …

计算机系统-虚拟存储器

例行前言: 本篇不是学习课程时的笔记,是重看这本书时的简记。对于学习本课程的同学,未涉及的内容不代表考试不涉及(mmap,动态存储器分配,linux虚拟存储器)。本章的大部分内容已经在OS中学习过了,但本章内容…

SSM架构项目实战(CRM)

开始时间:7月17日 技术架构 (一)Web开发4层开发 视图层(view):展示数据,跟用户交互。《html,css,js,jquery,bootstrap(ext|easyUI&…

代码随想录算法训练营第三十五天 | 两维贪心、重叠区间

860.柠檬水找零 文档讲解:代码随想录 (programmercarl.com) 视频讲解:贪心算法,看上去复杂,其实逻辑都是固定的!LeetCode:860.柠檬水找零_哔哩哔哩_bilibili 状态:能直接做出来。 思路 只需要维…

【java-04】深入浅出多态、内部类、常用API

主要内容 多态 内部类 常用API 1 多态 1.1 面向对象三大特征 ? 封装 , 继承 , 多态 1.2 什么是多态 ? 一个对象在不同时刻体现出来的不同形态 举例 : 一只猫对象 我们可以说猫就是猫 : Cat cat new Cat();我们也可以说猫是动物 : Animal cat new Cat();这里对象在不…

知识推理——CNN模型总结

记录一下我看过的利用CNN实现知识推理的论文。 最后修改时间:2023.05.08 目录 1.ConvE 1.1.解决的问题 1.2.优势 1.3.贡献与创新点 1.4.方法 1.4.1 为什么用二维卷积,而不是一维卷积? 1.4.2.ConvE具体实现 1.ConvE 论文&#xff1a…