【因果推断python】2_因果关系初步2

news2024/11/23 16:26:38

目录

偏差

关键思想


偏差

偏差是使关联不同于因果关系的原因。幸运的是,我们的直觉很容易理解。让我们在课堂示例中回顾一下我们的平板电脑。当面对声称为孩子提供平板电脑的学校会获得更高考试成绩的说法时,我们可以反驳说,即使没有平板电脑,这些学校也可能会获得更高的考试成绩。那是因为他们可能比其他学校有更多的钱;因此,他们可以支付更好的教师,负担更好的教室,等等。换句话说,经过处理的学校(使用平板电脑)与未经处理的学校没有可比性。

用潜在结果符号表示这一点就是说处理的Y_{0}与未处理的Y_{0}不同。我们可以说,接受处理的学校的Y_{0}可能大于未处理学校的Y_{0}。这是因为有能力为孩子提供平板电脑的学校也可以负担其他有助于提高考试成绩的因素。习惯谈论潜在的结果需要一些时间。再读一遍这一段,确保你理解它。

考虑到这一点,我们可以用非常简单的数学来说明为什么关联不是因果关系。关联是通过E[Y|T=1]-E[Y|T=0]来衡量的。在我们的示例中,这是有平板电脑的学校的平均考试成绩减去没有平板电脑的学校的平均考试成绩。另一方面,因果关系由E[Y_{1}-Y_{0}]衡量,为了了解它们之间的关系,让我们进行关联测量并将观察到的结果替换为潜在结果。对于治疗,观察到的结果是Y_{1}。对于未治疗者,观察到的结果是Y_{0}

现在,让我们加减E[Y_{0}|T=1],这是一个反事实的结果。它说明如果他们没有接受治疗,治疗的结果会是什么。最后,我们对术语重新排序,合并一些期望,然后瞧:这个简单的数学题包含了我们在因果问题中会遇到的所有问题。我不能强调你了解它的方方面面是多么重要。如果你被迫在手臂上纹身,这个方程应该是一个很好的候选者。这是一件非常值得抓住的事情,并且真正理解告诉我们什么,就像一些可以用 100 种不同方式解释的神圣文本。事实上,让我们更深入地了解一下。让我们把它分解成它的一些含义。首先,这个等式说明了为什么关联不是因果关系。正如我们所看到的,关联等于对被治疗者的治疗效果加上一个偏差项。 偏差是由治疗组和对照组在治疗前的差异决定的,也就是说,如果他们都没有接受治疗。当有人告诉我们教室里的平板电脑可以提高学习成绩时,我们现在可以准确地说出为什么我们会怀疑。我们认为,在这个例子中,E[Y_{0}|T=0]<E[Y_{0}|T=1],也就是说,有能力为孩子提供平板电脑的学校比那些不能提供的学校本身表现就会更好,不管是否提供平板电脑

为什么会发生这种情况?一旦我们进入混淆那一章,我们将更多地讨论这一点,但现在你可以想到偏差的产生,因为许多我们无法控制的事情随着干预而发生变化。因此,经过干预和未经干预的学校不仅在平板电脑上有所不同。他们在学费、地点、师资等方面也有所不同……如果我们要说课堂上提供平板电脑可以提高学习成绩,我们需要有和没有平板电脑的学校在其他各方面,彼此相似。

现在我们了解了问题,让我们看看解决方案。我们也可以说使关联等于因果关系是必要的。 如果E[Y_{0}|T=0]=E[Y_{0}|T=1]那么,关联就是因果关系! 理解这一点不仅仅是记住方程式。这里有一个强烈的直觉论证。说E[Y_{0}|T=0]=E[Y_{0}|T=1]就是说干预组和对照组干预前具有可比性。或者,在被处理者没有被处理的情况下,如果我们可以观察到它的Y_{0},那么它的结果将与未处理的相同。在数学上,偏差项会消失:

此外,如果处理和未处理仅在处理本身不同,即 E[Y_{0}|T=0]=E[Y_{0}|T=1]我们认为对处理的因果影响与未处理的相同(因为它们非常相似)。

不仅如此,E[Y_{1}-Y_{0}|T=1]=E[Y_{1}-Y_{0}|T=0],仅仅因为经过处理和未经处理是可以互换的。因此,在这种情况下,手段的差异成为因果效应

再一次,这非常重要,我认为值得再看一遍,现在有漂亮的图片。如果我们在干预组和未干预组之间做一个简单的平均比较,这就是我们得到的(蓝点没有接受治疗,也就是平板电脑):

请注意两组之间的结果差异可能有两个原因:

  1. 干预效果。给孩子平板电脑导致的考试分数增加。
  2. 干预因素本身之外,干预组和未干预组之间的其他差异。在这种情况下,干预组和未干预组的区别在于干预组的学费要高得多。考试成绩的一些差异可能是由于更高的学费带来了更好的教育。

真正的干预效果只有在我们拥有观察潜在结果的神力时才能获得,如下左图所示。个体干预效果是该单位的结果与同一单位在获得替代治疗的情况下将具有的另一个理论结果之间的差异。这些是反事实结果,以浅色表示。

在右边的图中,我们描述了我们之前讨论过的偏差是什么。如果我们让每个人都不接受干预,我们就会产生偏差。在这种情况下,我们只剩下T_{0}潜在结果。然后,我们看到干预组和未干预组有何不同。如果他们这样做,则意味着干预之外的其他因素导致干预组和未干预组的不同。这就是偏差,是真实干预效果的阴影。

现在,将此与没有偏差的假设情况进行对比。假设平板电脑被随机分配给学校。在这种情况下,贫富学校接受干预的机会是一样的。干预因素将很好地分布在所有学费范围内。

在这种情况下,干预和未干预之间的结果差异是平均因果效应。发生这种情况是因为除了干预本身之外,干预组和未干预组之间没有其他差异来源。我们看到的所有差异都必须归因于它。这种情况的另一种说法就是没有偏差。

如果我们将每个人都设置为不接受治疗,只观察Y_{0},我们将发现治疗组和未治疗组之间没有差异。

这就是因果推理的艰巨任务。这是关于寻找消除偏差的巧妙方法,使接受干预的和未接受干预的两组对象具有可比性,以便我们看到的所有差异只是平均干预效果。归根结底,因果推断是要弄清楚世界是如何运转的,排除所有的妄想和误解。现在我们明白了这一点,我们可以继续掌握一些最强大的方法来消除偏见,勇敢和真实的武器来确定因果关系。

关键思想

到目前为止,我们已经看到关联不是因果关系。最重要的是,我们已经确切地看到了为什么它不是,以及我们如何使关联成为因果关系。我们还引入了潜在结果符号,作为围绕因果推理的一种方式。有了它,我们将统计视为两种潜在的现实:一种是给予干预,另一种是不给予干预。但是,不幸的是,我们只能测量其中之一,这就是因果推断的根本问题所在。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1714777.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

「清新题精讲」Skiers

更好的阅读体验 Skiers Description 给定 n n n 个点的有向无环平面图&#xff0c;求最少多少条从 1 1 1 到 n n n 的路径能覆盖原图的所有边&#xff1f; 1 ≤ n ≤ 5 1 0 3 1\le n\le 5\times10^3 1≤n≤5103 Solution 考虑从 1 1 1 到 n n n 的路径其实是边的链覆…

如何应对Android面试官 -> 玩转 Fragment

前言 本章主要讲解下 Framgent 的核心原理&#xff1b; 基础用法 线上基础用法&#xff0c;其他的可以自行百度 FragmentManager manager getSupportFragmentManager(); FragmentTransaction transaction manager.beginTransaction(); transaction.add(R.id.contentlayout,…

C语言函数复习全解析:参数、无参、嵌套与递归

C语言复习 函数篇 文中包括调用有参函数和无参函数、函数的嵌套和递归。首先,通过一道例题介绍了有参函数的概念和用法,即定义一个函数,接受特定参数并返回结果。接着,讲解了无参函数,即执行函数时不需要返回数值,只执行特定操作。然后,介绍了函数的嵌套,即在一个函数内部调用…

【云原生】Kubernetes----PersistentVolume(PV)与PersistentVolumeClaim(PVC)详解

目录 引言 一、存储卷 &#xff08;一&#xff09;存储卷定义 &#xff08;二&#xff09;存储卷的作用 1.数据持久化 2.数据共享 3.解耦 4.灵活性 &#xff08;三&#xff09;存储卷的分类 1.emptyDir存储卷 1.1 定义 1.2 特点 1.3 示例 2.hostPath存储卷 2.1 …

RabbitMQ详情

一.MQ简介 什么是MQ MQ本质是队列&#xff0c;FIFO先入先出&#xff0c;队列中存放的内容是message&#xff08;消息&#xff09;&#xff0c;还是一种跨进程的通信机制&#xff0c;用于上下游传递消息。在互联网架构中是常见的上下游“逻辑解耦物理解耦”的消息通信服务。 主…

Wpf 使用 Prism 实战开发Day28

首页汇总方块点击导航功能 点击首页汇总方块的时候&#xff0c;跳转到对应的数据页面 step1: 在IndexViewModel 中&#xff0c;给TaskBar 里面Target 属性&#xff0c;赋上要跳转的页面 step2: 创建导航事件命令和方法实现 step3: 实现导航的逻辑。通过取到 IRegionManager 的…

ClickHouse 与其他数仓架构的对比——Clickhouse 架构篇(四)

文章目录 前言ClickHouse与Hive的对比计算引擎的差异ClickHouse比Hive查询速度快的原因 ClickHouse与HBase的对比HBase的存储系统与ClickHouse的异同HBase的适用场景及ClickHouse不适合的原因 ClickHouse与Kylin的对比Kylin的架构Kylin解决性能问题的思路Kylin方案的缺陷ClickH…

信息学奥赛初赛天天练-15-阅读程序-深入解析二进制原码、反码、补码,位运算技巧,以及lowbit的神奇应用

更多资源请关注纽扣编程微信公众号 1 2021 CSP-J 阅读程序1 阅读程序&#xff08;程序输入不超过数组或字符串定义的范围&#xff1b;判断题正确填 √&#xff0c;错误填&#xff1b;除特 殊说明外&#xff0c;判断题 1.5 分&#xff0c;选择题 3 分&#xff09; 源码 #in…

字符串编码转换

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 最早的字符串编码是美国标准信息交换码&#xff0c;即ASCII码。它仅对10个数字、26个大写英文字母、26个小写英文字母及一些其他符号进行了编码。ASC…

贪心(临项交换)+01背包,蓝桥云课 搬砖

一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 0搬砖 - 蓝桥云课 (lanqiao.cn) 二、解题报告 1、思路分析 将物品按照w[i] v[i]升序排序然后跑01背包就是答案 下面证明&#xff1a;&#xff08;不要问怎么想到的&#xff0c;做题多了就能想到&#xff…

总负债20.79亿,银行借款在增加,经营所得现金在减少,累计亏损在增加,易点云披露其风险(四)

来源&#xff1a;猛兽财经 作者&#xff1a;猛兽财经 全文共二十五章&#xff0c;总计6万字。 由于篇幅所限&#xff0c;分为&#xff08;一&#xff09;到&#xff08;五&#xff09;篇发布。 本文为《负债20.79亿,银行借款在增加,经营所得现金在减少,易点云披露风险》&am…

力扣爆刷第146天之贪心算法五连刷

力扣爆刷第146天之贪心算法五连刷 文章目录 力扣爆刷第146天之贪心算法五连刷总结一、455. 分发饼干二、376. 摆动序列三、53. 最大子数组和四、122. 买卖股票的最佳时机 II五、5. 跳跃游戏 总结 贪心算法的本质就是选择每一阶段的局部最优&#xff0c;从而达到全局最优。 一…

使用手机短信恢复软件,完成从新手到专家的进阶之路

由于各种原因&#xff0c;如误删、手机设备损坏等&#xff0c;我们可能会面临重要短信丢失的风险。现在市面上有许多手机短信恢复软件可以帮助我们解决这个问题&#xff0c;但从新手到专家的进阶之路并非一蹴而就的过程&#xff0c;它需要耐心、实践和不断地学习。以下是一篇关…

c++编程(15)——list的模拟实现

欢迎来到博主的专栏——c编程 博主ID&#xff1a;代码小豪 文章目录 前言list的数据结构list的默认构造尾插与尾删iterator插入和删除构造、析构、赋值copy构造initializer_list构造operator 析构函数 前言 受限于博主当前的技术水平&#xff0c;暂时还不能模拟实现出STL当中用…

HTTP报文

HTTP报文 报文流 HTTP报文是在HTTP引用程序之间发送的数据块&#xff0c;这些数据块以一种文本形式的元信息开头&#xff0c;这些信息描述了报文的内容和含义&#xff0c;后面跟着可选的数据部分&#xff0c;这些报文在客户端&#xff0c;服务器和代理之间流动。 报文流入源…

Java事务入门:从基础概念到初步实践

Java事务入门&#xff1a;从基础概念到初步实践 引言1. Java事务基础概念1.1 什么是事务&#xff1f;1.2 为什么需要事务&#xff1f; 2. Java事务管理2.1 JDBC 的事务管理2.2 Spring 事务管理2.2.1 Spring JDBC2.2.1.1 添加 Spring 配置2.2.1.2 添加业务代码并测试验证 2.2.2…

在做题中学习(62):矩阵区域和

1314. 矩阵区域和 - 力扣&#xff08;LeetCode&#xff09; 解法&#xff1a;二维前缀和 思路&#xff1a;读题画图才能理解意思&#xff1a;dun点点的是mat中的一个数&#xff0c;而要求的answer同位置的数 以点为中心上下左右延长 k 个单位所围成长方形的和。 因为最后answ…

拷贝构造、移动构造、拷贝赋值、移动赋值

最近在学习C的拷贝构造函数时发现一个问题&#xff1a;在函数中返回局部的类对象时&#xff0c;并没有调用拷贝构造函数。针对这个问题&#xff0c;查阅了一些资料&#xff0c;这里记录整理一下。 调用拷贝构造函数的三种情况&#xff1a; ① 用一个类去初始化另一个对象时&a…

PLC自动化行业的发展前景好吗?

第一先说plc的薪资&#xff1a; 整体的平均薪资还是非常可观的&#xff0c;在1.3w/月左右。 当然PLC是需要经验积累的&#xff0c;尤其需要拥有大型的系统设计经验&#xff0c;那将会在PLC以至于自动化行业都会吃的开。所以待遇是与自身的经验&#xff0c;能力&#xff0c;所在…

Java设计模式:享元模式实现高效对象共享与内存优化(十一)

码到三十五 &#xff1a; 个人主页 目录 一、引言二、享元设计模式的概念1. 对象状态的划分2. 共享机制 三、享元设计模式的组成四、享元设计模式的工作原理五、享元模式的使用六、享元设计模式的优点和适用场景结语 [参见]&#xff1a; Java设计模式&#xff1a;核心概述&…