目录
偏差
关键思想
偏差
偏差是使关联不同于因果关系的原因。幸运的是,我们的直觉很容易理解。让我们在课堂示例中回顾一下我们的平板电脑。当面对声称为孩子提供平板电脑的学校会获得更高考试成绩的说法时,我们可以反驳说,即使没有平板电脑,这些学校也可能会获得更高的考试成绩。那是因为他们可能比其他学校有更多的钱;因此,他们可以支付更好的教师,负担更好的教室,等等。换句话说,经过处理的学校(使用平板电脑)与未经处理的学校没有可比性。
用潜在结果符号表示这一点就是说处理的与未处理的不同。我们可以说,接受处理的学校的可能大于未处理学校的。这是因为有能力为孩子提供平板电脑的学校也可以负担其他有助于提高考试成绩的因素。习惯谈论潜在的结果需要一些时间。再读一遍这一段,确保你理解它。
考虑到这一点,我们可以用非常简单的数学来说明为什么关联不是因果关系。关联是通过来衡量的。在我们的示例中,这是有平板电脑的学校的平均考试成绩减去没有平板电脑的学校的平均考试成绩。另一方面,因果关系由衡量,为了了解它们之间的关系,让我们进行关联测量并将观察到的结果替换为潜在结果。对于治疗,观察到的结果是。对于未治疗者,观察到的结果是
现在,让我们加减,这是一个反事实的结果。它说明如果他们没有接受治疗,治疗的结果会是什么。最后,我们对术语重新排序,合并一些期望,然后瞧:这个简单的数学题包含了我们在因果问题中会遇到的所有问题。我不能强调你了解它的方方面面是多么重要。如果你被迫在手臂上纹身,这个方程应该是一个很好的候选者。这是一件非常值得抓住的事情,并且真正理解告诉我们什么,就像一些可以用 100 种不同方式解释的神圣文本。事实上,让我们更深入地了解一下。让我们把它分解成它的一些含义。首先,这个等式说明了为什么关联不是因果关系。正如我们所看到的,关联等于对被治疗者的治疗效果加上一个偏差项。 偏差是由治疗组和对照组在治疗前的差异决定的,也就是说,如果他们都没有接受治疗。当有人告诉我们教室里的平板电脑可以提高学习成绩时,我们现在可以准确地说出为什么我们会怀疑。我们认为,在这个例子中,,也就是说,有能力为孩子提供平板电脑的学校比那些不能提供的学校本身表现就会更好,不管是否提供平板电脑。
为什么会发生这种情况?一旦我们进入混淆那一章,我们将更多地讨论这一点,但现在你可以想到偏差的产生,因为许多我们无法控制的事情随着干预而发生变化。因此,经过干预和未经干预的学校不仅在平板电脑上有所不同。他们在学费、地点、师资等方面也有所不同……如果我们要说课堂上提供平板电脑可以提高学习成绩,我们需要有和没有平板电脑的学校在其他各方面,彼此相似。
现在我们了解了问题,让我们看看解决方案。我们也可以说使关联等于因果关系是必要的。 如果,那么,关联就是因果关系! 理解这一点不仅仅是记住方程式。这里有一个强烈的直觉论证。说就是说干预组和对照组干预前具有可比性。或者,在被处理者没有被处理的情况下,如果我们可以观察到它的,那么它的结果将与未处理的相同。在数学上,偏差项会消失:
此外,如果处理和未处理仅在处理本身不同,即 我们认为对处理的因果影响与未处理的相同(因为它们非常相似)。
不仅如此,,仅仅因为经过处理和未经处理是可以互换的。因此,在这种情况下,手段的差异成为因果效应:
再一次,这非常重要,我认为值得再看一遍,现在有漂亮的图片。如果我们在干预组和未干预组之间做一个简单的平均比较,这就是我们得到的(蓝点没有接受治疗,也就是平板电脑):
请注意两组之间的结果差异可能有两个原因:
- 干预效果。给孩子平板电脑导致的考试分数增加。
- 干预因素本身之外,干预组和未干预组之间的其他差异。在这种情况下,干预组和未干预组的区别在于干预组的学费要高得多。考试成绩的一些差异可能是由于更高的学费带来了更好的教育。
真正的干预效果只有在我们拥有观察潜在结果的神力时才能获得,如下左图所示。个体干预效果是该单位的结果与同一单位在获得替代治疗的情况下将具有的另一个理论结果之间的差异。这些是反事实结果,以浅色表示。
在右边的图中,我们描述了我们之前讨论过的偏差是什么。如果我们让每个人都不接受干预,我们就会产生偏差。在这种情况下,我们只剩下潜在结果。然后,我们看到干预组和未干预组有何不同。如果他们这样做,则意味着干预之外的其他因素导致干预组和未干预组的不同。这就是偏差,是真实干预效果的阴影。
现在,将此与没有偏差的假设情况进行对比。假设平板电脑被随机分配给学校。在这种情况下,贫富学校接受干预的机会是一样的。干预因素将很好地分布在所有学费范围内。
在这种情况下,干预和未干预之间的结果差异是平均因果效应。发生这种情况是因为除了干预本身之外,干预组和未干预组之间没有其他差异来源。我们看到的所有差异都必须归因于它。这种情况的另一种说法就是没有偏差。
如果我们将每个人都设置为不接受治疗,只观察,我们将发现治疗组和未治疗组之间没有差异。
这就是因果推理的艰巨任务。这是关于寻找消除偏差的巧妙方法,使接受干预的和未接受干预的两组对象具有可比性,以便我们看到的所有差异只是平均干预效果。归根结底,因果推断是要弄清楚世界是如何运转的,排除所有的妄想和误解。现在我们明白了这一点,我们可以继续掌握一些最强大的方法来消除偏见,勇敢和真实的武器来确定因果关系。
关键思想
到目前为止,我们已经看到关联不是因果关系。最重要的是,我们已经确切地看到了为什么它不是,以及我们如何使关联成为因果关系。我们还引入了潜在结果符号,作为围绕因果推理的一种方式。有了它,我们将统计视为两种潜在的现实:一种是给予干预,另一种是不给予干预。但是,不幸的是,我们只能测量其中之一,这就是因果推断的根本问题所在。