【Python实战因果推断】1_因果效应异质性1

news2025/1/11 10:16:35

目录

From ATE to CATE

Why Prediction Is Not the Answer

CATE and ITE


本文将介绍应用于行业的因果推理中最有趣的发展:效应异质性。在此之前,你们了解的是一种治疗方法的一般影响。现在,你将专注于发现它如何对不同的人产生不同的影响。治疗效果并非恒定不变,这个想法很简单,但却非常强大。了解哪些单位对某种治疗的反应更好,是决定谁接受治疗的关键。效应异质性为个性化这一备受推崇的理念提供了一种因果推理方法。首先,您将从理论层面了解效应异质性,了解估计效应异质性的挑战是什么,以及如何扩展已学知识以应对这些挑战。接下来,您将看到效应异质性的估算与预测性研究密切相关。
异质性效应与预测问题密切相关,而预测问题对于数据科学家来说已经非常熟悉了。因此,您将看到交叉验证和模型选择的理念如何仍然适用于治疗异质性模型。然而,验证效果估计值比评估简单的预测模型更具挑战性,这就是为什么你会看到一些新颖的方法。
最后提供了一些如何使用效应异质性指导决策的指南和示例。虽然并非详尽无遗,但我希望这些示例能告诉您如何将这些想法用于解决自己的业务问题。

From ATE to CATE

到目前为止,你们每次估算治疗的因果影响时,大多都是平均治疗效果:

\tau=E\bigl[Y_1-Y_0\bigr]或者是等价的连续治疗\tau=E[y'(t)]y'(t)是治疗反应函数的导数。

也就是说,您已经学会了揭示治疗总体有效性的技术。ATE 估算是因果推理的基石。它是一个超级有用的工具,可用于决策问题,也就是所谓的项目评估:当你想知道是否应该在整个人群中推广一种治疗方法时。

现在,是时候学习如何为另一种类型的决策提供信息了:你应该对哪个单位进行治疗?为此,您需要允许决策从一个单位变为另一个单位。

例如,给某个客户提供折扣券可能是有益的,但不给另一个客户,因为某个客户可能对折扣更敏感。或者,将疫苗优先提供给某一群体而不是另一群体也是有道理的,因为这些群体会从这种待遇中获益更多。在这种情况下,个性化是关键。

实现个性化的一种方法是将效果异质性考虑在内,即估算条件平均治疗效果 (CATE)。通过考虑每个单位的独特特征,您可以确定针对该特定案例的最有效治疗方法:E\bigl[Y_1-Y_0\bigl|X\bigr] \mathrm{or} E\bigl[y'(t)\bigl|X\bigr]

以 X 为条件意味着,您现在允许治疗效果因每个单位的协变量 X 所定义的特征而异。同样,在这里,您认为并非所有单位都对治疗有同样好的反应,您希望利用这种异质性。您希望只对合适的单位进行治疗(在二元情况下),或者找出每个单位的最佳治疗剂量(在连续情况下)。

例如,如果您是一家银行,需要决定每位客户有资格获得的贷款额度,那么您可以肯定的是,向每个人发放大量资金并不是一个好主意,尽管这对某些人来说可能是合理的。你必须精明地处理(贷款额度)。也许,根据客户的信用评分,您可以找出合适的贷款额度。当然,您并不需要成为一家大型机构来利用个性化服务。我们不乏这样的例子。您应该在一年中的哪几天进行销售?产品价格应该是多少?每个人的运动量是多少?

Why Prediction Is Not the Answer

可以这样想。您有一群客户和一种处理方法(价格、折扣、贷款......),您想对处理方法进行个性化,例如,给不同的客户不同的折扣。假设您可以按结果图将客户组织成以下处理方式:

您可以将个性化任务视为客户细分问题。您要根据客户对您的处理方式的反应来创建客户群。例如,您想找到对折扣反应好的客户和对折扣反应差的客户。

那么,客户对处理方法的反应由条件处理效果 \frac{\delta Y}{\delta T} 给出。因此,如果您能以某种方式估算出每位顾客的条件处理效果,您就能将那些对处理效果好的顾客(高处理效果)和那些对处理效果差的顾客进行分组。如果能做到这一点,就能像下图一样分割客户空间:

这就太好了,因为现在你可以估算出每个组的不同治疗效果。同样,由于疗效只是治疗反应函数的斜率,如果你能得出斜率不同的组别,那么这些分区的实体对治疗的反应就会不同:

现在,将其与传统的机器学习方法进行对比。您可能会尝试预测 Y,而不是每个单元的导数 \frac{\delta Y}{\delta T}。假定你的预测模型能很好地逼近目标,这将从根本上分割 Y 轴上的空间。然而,这并不一定会导致各组具有不同的治疗效果。这就是为什么简单地预测结果并不总是对决策有用:

好吧,你可能会说,我知道我必须估计效果,而不仅仅是预测结果,但这有点棘手。如果我看不到斜率\frac{\delta Sales}{\delta Discount},我怎么能预测它呢?

说得好。与原始结果 Y 不同,斜率(或变化率)在单位层面上基本上是不可观测的。要想看到单个斜率,就必须观察每个单位在不同处理水平下的情况,并计算每个处理结果的变化情况

\frac{\delta Y_i}{\delta T_i}\approx\frac{Y(T_i)-Y(T_i+\epsilon)}{T_i-(T_i+\epsilon)}

这又是因果推论的根本问题。在不同的治疗条件下,你不可能看到相同的单位。那么,你能做什么呢?

CATE and ITE

请记住,CATE 不同于个体治疗效果(ITE)。例如,假设您有两组病人,x = 1 和 x = 2,每组 4 个单位,您想知道一种新药对一种疾病的治疗效果,这种疾病通常会导致 50%的患者死亡。
对于 x = 1 组,该药物对一名病人不利,导致其死亡,但却挽救了另一名病人。对于 x = 2 组,药物效果为零,其中 1 人死亡(请记住,这种疾病的致死率为 50%)。在这两组中,CATE 都是 0.5,但没有一个单位的 ITE 是 0.5。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1863051.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【漏洞复现】用友 UFIDA saveDoc.ajax 任意文件上传漏洞

免责声明: 本文内容旨在提供有关特定漏洞或安全漏洞的信息,以帮助用户更好地了解可能存在的风险。公布此类信息的目的在于促进网络安全意识和技术进步,并非出于任何恶意目的。阅读者应该明白,在利用本文提到的漏洞信息或进行相关测…

web前端大作业-乡村扶贫、乡村振兴

文章目录 代码分析页面截图代码连接 代码分析 代码结构 主页index.html <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta…

基于RabbitMQ原理的自定义消息队列实现

文章目录 1. 什么是消息队列2. 需求分析2.1. 核心概念12.2. 核心概念22.3. 核心API2.4. 交换机类型2.5. 持久化2.6. 网络通信2.7. 总结 3. 创建核心类3.1. Exchange3.2. MSGQueue3.3. Binding3.4. Message3.5. 数据库操作3.5.1. 建表操作3.5.2. 交换机操作3.5.3. 队列操作3.5.4…

力扣62 不同路径

一个机器人位于一个 m x n 网格的左上角 &#xff08;起始点在下图中标记为 “Start” &#xff09;。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角&#xff08;在下图中标记为 “Finish” &#xff09;。 问总共有多少条不同的路径&#xff1f; 输入&…

智能终端-Qt-课程设计分析

这个是几个简单的Qt的智能终端分享&#xff0c;其是我们上课的作业&#xff0c;我就在老师要求的基础上去进行了延申了一点的&#xff0c;下面看做了哪些东西 这个是所有的点开之后的页面&#xff0c;我做到了那些家居和那个按钮达到了同步的效果&#xff0c;这点其实还是不错…

仿真模拟--静态浮动路由

目录 静态路由 浮动路由 静态路由 浮动路由

Linux CentOS 环境 MySQL 主从复制集群搭建

环境说明 MySQL版本8.4.0 操作系统 Linux CentOS 7.9 官网文档 https://dev.mysql.com/doc/refman/8.4/en/replication-configuration.html 以下代码片段中带分号都是在MySQL命令行( mysql -uroot -p)中执行 1. 首先在两个节点上安装数据库 参考 Linux CentOS安装MySQL8.0 …

如何把图片转换成pdf格式?图片转PDF方法分享

如何把图片转换成pdf格式&#xff1f;图片转换为PDF格式的重要性不言而喻。PDF文件不仅能够在各种操作系统和设备上保持一致的显示效果&#xff0c;还能确保图片内容的清晰度和质量不受损害。此外&#xff0c;PDF格式支持加密和权限设置&#xff0c;可以保护图片内容不被轻易篡…

C#——SortedList 排序列表详情

SortedList 排序列表 SortedList 类用来表示键/值对的集合&#xff0c;这些键/值对按照键值进行排序&#xff0c;并且可以通过键或索引访问集合中的各个项。 我们可以将排序列表看作是数组和哈希表的组合&#xff0c;其中包含了可以使用键或索引访问各项的列表。如果您使用索…

centOS 7安装gitlab

主要参考&#xff1a; CentOS-7 下 GitLab 安装部署教程_centos7 安装gitlab-CSDN博客 但是由于我本身服务器配置很小(2核2G)&#xff0c;所以运行的时候报错&#xff1a; execute[clear the gitlab-rails cache] (gitlab::gitlab-rails line 561) had an error: Mixlib::Sh…

【Linux】静态库、动态库

动静态库里面包含的是源文件通过汇编阶段生成的后缀为.o的可重定位目标文件。我们在使用C语言&#xff0c;包含一个stdio.h头文件就可以使用scanf方法&#xff0c;其实都是系统调用了相应的头文件和库&#xff0c;库里面有开发者已经写好各种方法。也就是说我们在使用C语言时&a…

laravel的日志使用说明

文章目录 了解系统的默认支持多个通道时它们的关系如何使用驱动 了解系统的默认支持 Laravel 日志基于「 通道 」和 「 驱动 」的。那么这个通道是干嘛的&#xff1f;驱动又是干嘛的&#xff1f; 通道 &#xff1a; 1.它表示了某种日志格式化的方式&#xff08;或可理解为某个…

正版软件 | 『闪点清单』— 您的智能悬浮任务管理专家

在繁忙的日常中&#xff0c;我们经常需要一个既能随时提醒&#xff0c;又不会打扰我们的待办事项管理工具。『闪点清单』&#xff0c;一款简约而不简单的悬浮清单软件&#xff0c;为您带来全新的任务管理体验。 设计简约&#xff0c;功能强大 『闪点清单』以其简约的设计和强大…

【2024最新版】Eclipse安装配置全攻略:图文详解

目录 1. Eclipse介绍1.1 背景1.2 主要特点和功能1.3 版本发布1.4 优势与劣势 2. 下载Eclipse3. 安装Eclipse4. 启动Eclipse 1. Eclipse介绍 Eclipse是一个开源的、基于Java的可扩展开发平台&#xff0c;主要用于Java开发者&#xff0c;但也支持其他语言如C/C、PHP、Python等。…

Webpack: 前端资深构建工具

概述 如果你是一名前端工程师&#xff0c;相信之前或多或少听过、用过 Webpack 这一构建工具&#xff0c;它能够融合多种工程化工具&#xff0c;将开发阶段的应用代码编译、打包成适合网络分发、客户端运行的应用产物如今&#xff0c;Webpack 已经深深渗入到前端工程的方方面面…

OCR训练和C#部署英文字符训练

PaddleOCR是一个基于飞桨开发的OCR&#xff08;Optical Character Recognition&#xff0c;光学字符识别&#xff09;系统。其技术体系包括文字检测、文字识别、文本方向检测和图像处理等模块。以下是其优点&#xff1a; 高精度&#xff1a;PaddleOCR采用深度学习算法进行训练…

基于Cisco的校园网络拓扑搭建

特此说明&#xff1a;请先看评论区留言哦~ 一、基础配置 1.新建拓扑图 2.服务器配置 3.PC端配置 4.核心交换机配置 a.CORE-S1 Switch>enable Switch#configure terminal Switch(config)#hostname CORE-S1 CORE-S1(config)#vlan 10 CORE-S1(config-vlan)#vlan 20 CO…

【低功耗设计】功耗模型和PTPX功耗分析流程

本文目录 功耗的构成1.静态功耗2.动态功耗1&#xff09;内部功耗&#xff08;internal power&#xff09;2&#xff09;翻转功耗&#xff08;switch power&#xff09; 功耗的分析功耗分析流程averaged power analysistime-based power analysis 从芯片设计到芯片量产的过程中功…

论文导读 | Manufacturing Service Operations Management近期文章精选

编者按 在本系列文章中&#xff0c;我们梳理了顶刊Manufacturing & Service Operations Management5月份发布有关OR/OM以及相关应用的文章之基本信息&#xff0c;旨在帮助读者快速洞察行业/学界最新动态。 推荐文章1 ● 题目&#xff1a;Robust Drone Delivery with Weath…