因果推断18--估计个体治疗效果:泛化界和算法CRF(个人笔记)

news2024/10/7 15:29:39

目录

1. 介绍

2. 相关工作

3.估计ITE:误差界

4. 估计ITE的算法

5.实验

5.1. 模拟结果:IHDP

5.2. 现实世界的结果:工作

5.3. 结果

6.结论

参考


英文题目:Estimating individual treatment effect: generalization bounds and algorithms

翻译:估计个体治疗效果:泛化界和算法

论文链接:http://proceedings.mlr.press/v70/shalit17a/shalit17a.pdf

代码:

 Pytorch版本

GitHub - patrickzoechbauer/TarNet

Tensorflow版本

GitHub - arnaud39/TARNet: TARNet Model with tensorflow 2 API.

摘要:人们对将机器学习应用于医疗保健、经济学和教育等领域的因果推理问题非常感兴趣。特别是,个人级别的因果推断具有重要的应用,例如精度医学。我们提出了一个新的理论分析和算法系列,用于从观察数据中预测个体治疗效应 (ITE),假设称为强可想象性。该算法学习“平衡”表示,使得诱导处理和控制分布看起来相似,并且我们给出了一种新颖的直观泛化误差界限,表明表示的预期 ITE 估计误差受该表示的标准泛化误差之和以及由表示引起的处理和控制分布之间的距离。我们使用整体概率度量来衡量分布之间的距离,推导出 Wasserstein 和最大平均差异 (MMD) 距离的显式界限。对真实数据和模拟数据的实验表明,新算法匹配或优于最先进的算法。

1. 介绍

对动作因果影响进行预测是许多领域中的一个核心问题。例如,决定哪种药物会对患者带来更好的结果的医生;政府决定谁将从资助的工作培训中受益最多;或者决定哪个研究计划最能使特定学生受益的教师。在本文中,我们专注于根据观察数据进行这些预测的问题。观察数据是包含过去动作、他们的结果以及可能更多上下文的数据,但没有直接访问产生动作的机制。例如,我们可以访问患者(上下文)、他们的药物(动作)和结果的记录,但我们没有完全了解为什么将特定动作应用于患者。

从观察数据中学习的标志是,在数据中观察到的动作取决于可能影响结果的变量,从而导致混淆:例如,更丰富的患者可能更好地提供某些药物,并且只能将工作培训提供给那些动机足以寻求它。挑战在于如何解开这些混杂因素并进行有效的预测。具体来说,我们在“无隐藏混淆”的常见简化假设下工作,假设观察到确定采取哪些动作的所有因素。在上面的示例中,这意味着我们测量了患者的财富或员工的动机。

作为一个学习问题,从观测数据估计因果效应与经典学习不同,因为在我们的训练数据中,我们从未看到个体层面的效应。对于每个单元,我们只看到它们对可能动作之一的响应——它们实际收到的动作。这接近于机器学习文献中已知的“从记录的老虎机反馈中学习”(Strehl 等人,2010;Swaminathan 和 Joachims,2015),不同之处在于我们无法访问模型生成动作的模型。

我们的工作与因果推理的许多工作不同,因为我们专注于个人层面的因果效应(“特定治疗效果”Shpitser & Pearl (2006);Pearl (2015)),而不是平均或人口水平。我们的主要贡献是给出据我们所知,第一个用于估计个体水平因果效应的泛化误差 1 界限,其中每个个体由其特征 x 识别。该界限自然导致了一系列新的基于表示学习的算法(Bengio 等人,2013 年),我们表明在几个因果效应推理任务上匹配或优于最先进的方法。

3d088a78599345abb89eb9fcf892d084.png

两个分布 p(x|t = 0) 和 p(x|t = 1) 之间距离的积分概率度量 (IPM) 度量,也称为控制和处理分布。在实践中,我们使用两个特定的IPMs:最大平均差异(Gretton和Wasserstein距离(Villani, 2008;Cuturi & Doucet, 2014)。我们表明,学习个体治疗效果函数 τ (x) 的预期误差上限为学习 Y1 和 Y0 的误差加上 IPM 项。在随机对照试验设置中,其中t⊥⊥x,IPM项为0,我们的界自然简化为学习两个函数的标准学习问题。

我们根据表示学习的思想推导出一系列算法的方法(Bengio et al., 2013):在最小化事实损失的加权和的表示之上联合学习处理和控制的假设(标准监督机器学习目标),以及表示引起的控制和处理分布之间的 IPM 距离。这可以被视为在鼓励在治疗组和对照组之间更好的泛化的约束下学习函数 m0 和 m1。在实验中,我们应用基于神经网络的算法作为表示和假设,以及表示层的 MMD 或 Wasserstein 分布距离;有关基本架构,请参见图 1。

1f8fd584c43a451ba3f87c69179fb648.png

在他关于因果关系的基本文本中,Pearl (2009) 写道:“与传统学习任务一样,我们尝试从一组实例推广到另一组实例,因果建模任务是从一组条件下的行为推广到 [...] 另一组。因此,因果模型应该由一个挑战它们对不断变化的条件稳定性的标准来选择[强调我们的]。我们相信我们的工作指出了一种这样的稳定性标准的方法,用于在强可忽略的情况下进行因果推理。

2. 相关工作

用于因果推理的机器学习的许多工作都集中在因果发现上,目的是从数据中发现潜在的因果图或因果方向(Hoyer 等人,2009;Maathuis 等人,2010;Triantafillou 和 Tsamardinos,2015;Mooij 等人,2016)。我们专注于因果设置简单且已知的形式为 (Y1, Y0) ⊥ x|t 且没有隐藏混杂因素的情况。在因果模型下,我们假设 ap- 中使用的因果效应推理最常见的目标隐含科学是获得平均处理效果:AT E = Ex∼p(x) [τ (x)]。我们将简要讨论一些标准的统计因果效应推理方法如何与我们提出的方法相关。请注意,这些方法中的大多数都假设某种形式的可学习性。

ea8a243d1f6f4cf99462d610c9876bc6.png

 另一种广泛使用的因果效应推断统计方法家族是加权方法。逆倾向评分加权(Austin, 2011)等方法对观测数据中的单元进行加权,使处理后的种群和控制种群更具可比性,并也被用于估计条件效应(Cole et al., 2003)。主要挑战,特别是在高维情况下,是控制估计的方差(Swaminathan & Joachims,2015)。双鲁棒方法更进一步,巧妙地结合倾向评分重加权和协变量调整来减少模型偏差(Funk et al., 2011)。

特别是,估计 ITE 需要预测与观察到的分布不同的结果。我们的ITE误差上限与BenDavid等人(2007)给出的领域适应的泛化界限有相似之处;Mansour等人(2009);Ben-David等人(2010);Cortes & Mohri(2014)。这些界限采用分布距离度量,例如 A 距离或差异度量,这些指标与我们使用的 IPM 距离有关。我们的算法类似于Ganin等人(2016)最近的域适应算法,原则上其他域适应方法(如Dauḿe III(2007);Pan等人(2011);Sun等人(2016))可以适应用于ITE估计,如这里所示。

最后,我们的论文建立在Johansson等人(2016)的基础上,在Johansson等人(2016)中,我们展示了协变量移位与估计反事实的任务之间的联系。我们提出了学习数据的表示,使处理和控制分布更相似,在其之上拟合线性岭回归模型。我们使用反向处理分配的分布与使用事实分布拟合岭回归来限制拟合岭回归的相对误差。不幸的是,相对误差界限并不是关于表示的绝对质量的所有信息。在本文中,我们专注于一个相关但更实质性的任务:估计个体治疗效果,建立在反事实误差项之上。我们提供了表示绝对质量的信息界限。我们还推导出更灵活的算法家,包括非线性假设和更强大的分布度量,以 Wasserstein 和 MMD 距离等 IPM 的形式。最后,我们进行了更彻底的实验,包括真实数据集和样本外性能,并表明我们的方法优于先前提出的方法。

// 论文的基本模式

3.估计ITE:误差界

在本节中,我们证明了估计给定表示的单个治疗效果的预期误差以及在该表示上定义的假设的边界。该界限用 (1) 将观察到的结果 y 学习为 x 和 t 的函数时模型的预期损失表示为 (1),表示为 <F , F 代表“事实”; (2) 处理组和对照组分布之间的积分概率度量 (IPM) 距离。术语푡是经典的机器学习泛化误差,反过来可以使用经验误差和模型复杂性项的上限,应用标准机器学习理论(Shalev-Shwartz&Ben-David,2014)。

4. 估计ITE的算法

我们提出了一个基于上述理论结果的ITE估计通用框架CFR(反事实回归)。我们的算法是一个端到端的正则化最小化过程,它既适合数据的平衡表示,又适合结果的假设。CFR 借鉴了与我们之前的工作相同的直觉(Johansson 等人,2016 年),但克服了以下限制:a)我们之前的理论需要一个两步优化过程,并且特定于线性假设(不支持例如深度神经网络),b)如果学习的表示是高维的,则治疗指标可能会在旧模型中洗掉(见下文讨论)。

fad347b2c41644d389607c3430387353.png

5.实验

评估因果推理算法比许多机器学习任务更难,因为我们很少可以访问基本事实治疗效果。现有的文献主要以两种方式处理这一点。一种是使用(半)合成数据集,其中结果或治疗分配是完全已知的;我们使用来自 Hill (2011) 的半合成 IHDP 数据集。另一种是使用来自随机对照试验 (RCT) 的真实世界数据。使用来自 RCT 的数据的问题是治疗组之间没有不平衡,这使得我们的方法变得多余。我们通过使用 LaLonde (1986) 中的 Jobs 数据集来部分克服这个问题,该数据集包括随机和非随机组件。我们使用这两个组件进行训练,但仅使用随机组件进行评估。这减轻了但无法解决,完全随机和平衡的数据集不适合我们的方法的问题。

6bb1b7f74d5a440aaf2892f33bc76b2b.png

5.1. 模拟结果:IHDP

5.2. 现实世界的结果:工作

5.3. 结果

6.结论

在本文中,我们给出了一个有意义和直观的误差界来估计个体治疗效果。我们的界限将 ITE 估计与从样本中学习的经典机器学习问题联系起来,以及测量样本分布距离的方法。该界限自然适用于学习算法的创建;我们专注于使用神经网络作为表示和假设。我们将我们的理论引导方法应用于合成和真实任务,表明在每种情况下,我们的方法都匹配或优于最先进的方法。重要的开放性问题是选择 IPM 权重 α 的理论考虑因素,如何最好地推导出模型预测的置信度区间,并将我们的工作与更复杂的因果模型(例如具有隐藏混淆或工具变量的模型)相结合。

参考

  1. 果推断17--基于反事实因果推断的度小满额度模型学习笔记_飞翔的七彩蜗牛的博客-CSDN博客
  2. 因果推断|反事实推断|经典论文解读|TargetNet&CFR模型-基于表示学习 - 知乎​​​​​

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/635235.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Python plotly】零基础也能轻松掌握的学习路线与参考资料

Python plotly是一个优秀的数据可视化工具,通过使用Python语言和Plotly的图表支持库,可以轻松地创建交互式和动态图表,Python plotly的可视化效果美观且易于实现。 学习路线: Python基础语法和Numpy、Pandas基础学习 Python是一…

碳排放预测模型 | Python实现基于LSTM长短期记忆神经网络的碳排放预测模型(预测未来发展趋势)

文章目录 效果一览文章概述研究内容环境准备源码设计学习总结参考资料效果一览 文章概述 碳排放预测模型 | Python实现基于LSTM长短期记忆神经网络的碳排放预测模型(预测未来发展趋势) 研究内容 这是数据集的链接:https://github.com/owid/co2-data/blob/master/owid-co2-da…

windows一键安装redis3.2.100

下载 下载地址:https://gitcode.net/zengliguang/windows_redis_offline_install.git 使用git进行进行clone下载 在电脑桌面或者其他文件夹下 ,鼠标右键点击 选择git clone ,下图中url为下载地址,Directory为本地存储路径,点击…

ORB_SLAM3 闭环检测

ORB SLAM3系统初始化ORB SLAM3 构建FrameORB_SLAM3 单目初始化ORB_SLAM3 双目匹配ORB_SLAM3_IMU预积分理论推导(预积分项)ORB_SLAM3_IMU预积分理论推导(噪声分析)ORB_SLAM3_IMU预积分理论推导(更新)ORB_SLAM3_IMU预积分理论推导(残差)ORB_SLAM3_优化方法 Pose优化ORB_SLAM3 闭环…

【量化交易笔记】8.基于深度学习(LSTM)预测股票价格

前言 前一章节,已作随机森林来预测股票价格,也是一种比较常见的方法,本章基于深度学习算法来处理时间序列,来预测股票未来的价格。LSTM是一种特殊类型的循环神经网络(RNN),在自然语言处理和时间…

【C语言之函数栈帧】(动态图—巨细)一文带你了解局部变量随机值及栈区上的函数调用

🚩纸上得来终觉浅, 绝知此事要躬行。 🌟主页:June-Frost 🚀专栏:C语言 局部变量为什么是随机值?函数是如何调用的? ✉️ 该篇将使用该编译器,通过介绍栈帧的创建和销毁来深入了解局…

计算机网络开荒3-传输层

文章目录 一、传输层概述1.1 网络层 vs 传输层 二、多路复用 多路分用三、UDP3.1 RDT3.1.1 Rdt3.1.1.1 Rdt1.03.1.1.2 Rdt2.03.1.1.3 Rdt2.13.1.1.4 Rdt2.23.11.5 Rdt 3.0 四、滑动窗口协议4.1 流水线机制4.1.2 滑动窗口协议GBNSR 五、TCP5.1 可靠数据传输5.1.1 RTT和超时 5.2 …

Vue中如何进行图表绘制

Vue中如何进行图表绘制 数据可视化是Web应用中非常重要的一部分,其中图表绘制是其中的重要环节。Vue作为一款流行的前端框架,提供了很多优秀的图表库,以满足不同业务场景下的需求。本文将介绍如何在Vue中进行图表绘制,包括使用Vu…

MM32F3273G8P火龙果开发板MindSDK开发教程4 - 滴嗒定时器Systick的配置

MM32F3273G8P火龙果开发板MindSDK开发教程4 - 滴嗒定时器Systick的配置 1、Systick寄存器 Systick是ARM内核的一个外设,所以在不同芯片的代码上移植比较方便,他总共有4个寄存器, 从Systick定义中可以看到: typedef struct {__I…

一文看懂Java中的锁

阅读本文你可以获得 Synchronized、ReentrantLock、ReentrantReadWriteLock、StampedLock、Condition、Semaphore、CountDownLatch、CyclicBarrier、JMM、Volatile、Happens-Before。 全文共16000字左右(包含示例代码)、欢迎收藏、在看、转发分批食用 一…

基于粒子群优化算法的配电网光伏储能双层优化配置模型[IEEE33节点](选址定容)(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

【MySQL 数据库】11、学习 MySQL 中的【锁】

目录 一、锁的概述与分类二、全局锁(全库数据备份)三、表级锁(1) 表锁(2) 元数据锁(Meta Data Lock)(3) 意向锁 四、行级锁(1) 行锁(2) 间隙锁&临键锁 一、锁的概述与分类 锁是计算机协调多个进程或线程并发访问某一资源的机…

Whistle(基于 Node 实现的跨平台抓包调试工具)的使用

Whistle(基于 Node 实现的跨平台抓包调试工具)的使用 基于Node实现的跨平台抓包调试工具 可以劫持网络请求,并进行请求和响应的修改,来提高我们的开发调试效率 1.一键安装(装包/证书) npm i -g whistle && w2 start --init 证书的问题 安装…

[论文阅读] (31)李沐老师视频学习——4.研究的艺术·理由、论据和担保

《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢。由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学术路上期…

5.2 清洗数据

5.2 清洗数据 5.2.1 检测与处理重复值1、记录重复 drop_duplicates()2、特征重复 equals() 5.2.2 检测与处理缺失值 isnull()、notnull()1、 删除法 dropna()2、替换法 fillna()3、 插值法 5.2.3 检测与处理异常值1、3σ原则2、箱线图 5.2.4 任务实现(wei&#xff0…

学习HCIP的day.12

目录 MPLS:多协议标签交换 一、协议的解释和意义 二、工作过程 1、控制层面: 2、数据层面: 三、标签号 四、MPLS的次末跳 五、MPLS的配置 六、使用mpls解决BGP的路由黑洞 七、MPLS VPN 八、配置: 1、ISP部分 MPLS&am…

python+pyqt制作的可最小化到托盘的桌面图形应用代码实例

本篇文章主要讲解使用python、pyqt制作的可以最小化到托盘的桌面图形应用实例。 日期:2023年6月11日 作者:任聪聪 效果演示 说明:实现桌面应用显示窗口,关闭窗口缩小到托盘,点击托盘显示窗口,邮件图标显示退出按钮,点击退出按钮即可关闭应用。 动态演示: 实际情况:…

postgresql 服务的启动操作,不再是DBA的专属

专栏内容:postgresql个人主页:我的主页座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物. 目录 前言 服务架构概述 服务启动流程 前提 流程 集群创建 集群介绍 数据库服务配置 数据…

202317读书笔记|《心寂犹似远山火:斋藤茂吉短歌300》——茫茫心海里,孤帆与谁同

202317读书笔记|《心寂犹似远山火:斋藤茂吉短歌300》——茫茫心海里,孤帆与谁同 很高兴周五这一天,之前很粉俳句的时候订阅的书都在今天都上架了,可以一饱眼福了。短歌是日本和歌一种诗体,是由三十一音节组…

YOLOv5/v7 添加注意力机制,30多种模块分析③,GCN模块,DAN模块

目录 一、注意力机制介绍1、什么是注意力机制?2、注意力机制的分类3、注意力机制的核心 二、GCN 模块1、GCN 模块的原理2、实验结果3、应用示例 三、DAN模块1、DAN模块的原理2、实验结果3、应用示例 大家好,我是哪吒。 🏆本文收录于&#xf…