果推断16--基于反事实因果推断的度小满额度模型学习笔记

news2024/11/25 4:22:00

目录

一、原文地址

二、一些问题

2.1如何从RCT随机样本过渡到观测样本因果建模?

2.2反事实学习的核心思想

2.3度小满的连续反事实额度模型 Mono-CFR

2.4Mono-CFR代码实现(待补充)

2.5CFR学习

2.5.1CFR

2.5.2DR-CFR

参考


一、原文地址

基于反事实因果推断的度小满额度模型

二、一些问题

2.1如何从RCT随机样本过渡到观测样本因果建模?

对于RCT样本的情况,如果希望评估ATE指标,可以通过分组相减或DID(difference in difference)。如果希望评估CATE指标,可以通过uplift 建模。常见的方法比如有meta-learner,double machine learning,causal forest等等。这里需要注意必要的三大假设:SUTVA,Unconfoundedness和Positivity。最核心的假设为:不存在未观测混淆因子。

对于仅有观测样本的情况,无法直接获取treatment->outcome的因果关系,我们需要借助必要的手段切断covariates到treatment的后门路径。常见方法是工具变量法和反事实表示学习。工具变量法需要对具体业务抽丝剥茧,绘制业务变量中因果图。反事实表示学习则依靠成熟的机器学习,匹配covariates相似的样本做因果评估。

X:特征

W:工具变量

D:干预

Y:gmv

首先通过X预测T,与真实的T作差,得到一个T的残差,然后通过X预测Y,与真实的Y作差,得到一个Y的残差,预测模型可以是任何ML模型,最后基于T的残差和Y的残差进行因果建模。

2.2反事实学习的核心思想

反事实学习的核心思想就是平衡不同treatment下的特征分布

核心问题有两个:

1. 如何调整训练样本的权重? 

2. 如何在表示空间中,使变换后的样本在实验组和对照组分布更加均衡?

本质思想是在变换映射后,为每个样本寻找它的反事实“双胞胎”。映射之后treatment组和control组X的分布比较相似。

2.3度小满的连续反事实额度模型 Mono-CFR

最后来介绍一下度小满的反事实额度模型,这里主要解决的是在观测数据上对连续型Treatment的反事实估计问题。

模型思想:给定期望额度μ(T|X),学习∆T与Y的单调性关系(Dose-Response Curve)。期望额度可以理解为模型学习到的连续性倾向额度,使得混淆变量C和额度T之间的关系能够断开,转换成∆T与Y的因果关系学习,从而对∆T下Y的分布进行较好的刻画。

2.4Mono-CFR代码实现(待补充)

2.5CFR学习

2.5.1CFR

Estimating individual treatment effect: generalization bounds and algorithms

GitHub - clinicalml/cfrnet: Counterfactual Regression

摘要:将机器学习应用于医疗保健、经济学和教育等领域因果推理问题引起了人们的极大兴趣。特别是,个人层面的因果推理具有重要的应用,例如精准医学。我们给出了一种新的理论分析和算法家族,用于从观测数据中预测个体治疗效果(ITE),假设被称为强可忽略性。该算法学习“平衡”表示,使诱导处理分布和控制分布看起来相似,我们给出了一个新的直观的泛化误差界,表明表示的预期ITE估计误差受该表示的标准泛化误差和表示引起的处理分布和控制分布之间的距离之和的限制。我们使用积分概率度量来测量分布之间的距离,推导出 Wasserstein 和最大平均差异 (MMD) 距离的显式边界。对真实数据和模拟数据的实验表明,新算法匹配或优于最先进的算法。

https://openreview.net/pdf?id=HkxBJT4YvB2.5.2DR-CFR

Learning Disentangled Representations for CounterFactual Regression

学习反事实回归的解纠缠表征
摘要:我们考虑从观察数据中估计治疗效果的挑战;指出,一般来说,只有一些基于观察到的协变量 X 的因素有助于选择治疗 T ,只有一些因素来确定结果 Y。我们通过考虑 {X, T, Y } 的三个潜在来源来模拟这一点,并表明显式建模这些来源为指导设计更好地处理观察数据集中的选择偏差的模型提供了很好的见解。本文试图概念化这一思路,并提供进一步探索它的路径。在这项工作中,我们提出了一种算法(1)从任何给定的观察数据集 D 和(2)中识别上述潜在因素的分离表示,并利用这些知识来减少选择偏差对从 D 估计治疗效果的负面影响。我们的实证结果表明,所提出的方法在基于个人和人口的评估措施中都实现了最先进的性能。

参考

基于反事实因果推断的度小满额度模型

因果推断5--DML(个人笔记)_dml因果_飞翔的七彩蜗牛的博客-CSDN博客

  1. 因果推断 之 DeR-CFR - 知乎
  2. DML-因果推断 - 知乎
  3. 因果推断5--DML(个人笔记)_dml因果_飞翔的七彩蜗牛的博客-CSDN博客
  4. 基于反事实因果推断的度小满额度模型
  5. 因果推断深度学习工具箱 - CounterFactual Regression with Importance Sampling Weights - 简书
  6. 因果推断综述及基础方法介绍(二)
  7. 因果推断|反事实推断|经典论文解读|SITE模型-基于表示学习 - 知乎
  8. 因果推断|反事实推断|经典论文解读|TargetNet&CFR模型-基于表示学习 - 知乎
  9. 因果推断 之 DeR-CFR - 知乎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/608854.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring Cloud Alibaba — Nacos 构建服务注册中心

文章目录 Nacos Server下载启动登录创建命名空间 Nacos Client启动样例Nacos 服务发现配置项 集成 OpenFeign 远程接口调用添加 OpenFeign 依赖开启 EnableFeignClients 注解编写远程服务接口远程接口调用 集成 Sentinel 熔断降级添加 Sentinel 依赖开启 Sentinel 熔断降级编写…

【数据结构每日一题】链表——单链表重排

[数据结构习题]链表——单链表重排 👉知识点导航💎:【数据结构】线性表——顺序存储 👉知识点导航💎:【数据结构】线性表——链式存储 👉[王道数据结构]习题导航💎: p …

pr安装缺少VCRUNTIME140.dll怎么办?这三个修复方案可以解决

在我们安装pr的时候,遇到缺少VCRUNTIME140.dll怎么办?vcruntime140.dll是一个Windows动态链接库,其主要功能是为C/C编译的程序提供运行时支持。这些库包括输入/输出函数、数学函数、字符串函数等等。因此,如果您的计算机缺少vcrun…

【接口自动化测试】一步一步教你搭建接口环境

要做接口测试,我们得搭建一套本地可以运行的接口环境。这次我选择了一个搭建容易,适合学习的系统——学生管理系统。 Python安装 这套管理系统是Python代码写的,因此需要Python环境。 安装挺无脑的,按照我提供的安装包和方法装…

windows下PC端小程序抓包--FiddlerCharles

目录 引言 【背景说明】 【操作说明】 【总结】 引言 大家好,你是否曾经遇到过想要抓取Windows下PC端小程序的网络请求数据,但不知道该用什么工具呢? 今天我要介绍的Fiddler和Charles两款工具,可帮助你轻松切入小程序网络请…

MySQL数据库 7.图形化界面工具DataGrip基础应用教学

目录 前言: DataGrip安装界面: 利用DataGrip创建数据库: 利用DataGrip为数据库创建表: 利用datagrip修改表: 添加元素: 结束! 前言: 在之前我们一直接触的是MySQL命令行语句开…

4.3 最优装载

博主简介:一个爱打游戏的计算机专业学生博主主页: 夏驰和徐策所属专栏:算法设计与分析 1.什么是贪心算法的最优装载问题? 最优装载问题(Bin Packing Problem)是一个经典的组合优化问题,涉及将一…

【Linux】-编译器-gcc/g++使用以及动态库和静态库的介绍(以及解决sudo失败的方法)

💖作者:小树苗渴望变成参天大树 ❤️‍🩹作者宣言:认真写好每一篇博客 💨作者gitee:gitee 💞作者专栏:C语言,数据结构初阶,Linux,C 如 果 你 喜 欢 作 者 的 文 章 ,就 给 作 者 点…

iOS证书(.p12)和描述文件(.mobileprovision)申请

目录 iOS证书(.p12)和描述文件(.mobileprovision)申请文末扩展(UDID获取、添加测试设备) 说明:本文申请证书、描述文件转载自 uniapp官网   iOS证书(.p12)和描述文件(.mobileprovision)申请      官网会时不时更新,如有疑问&…

《Apollo 智能驾驶进阶课程》二、 高精地图

1. 高精地图与自动驾驶的关系 1.1 高精地图与自动驾驶 L3级别以上才需要高精地图 1.2 什么是高精地图 1.3 高精地图与导航地图 1.4 高精地图-基础模块 高精地图与定位模块的关系 现在主流的自动驾驶的定位方案有两种:一种是基于点云,另一种是基于C…

投票系统(前后端分离)

1.投票系统的介绍 投票系统是一种用于组织选举和投票的软件系统,它可以帮助政府、企业、组织和社区等各种机构进行公正、透明和高效的投票活动。投票系统的主要功能包括:选民身份验证、投票管理、计票和结果公布等。 选民身份验证是指投票系统可以通过…

SpringCloud Sleuth/Zipkin学习

SpringCloud Sleuth/Zipkin 文章目录 SpringCloud Sleuth/Zipkin1 Sleuth/Zipkin 简介2 Sleuth/ZipKin-搭建链路监控实例 1 Sleuth/Zipkin 简介 在微服务框架中,一个由客户端发起的请求在后端系统中会经过多个不同的的服务节点调用, 来协同产生最后的请求结果&…

电脑右键删除的文件如何恢复?提供了4种方法

电脑上不小心删除文件是很常见的一件事。比如在使用右键删除的情况下,但是,误删并不代表永远丧失这个文件,因为我们可以通过一些方法来恢复右键删除的文件。本文提供了4种方法,你可以根据具体的数据丢失情况选择合适的方法。 方法…

【Python】列表 List ③ ( 查询操作 / 修改操作 | 列表查询操作 List#index | 修改列表指定位置元素值 )

文章目录 一、列表查询操作1、List#index 函数简介2、代码示例 - 列表查询3、列表查询 ValueError 报错 二、修改列表指定索引元素1、语法简介2、代码示例 - 使用正向 / 反向索引修改指定元素 一、列表查询操作 1、List#index 函数简介 列表 List 查询功能 , 通过 List#index 函…

PyTorch 深度学习 || 专题一:神经网络基础

神经网络基础 神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向–深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术。 神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器…

【JAVA】双向链表详解

【JAVA】双向链表详解 双向链表的定义双向链表的初步实现(准备)双向链表的操作一. 打印链表二. 得到链表长度三. 插入操作3.1 头插法3.2 尾插法3.3 任意位置插入 四. 删除操作4.1 删除第一次出现为key的节点(3种情况)4.2 删除所以…

Vue--》Vue3打造可扩展的项目管理系统后台的完整指南(四)

今天开始使用 vue3 ts 搭建一个项目管理的后台,因为文章会将项目的每一个地方代码的书写都会讲解到,所以本项目会分成好几篇文章进行讲解,我会在最后一篇文章中会将项目代码开源到我的GithHub上,大家可以自行去进行下载运行&…

保姆级别ps bate版本下载

前言:最近的ps bete版本在抖音也是上了热搜,时不时就能刷到一个,相信大家也知道ai带来的魅力,真的很强,那我们就开始安装教程吧。 ​过程: 先打开链接:Adobe Creative Cloud | Details and pr…

使用外部工具横向移动

Smbexe、Psexec Psexec PsExec是一种轻巧的telnet代替品,可让您在其他系统上执行进程,并为控制台应用提供完整的交互性,无需手动安装客户端软件。 原理: 1、ipc$连接,释放Psexesvc.exe 2、OpenSCManager打开受害者…

如何使用ChatGPT自带插件

OpenAI的插件将ChatGPT连接到第三方应用程序。这些插件使ChatGPT能够与开发者定义的API进行交互,增强ChatGPT的能力,并使其能够执行广泛的操作。插件使ChatGPT能够做如下事情: 获取实时信息;例如,体育比分&#xff0c…