基于短期替代变量的因果效应估计

news2024/11/20 20:32:59

本篇文章分为:

1.前言

2.模型方案

    2.1 替代指数背景

    2.2 替代指数的基本设定

    2.3 模型结构   

3.评估

4.总结与展望

1. 前言  

在网约车双边交易市场中,量化策略对平衡市场供需的影响起着重要的作用。对市场供需的影响分为两种情况:

  • 短期价值:当前策略对当前供需的即时干预影响。

  • 长期价值:当前策略对未来一段时间供需的长期干预影响。

从技术角度来说,我们可以将策略定义为处理变量(treatment),将其对市场供需的影响定义为处理效应(treatment effect),而建模处理变量和处理效应之间的效应估计模型被称为增益模型(uplift model)。

短期价值的效应估计可以通过常规的因果推断(causal inference)模型进行估计,比如 DML、grf 等模型,读者感兴趣可以参考我们之前发的文章:《连续因果森林模型的构造与实践》。而长期价值的效应估计往往需要长期实验数据支持,但长期实验存在两个问题:一方面缺乏时效性;另一方面成本昂贵。

针对长期实验面临的两个难题,滴滴MPT团队通过“滴滴盖亚科研合作计划”与在因果推断、因果学习领域深耕多年的广东工业大学计算机学院蔡瑞初教授开展合作,采用基于策略的短期结果对长期价值进行评估的技术思路,设计了基于短期替代变量的因果效应估计模型(Laser:LAtent SurrogatE Representation learning),提升长期效应估计的时效性,降低实验成本。    

dcf850718bc486abd88ad4eb30162dce.png

2. 模型方案 

2.1 替代指数背景

评估长期效应最理想的状态就是做长期实验,但出于成本等因素的约束,长期实验的目标很难达成,我们不得不使用短期数据来推断长期效应。因此我们希望借助短期结果变量作为替代指数(Surrogate index/Sind),继而得到长期结果变量和因果效应。因果图如下图所示:

08547779256a4107cfaa9d199faa04d3.png  

真实情况中,存在可被观测替代指数(observed surrogate,下图So),和未被观测替代指数(latent surrogate,下图Sl)。其中,Sl 存在某些代理变量 p。

62d179a9afe21f102655006810767a94.png

因此替代指数方法主要有两个问题:

  • 存在未被观测的替代指数 Sl,它们无法被作为特征使用

  • 很难区分可被观测替代指数 So 和代理变量 p

我们的方法(Laser)就是为了解决以上难点并评估长期因果效应。

2.2 替代指数的基本设定

2.2.1 数据集构造

我们的数据集分为两部分,实验数据集和观测数据集,其中在实验数据集中,我们无法观测到长期结果:

Dataops = (X,T,S), Dataexp = (X,S,Y)

2.2.2 假设

替代指数方法继承了因果推断中的一些经典假设,包括 SUTVA、Overlap、Unconfoundedness;除此之外,还有

  • (Comparability Assumption)给定协变量和所有替代指数,长期结果y在实验数据和观测数据的条件分布相同。

𝑝𝑜𝑏𝑠 (𝑦|𝑥, 𝑠𝑜, 𝑠𝑙 ) = 𝑝𝑒𝑥𝑝 (𝑦|𝑥, 𝑠𝑜, 𝑠𝑙 )

  • (Partially Latent Surrogacy Assumption)给定协变量和所有替代指数,干预t和长期结果y相互独立(注意给定可观测短期结果 so 和 p 无法阻断t到y的因果路径): 

𝑦 ⊥ 𝑡 |𝑠𝑜, 𝑠𝑙 , 𝑥

2.3 模型结构

模型框架包含以下两个步骤:

(1) 表示学习阶段:通过 iVAE 恢复 latent surrogate sl,进而通过 sl,so,x 准确估计 y

(2) 效应估计阶段:通过 IPW 方式估计长期因果效应

2.3.1 表示学习阶段

我们的模型包括两部分:1、基于 vae 的 inference network,其目的是为了恢复替代指数的条件概率分布 p(s|x,m,t),见下图:

fd757387770509c26a906d766248779f.png

2、使用 MLP 的 generative network,其目的是为了推断短期结果变量 m 和长期结果变量 y 的条件概率分布 p(m|x),p(y|s,x),见下图:

f7fcbbbfb3011153ccca638a304f70dd.png 

和现有 VAE 框架相同,我们假设替代变量 s 的先验分布 p(s|x,t) 服从标准正态分布。

9831ef5fef1a812fa444fa7470def71f.png

在 inference network 中,我们加入干预变量t、其他协变量x、和短期结果变量 m(包括 p 和 so)。后验变分近似被定义为下式。其中 mu_hat 和 sigma_hat 是模型需要学习的参数。

bfadb4917278e9712f828743e42d19a1.png 

在 generative network 中,我们将短期结果变量和长期结果变量的条件概率分布均定义为正态分布,由模型学习参数mu,v是一个很小的固定值。                       

57817715e7491e1d5b36517df5a1a2ed.png

def3c1cbda2fbfe33b8a2cbbf13322ae.png 

我们的目标函数由两部分组成:

  • 使用 ELBO 优化 inference network 跟 generative network

  • 对于长期结果 y,我们额外使用 y 的 log-likelihood 作为 loss 训练这个 MLP

691f7dee5de51739bea6aaa45b1de529.png

2.3.2 效应估计阶段

我们使用 IPW 来估计因果效应,其中 y_hat 为神经网络的输出,e(x) 为数据的倾向性得分 E(t|x)。

5d34c4e44ba9ec100f60642f998a1ab8.png

3. 评估  

我们选择因果效应估计的平均 MAPE 作为评估标准:

0321fa5a0ebb9750c90055e87cb8803f.png

我们的方法(Laser)分别比较 "Sind-Linear" 模型和 "Sind-MLP" 模型的效果。在不同的数据集的离线评测结果上,基于新方法的离线评测均取得了不错的提升:

dd6c3fd0e83d166ba312905f3f275a18.png

4. 总结与展望

通过借助短期结果变量作为替代指数,构建针对性的模型结构(Laser)去进行长期效应估计,该方法解决了长期效应估计中的时效性和成本两大难题,同时在离线评测集上验证了该方法的有效性。同时该方法后续实际生产应用过程中如果取得新的进展,会继续与大家分享!

推荐阅读

33fe59a75835871f69dcba79d01b3388.png

856d96ba2f4ac433471ba5c623b5d871.png

0b1b5dcd9c8159bdce679b4cbe7d7477.jpeg

5f4246be8737098f6465d1a54ec8405c.jpeg

2e16a70532e02d7c9d41ca27ed13d011.png

End

作者及部门介绍 

本篇文章作者李修涵、邹志超,均来自滴滴网约车MPT团队(Marketplace Technology)。团队致力于打造世界顶尖的智能交易平台,包括订单分配、司机调度、拼车、定价等方向,通过不断探索机器学习、强化学习等前沿技术,完善交易市场设计,实现资源最优化分配,力求解决正在发生的以及潜在供需失衡的状况,最大程度满足平台多样化的出行需求,持续优化乘客体验和保障司机收入,提升业务经营效率,引领出行行业变革与发展。

招聘信息

团队后端、算法需求招聘中,欢迎有兴趣的小伙伴加入,可以简历投递至pennyqinpei@didiglobal.com,或扫描下方二维码简历直投,期待你的加入!

高级研发工程师

岗位职责:

1. 负责核心的派单引擎架构的设计与开发,分布式匹配计算系统等;

2. 负责分单,导流、供需预测等复杂策略的架构设计和开发;

3. 负责新业务模式的探索。

ed7b5e80ea24ecadc1e9d7969e5fa069.png

高级算法工程师

岗位职责: 

1.研究包括独乘、拼乘模式下的各种交易匹配、分单调度、乘客预期等算法,持续提升核心交易效率;

2.利用因果推断、运筹规划、机器学习等技术,提升供需预测、定价等运营核心算法效果;

3.利用算法技术实现集团各业务线用户的高效增长,优化流量运营效率;

4.通过机器学习技术解决司乘纠纷和体验问题,打造良好司乘体验和平台秩序,构建司乘公平的判责能力,守护司乘的安全。

2e44d32c6efacc67a015bb661efd256f.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/640781.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux】Linux环境与历史

Yan-英杰的主页 悟已往之不谏 知来者之可追 C程序员,2024届电子信息研究生 目录 1.Linux发展史 a.是什么? b.计算机发展(硬件) 硅谷模式: c.操作系统的故事(软件) 计算机软硬件发展史: d.Linux操作系统 2.Linux提炼特征 a.开源 b.更多…

java设计模式之:组合模式

文章目录 1、什么是组合模式?2、组合模式定义3、组合模式通用代码实现4、组合模式优点5、组合模式应用场景 相信树形结构大家都知道,但是你是否知道用到了什么设计模式吗? 1、什么是组合模式? Compose objects into tree structu…

第二章 翻译

第二章 翻译 2010年真题(主旨词:sustainability) Section Ⅲ Translation Directions: In this section, there is a text in English. Translate it into Chinese. Write your translation on ANSWER SHEET 2. (15points) “Sustainabili…

转转前端周刊第六十九期

转转前端周刊 本刊意在将整理业界精华文章给大家,期望大家一起打开视野 如果你有发现一些精华文章想和更多人分享,可以点击我们的公众号名称,将文章链接和你的解读文案发给我们!我们会对内容进行筛选和审核,保留你的推…

【Rust日报】2023-06-11 Rust 中的 Telegram Bot 框架

MOBOT 的第一个版本,这是一个 Rust 中的 Telegram Bot 框架 这是我一直在研究的 Rust 中的 Telegram Bot 框架。我尝试了其他 Rust 库,但我发现它们对于我正在构建的机器人类型来说过于原始或过于具体。 它带有 Telegram Bot API 的完全原生实现&#xf…

最新前端技术趋势

本文作者系360奇舞团前端开发工程师 前端的车轮滚滚向前,轮子造的越来越圆,速度造的越来越快,每个人都在适应这个轮子的节奏,稍微不注意就会被甩出车轮之外。狼狈不堪之外还会发自心底的大喊一声:别卷了!&a…

数据空间基础设施的技术挑战及数联网解决方案

数据空间基础设施的技术挑战及数联网解决方案 罗超然1,2, 马郓1,2,3, 景翔1,2,4,黄罡1,2,5 1 数据空间技术与系统全国重点实验室,北京 100091 2 北京大数据先进技术研究院,北京 100091 3 北京大学人工智能研究院,北京 100871 4 北…

学了三年,一文告诉你物联网到底如何实现万物互联?

前言:作为计算机相关专业的你,绝对听说过物联网这个词,它的解释相比你也听过,叫万物互联,也就是所谓的IOT,但是说实话它到底如何实现的万物互联的你可能还真不知道。不是每个物体都有一个网络接口或者实体接…

线程同步(二)

目录 死锁 加锁之后忘记解锁: 重复加锁,造成死锁 在程序中有多个共享资源,因此有很多把锁,随意加锁,导致相互被阻塞 在使用多线程编程的时候,如何避免死锁呢? 读写锁 在程序中对读写锁加…

Rust每日一练(Leetday0029) 柱状图、最大矩形、扰乱字符串

目录 84. 柱状图中最大的矩形 Largest-rectangle-in-histogram 🌟🌟🌟 85. 最大矩形 Maximal Rectangle 🌟🌟🌟 87. 扰乱字符串 Scramble String 🌟🌟🌟 &#x1…

WebTransport 开播的应用实践之路

动手点关注 干货不迷路 Web开播的业务挑战 无论是本地软件推流还是Web推流,都需要解决推流抖动、画面高糊、音频卡顿等问题。在现有的Web技术环境下,如何稳定地把高质量的音视频流呈现给更多用户,是我们技术团队攻克的重点。从技术角度来解读…

lua编程——air724二次开发之串口通信教程

有了上一章文章《lua编程——air724二次开发之点亮led教程》的基础,接下来将介绍如何使用lua语言进行串口通信。 一、硬件连接 根据银尔达硬件资料的介绍,如下图: 直接将usb转ttl工具和4G模块进行连接,接收和发送线需要交叉连接。…

【IMX6ULL驱动开发学习】07.cdev注册驱动设备_设置次设备号范围

一、register_chrdev 在之前的hello驱动中,注册驱动设备的方式如下 /*初始化设备方法1:自动分配设备号,占用所有次设备号*/ major register_chrdev(0,"hello_drv",&hello_fops);使用 register_chrdev 分配设备号的方式比较…

从玩具到工具|社畜程序员用AI提效的神仙操作

👉腾小云导读 随着 AI 技术的日益发展,前端开发模式和提效工具也在不断地变化。作为一名前端工程师,如何应对 AI 带来的挑战和机遇?在这篇文章中,作者将介绍什么是 AIGC,并深入探讨 AI 在低代码平台的应用。…

【数据结构】顺序表及其实现

目录 1.线性表 2.顺序表 2.1顺序表的概念及结构 2.2顺序表的实现 1.线性表 线性表:是n个具有相同特性的数据元素的有限序列。线性表是一种在实际中广泛使用的数据结构,常见的线性表:顺序表,链表,栈,队…

Parallels Desktop 18 18.3.1激活攻略

如果说虚拟机领域有一位王者,非Parallels不能领袖群伦,毕竟大厂背书,功能满格,美中不足之处就是价格略高,但这也并非是Parallels的错,因为市场上没有任何一款虚拟机产品在产品力层面能和Parallels抗衡&…

使用Typora+PicGo+阿里云搭建图床

1.为什么要使用图床 不知道大家有没有遇到过这样的问题? 在使用Typora的时候,我们传到typora上面的图片,在转到其他地方时,总是加载不出来,造成图片丢失现象或者是在将markdown笔记上传到博客时,总是需要一…

华为OD机试真题 JavaScript 实现【静态代码扫描服务】【2023Q1 100分】

一、题目描述 静态扫描快速识别源代码的缺陷,静态扫描的结果以扫描报告作为输出: 文件扫描的成本和文件大小相关,如果文件大小为N,则扫描成本为N个金币;扫描报告的缓存成本和文件大小无关,每缓存一个报告…

(二)安装 Kafka

文章目录 1.选择操作系统2.配置 Java 环境3.安装 ZooKeeper4.安装 broker(1)安装 broker(2)验证是否安装正确 5.配置 broker(1)常规配置(2)主题的默认配置 6.配置 Kafka 集群&#x…

Netty之协议设计

目录 为什么需要协议 redis协议示例 http协议举例 自定义协议 要素 编解码器 测试 为什么需要协议 TCP/IP 中消息传输基于流的方式,没有边界。 协议的目的就是划定消息的边界,制定通信双方要共同遵守的通信规则 例如:在网络上传输 …