【Python实战因果推断】14_线性回归的不合理效果4

news2024/12/25 12:38:07

目录

Debiasing Step

Denoising Step

 Standard Error of the Regression Estimator


Debiasing Step

回想一下,最初由于混杂偏差,您的数据看起来是这样的、 随着信贷额度的增加,违约率呈下降趋势:

根据 FWL 定理,您可以通过拟合一个回归模型来预测混杂因素对信用额度的干预情况,从而对这一数据进行去伪存真。然后,您可以求出该模型的残差:\widetilde{line}_i=line_i-\widehat{line}_i 。这个残差可以看作是与去伪存真模型中使用的变量不相关的干预结果。这是因为,根据定义,残差与产生预测结果的变量是正交的。

这一过程将使残差\widetilde{line}以零为中心。您还可以选择将平均干预值\overline{line}加回来: \widetilde{line}_i=line_i-\widehat{line}_i+\overline{line}

这对于去偏是不必要的,但它将\widetilde{line}放在与原始line相同的范围内,这更适合于可视化的目的:

 debiasing_model = smf.ols(
 'credit_limit ~ wage + credit_score1 + credit_score2',
 data=risk_data
 ).fit()
 risk_data_deb = risk_data.assign(
 # for visualization, avg(T) is added to the residuals
 credit_limit_res=(debiasing_model.resid
 + risk_data["credit_limit"].mean())
 )

如果您现在运行一个简单的线性回归,将结果风险与去干预化或残差化的处理结果线性回归,您就已经得到了信用额度对风险的影响,同时控制了去干预化模型中使用的混杂因素。这里得到的 β1 参数估计值与之前运行完整模型得到的参数估计值完全相同,在完整模型中包含了干预和混杂因素:

 model_w_deb_data = smf.ols('default ~ credit_limit_res',
 data=risk_data_deb).fit()
 model_w_deb_data.summary().tables[1]

但还是有区别的。看看 p 值。它比你之前得到的要高一些。这是因为你没有应用去噪步骤,而去噪步骤的作用是减少方差。尽管如此,考虑到所有的混杂因素都包含在去噪模型中,仅通过去噪步骤,您就可以得到信用额度对风险的因果影响的无偏估计值。您还可以通过绘制除权后的信用额度与违约率的对比图来直观地了解情况。你会发现,这种关系不再像数据有偏差时那样向下倾斜:

Denoising Step

去偏步骤对于估算出正确的因果效应至关重要,而去噪步骤虽然没有那么重要,但也是不错的选择。它不会改变干预效果估计值,但会减小其方差。在这一步中,您将对干预结果与非治疗的协变量进行回归。然后,您将得到结果的残差

\widetilde{default}_i=default_i-\widehat{default}_i

同样,为了达到更好的可视化效果,您可以将平均默认设置率添加到去噪默认设置变量中:\widetilde{default}_i=default_i-\widehat{default}_i+\overline{default}

 denoising_model = smf.ols(
 'default ~ wage + credit_score1 + credit_score2',
 data=risk_data_deb
 ).fit()
 risk_data_denoise = risk_data_deb.assign(
 default_res=denoising_model.resid + risk_data_deb["default"].mean()
 )

 Standard Error of the Regression Estimator

既然我们在讨论噪声,我想现在是了解如何计算回归标准误差的好时机。回归参数估计的 SE 由以下公式给出:

SE\big(\hat{\beta}\big)=\frac{\sigma(\hat{\epsilon})}{\sigma(\tilde{T}\big)\sqrt{n-DF}},

其中,\hat{\epsilon} 是回归模型的残差,DF 是模型的自由度(模型估计的参数数)。

 model_se = smf.ols(
 'default ~ wage + credit_score1 + credit_score2',
 data=risk_data
 ).fit()
 print("SE regression:", model_se.bse["wage"])
 
 model_wage_aux = smf.ols(
 'wage ~ credit_score1 + credit_score2',
 data=risk_data
 ).fit()
 # subtract the degrees of freedom - 4 model parameters - from N.
 se_formula = (np.std(model_se.resid)
 /(np.std(model_wage_aux.resid)*np.sqrt(len(risk_data)-4)))
 print("SE formula: ", se_formula)

这个公式很好,因为它能让你进一步直观地了解一般回归,特别是去噪步骤。首先,分子告诉你,你能预测的结果越好,残差就越小,因此估计值的方差就越小。这正是去噪步骤的目的所在。它还告诉你,如果干预方法能很好地解释结果,其参数估计的标准误差也会更小。

有趣的是,误差还与(残差化)干预处理的方差成反比。这也很直观。如果干预措施的方差很大,就更容易衡量其影响。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1888132.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

力扣习题--哈沙德数

一、前言 本系列主要讲解和分析力扣习题,所以的习题均来自于力扣官网题库 - 力扣 (LeetCode) 全球极客挚爱的技术成长平台 二、哈沙德数 1. 哈沙德数 如果一个整数能够被其各个数位上的数字之和整除,则称之为 哈沙德数(Harshad number&…

JAVA学习笔记-JAVA基础语法-DAY21-缓冲流、转换流、序列化流

第一章 缓冲流 昨天学习了基本的一些流,作为IO流的入门,今天我们要见识一些更强大的流。比如能够高效读写的缓冲流,能够转换编码的转换流,能够持久化存储对象的序列化流等等。这些功能更为强大的流,都是在基本的流对象…

【echarts】拖拽滑块dataZoom-slider自定义样式,简单适配移动端

电脑端 移动端 代码片段 dataZoom: [{type: inside,start: 0,end: 100},{type: slider,backgroundColor: #F2F5F9,fillerColor: #BFCCE3,height: 13, // 设置slider的高度为15start: 0,end: 100,right: 60,left: 60,bottom: 15,handleIcon:path://M30.9,53.2C16.8,53.2,5.3,41.…

【Git 学习笔记】1.3 Git 的三个阶段

1.3 Git 的三个阶段 由于远程代码库后续存在新的提交,因此实操过程中的结果与书中并不完全一致。根据书中 HEAD 指向的 SHA-1:34acc370b4d6ae53f051255680feaefaf7f7850d,可通过以下命令切换到对应版本,并新建一个 newdemo 分支来…

基于LSTM、GRU和RNN的交通时间序列预测(Python)

近年来,人工智能技术的发展推动了智慧交通领域的进步,交通流预测日益成为研究热点之一。交通流预测是基于历史的交通数据对未来时段的交通流状态参数进行预测。作为交通流状态的直接反映,交通流参数的预测结果可以直接应用于 ATIS 和ATMS 中&…

QT Designer中的qrc文件如何创建,将图片添加进qrc文件

创建qrc文件可以在qt中给空间添加个性化属性 一、创建qrc文件的方式 1、将以下代码复制到txt文件文件中 <!DOCTYPE RCC> <RCC version"1.0"> <qresource prefix"/"><file>background_img.png</file><file>backgrou…

第二证券:可转债基础知识?想玩可转债一定要搞懂的交易规则!

可转债&#xff0c;全称是“可转化公司债券”&#xff0c;是上市公司为了融资&#xff0c;向社会公众所发行的一种债券&#xff0c;具有股票和债券的双重特点&#xff0c;投资者可以选择按照发行时约定的价格将债券转化成公司一般股票&#xff0c;也可作为债券持有到期后收取本…

计算机网络网络层复习题1

一. 单选题&#xff08;共27题&#xff09; 1. (单选题)以太网 MAC 地址、IPv4 地址、IPv6 地址的地址空间大小分别是&#xff08; &#xff09;。 A. 2^48&#xff0c;2^32&#xff0c;2^128B. 2^32&#xff0c;2^32&#xff0c;2^96C. 2^16&#xff0c;2^56&#xff0c;2^6…

【51单片机入门】矩阵键盘

文章目录 前言矩阵键盘介绍与检测原理原理图代码讲解总结 前言 在嵌入式系统设计中&#xff0c;键盘输入是一种常见的人机交互方式。其中&#xff0c;矩阵键盘因其简单、方便和易于扩展的特性&#xff0c;被广泛应用于各种设备中。本文将介绍如何使用51单片机来实现矩阵键盘的…

修改Springboot项目名称

修改Springboot项目名称 1. 整体描述2. 具体步骤2.1 修改module名称2.2 修改程序包名2.3 mybatis/mybatis-plus配置修改2.4 logback文件2.5 yml配置2.6 Application启动类2.7 其他 3. 总结 1. 整体描述 开发过程中&#xff0c;经常遇到新来个项目&#xff0c;需要一份初始代码…

数字化精益生产系统--RD研发管理系统

R&D研发管理系统是一种用于管理和监督科学研究和技术开发的软件系统&#xff0c;其设计和应用旨在提高企业研发活动的效率、质量和速度。以下是对R&D研发管理系统的功能设计&#xff1a;

学习springMVC

第四章 Spring MVC 第一节 Spring MVC 简介 1. Spring MVC SpringMVC是一个Java 开源框架&#xff0c; 是Spring Framework生态中的一个独立模块&#xff0c;它基于 Spring 实现了Web MVC&#xff08;数据、业务与展现&#xff09;设计模式的请求驱动类型的轻量级Web框架&am…

和鲸“101”计划领航!和鲸科技携手北中医,共话医学+AI 实验室建设及创新人才培养

为进一步加强医学院校大数据管理与应用、信息管理与信息系统&#xff0c;医学信息工程等专业建设&#xff0c;交流实验室建设、专业发展与人才培养经验&#xff0c;6 月 22 日&#xff0c;由北京中医药大学&#xff08;简称“北中医”&#xff09;主办&#xff0c;上海和今信息…

使用Spring Boot实现博客管理系统

文章目录 引言第一章 Spring Boot概述1.1 什么是Spring Boot1.2 Spring Boot的主要特性 第二章 项目初始化第三章 用户管理模块3.1 创建用户实体类3.2 创建用户Repository接口3.3 实现用户Service类3.4 创建用户Controller类 第四章 博客文章管理模块4.1 创建博客文章实体类4.2…

to_json 出现乱码的解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

PyCharm远程开发

PyCharm远程开发 1- 远程环境说明 每个人的本地电脑环境差别很大。各自在自己电脑上开发功能&#xff0c;测试/运行正常。但是将多个人的代码功能合并&#xff0c;运行服务器上&#xff0c;会出现各种版本兼容性问题。 在实际企业中&#xff0c;一般会有两套环境。第一套是测…

2.3 主程序和外部IO交互 (文件映射方式)----IO Server实现

2.3 主程序和外部IO交互 &#xff08;文件映射方式&#xff09;----IO Server C实现 效果显示 1 内存共享概念 基本原理&#xff1a;以页面为单位&#xff0c;将一个普通文件映射到内存中&#xff0c;达到共享内存和节约内存的目的&#xff0c;通常在需要对文件进行频繁读写时…

【单片机毕业设计选题24043】-可旋转式电视支架控制系统设计与实现

系统功能: 系统操作说明&#xff1a; 上电后OLED显示 “欢迎使用电视支架系统请稍后”&#xff0c;两秒后进入正常界面显示 第一页面第一行显示 Mode:Key&#xff0c; 第二行显示 TV:Middle 短按B5按键可控制步进电机左转&#xff0c; 第二行显示 TV:Left 后正常显示 TV:…

【操作系统期末速成】 EP04 | 学习笔记(基于五道口一只鸭)

文章目录 一、前言&#x1f680;&#x1f680;&#x1f680;二、正文&#xff1a;☀️☀️☀️2.1 考点七&#xff1a;进程通信2.2 考点八&#xff1a;线程的概念2.3 考点九&#xff1a;处理机调度的概念及原则2.4 考点十&#xff1a;调度方式与调度算法 一、前言&#x1f680;…

因为文件共享不安全,所以你不能连接到文件共享。此共享需要过时的SMB1协议,而此协议是不安全的 解决方法

目录 1. 问题所示2. 解决方法3. 解决方法1. 问题所示 输入共享文件地址的时候,出现如下信息: 因为文件共享不安全,所以你不能连接到文件共享。此共享需要过时的SMB1协议,而此协议是不安全的,可能会是你的系统遭受攻击。你的系统需要SMB2或更高版本截图如下所示: 2. 解决…