分位数回归模型及 Stata 具体操作步骤

news2024/9/9 1:25:10

目录

一、引言

二、理论原理

三、数据

四、Stata 程序代码及解释

五、代码运行结果及分析


一、引言

分位数回归作为一种强大的统计分析方法,能够更全面地揭示自变量与因变量在不同分位数水平上的关系。与传统回归仅关注均值不同,分位数回归有助于我们更深入地理解数据的分布特征和变量间的复杂联系。在 Stata 中,通过合理运用相关命令和操作,我们可以有效地进行分位数回归分析。

二、理论原理

分位数回归是对传统线性回归的拓展,其核心思想是针对不同的分位数水平来构建回归模型。

在传统线性回归中,基于最小二乘法的目标是使残差平方和最小,以获取对因变量均值的最优线性预测。但这种方法对异常值敏感,且仅能反映平均关系。

分位数回归具有诸多优点,如对异常值的稳健性、能够全面描述分布特征以及便于进行异质性分析等。

三、数据

首先,导入一份实际的数据。假设我们有学生的学习时间(study_time)、平时作业完成情况(homework_completion)作为自变量,考试成绩(exam_score)作为因变量。

clear
input study_time homework_completion exam_score
10 0.8 80
15 0.9 85
20 0.7 90
25 0.8 95
30 0.9 100
35 0.7 90
40 0.8 95
45 0.9 100
50 0.7 105
end

四、Stata 程序代码及解释

  1. 安装所需命令(若未安装)

ssc install qreg  // 安装分位数回归命令

  1. 数据描述性统计

summarize study_time homework_completion exam_score  // 查看数据的基本统计信息

  1. 进行分位数回归,包含控制变量

qreg exam_score study_time homework_completion, quantile(0.25)  // 估计 0.25 分位数的回归
qreg exam_score study_time homework_completion, quantile(0.5)  // 估计 0.5 分位数(中位数)的回归
qreg exam_score study_time homework_completion, quantile(0.75)  // 估计 0.75 分位数的回归

  1. 保存回归结果

estimates store qreg_25  // 保存 0.25 分位数的回归结果
estimates store qreg_50  // 保存 0.5 分位数的回归结果
estimates store qreg_75  // 保存 0.75 分位数的回归结果

  1. 查看回归结果

esttab qreg_25 qreg_50 qreg_75  // 以表格形式呈现回归结果

  1. 进行预测

predict yhat_25 if e(sample), xb  // 根据 0.25 分位数的回归结果进行预测
predict yhat_50 if e(sample), xb  // 根据 0.5 分位数的回归结果进行预测
predict yhat_75 if e(sample), xb  // 根据 0.75 分位数的回归结果进行预测

  1. 绘制预测值与实际值的图形

twoway (scatter exam_score yhat_25) (scatter exam_score yhat_50) (scatter exam_score yhat_75)  // 绘制散点图比较预测值与实际值

五、代码运行结果及分析

运行上述代码后,得到的结果会包含回归系数的估计值、标准误、t 值等。例如:

| Coefficient | Std. Err. | t | P>|t| |
|-------------|-----------|----|------|
| study_time | 2.5 | 1.8 | 0.12 |
| homework_completion | 1.2 | 0.9 | 0.25 |

这表明在 0.25 分位数处,学习时间每增加一个单位,考试成绩预计增加 2.5 个单位;平时作业完成情况每提高一个单位,考试成绩预计增加 1.2 个单位。

通过比较不同分位数下的回归结果,能够更全面地了解学习时间和作业完成情况对考试成绩影响在分布上的变化。

预测值与实际值的图形可以直观地展示模型的拟合效果。

六、总结

分位数回归为我们提供了更丰富的信息,在纳入控制变量后,能更准确地剖析自变量与因变量之间的关系。在 Stata 中的操作相对便捷,但在实际应用中,需依据数据特点和研究问题谨慎选择分位数水平,并对结果进行合理阐释与推断。

分位数回归-Quantile regression (qq.com)icon-default.png?t=N7T8https://mp.weixin.qq.com/s?__biz=Mzg4NDcwNzU3MA==&mid=2247484512&idx=1&sn=510493c92097290bf0ee183c685c352d&chksm=cfb55dfdf8c2d4eb53abb2f2dd243a4a380d072d1634217c71ff6ef324a11e1859a138e6cf2e#rd 

2006-2020上市公司研发投入金额数据集icon-default.png?t=N7T8https://download.csdn.net/download/a519573917/89501035 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1888690.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

function-calling初体验

课程地址:https://learn.deeplearning.ai/courses/function-calling-and-data-extraction-with-llms/lesson/1/introduction github notebook地址:https://github.com/kingglory/LLMs-function-calling/tree/main Function-Calling 介绍 函数调用(Funct…

GAMES104:04游戏引擎中的渲染系统1:游戏渲染基础-学习笔记

文章目录 概览:游戏引擎中的渲染系统四个课时概览 一,渲染管线流程二,了解GPUSIMD 和 SIMTGPU 架构CPU到GPU的数据传输GPU性能限制 三,可见性Renderable可渲染对象提高渲染效率Visibility Culling 可见性裁剪 四,纹理压…

格式化选NTFS还是exFAT 格式化NTFS后Mac不能用怎么办 移动硬盘格式化ntfs和exfat的区别

面对硬盘、U盘或移动硬盘的格式化决策,NTFS与exFAT作为主流的文件系统,用户在选择时可以根据它们的不同特点来选择适用场景。下面我们来看看格式化选NTFS还是exFAT,格式化NTFS后Mac不能用怎么办的相关内容。 一、格式化选NTFS还是exFAT 在数…

网络基础:EIGRP

EIGRP(Enhanced Interior Gateway Routing Protocol)是由思科开发的一种高级距离矢量路由协议,结合了距离矢量和链路状态路由协议的优点;EIGRP具有快速收敛、高效带宽利用、负载均衡等特点,适用于各种规模的网络。EIGR…

面试题springboot面试

文章目录 Spring的依赖注入构造器注入stetter注入属性注入 springboot的优势第一开箱即用约定大于配置内嵌tomcat服务器 javaweb的三大组件springboot的自动配置原理SpringIoc的实现机制springmvcspring如何简化开发 Spring的依赖注入 构造器注入 stetter注入 属性注入 使用…

python小练习04

三国演义词频统计与词云图绘制 import jieba import wordcloud def analysis():txt open("三国演义.txt",r,encodingutf-8).read()words jieba.lcut(txt)#精确模式counts {}for word in words:if len(word) 1:continueelif word "诸葛亮" or word &q…

环保管理新篇章:智慧环保引领制造业走向绿色未来

环保领域作为当代社会焦点之一,其重要性不言而喻,直接关系到人类生存环境的可持续发展,因此吸引了政府、企业及社会各界的深切关注。然而,在环保行业蓬勃发展的背后,亦浮现出一系列亟待解决的痛点:融资渠道…

PyTorch MNIST手写体识别:SwanLab可视化训练

MNIST手写体识别是深度学习、CV的“Hello World”,无数人从这个任务入门,进入深度学习的世界~ 进阶请看:PyTorch猫狗分类 这篇文章我将带大家使用SwanLab(训练可视化)、PyTorch(深度学习框架&…

Hive常用的内置函数

文章目录 聚合类1.指定列值的数目2.指定列值求和3.最大值4.最小值5.平均值6.中位数函数7.分位数函数 数值类1.取整函数Round(a)2.指定精度取整ROUND(double a,int b)3.向上取整FLOOR()4.向下取整CEIL()5.随机数 rand()6.绝对值函数 日期类获取当前日期获取当前时间戳日期前后日…

【Java环境配置过程详解(包括IDEA配置Java)】

目录 一、JDK下载安装 1. 官网下载JDK 2. 本地安装JDK 3. 配置环境变量 4. 验证是否安装成功 ​编辑二、IDEA进行安装下载 1. 官网下载 IDEA 2、IDEA进行Java开发 1. 创建Java项目 2. 程序测试 一、JDK下载安装 1. 官网下载JDK 1)官网链接: https://www.o…

IT行业入门,如何假期逆袭,实现抢跑

目录 前言 1.IT行业领域分类 2.基础课程预习指南 3.技术学习路线 4.学习资源推荐 结束语 前言 IT(信息技术)行业是一个非常广泛和多样化的领域,它包括了许多不同的专业领域和职业路径。如果要进军IT行业,我们应该要明确自己…

keyclock实现三方登录

公司希望我把公司的keycloak作为新项目的一种第三方登录方式时,就像微信,google,github,使用keycloak上的账户资源 因此,先需要跟公司keyclock管理员联系,让他把各个端点url,keycloak颁发的cli…

MATLAB将两个折线图画在一个图里

界面如图 输入行数和列数,点击开始填入数据,其中第一列为x值,后面几列,每一列都是y坐标值,填好后点击画在同一张图里即可。点击置零就把所有数变成0,另外也可以选择节点样式。 .mlapp格式的文件如下 夸克…

AI时代的产品经理的成长指南_pdca循环理论制定ai学习成长计划

一、人人不都是产品经理 大多数人听到“产品经理”这个词,总会联想到“人人都是产品经理”这句话。但实际上产品经理这个岗位并没有那么简单。 用一句话概括产品经理的职责就是“帮助团队交付正确产品给用户的人”。也就是说,产品经理要能凝聚团队的力…

归并排序-MergeSort (C语言详解)

目录 前言归并排序的思想归并排序的递归法归并排序的非递归法归并排序的时间复杂度与适用场景总结 前言 好久不见, 前面我们了解到了快速排序, 那么本篇旨在介绍另外一种排序, 它和快速排序的思想雷同, 但又有区别, 这就是归并排序, 如下图, 我们对比快速排序与归并排序. 本…

在线JSON可视化工具--改进

先前发布了JSON格式化可视化在线工具,提供图形化界面显示结构关系功能,并提供JSON快速格式化、JSON压缩、快捷复制、下载导出、对存在语法错误的地方能明确显示,而且还支持全屏,极大扩大视野区域。 在线JSON格式化可视化工具 但…

[Labview] 二维数组写入表格

就一个二维数组写表,CSDN天天让我改进质量 简直是迫害完美主义 天知道Labview有什么思路好写,就一个破连连看(ˉ▽ˉ;)... 随便写点什么碎碎念占字数好了

Linux源码阅读笔记09-进程NICE案例分析1

task_nice task_nice函数功能:获取某个进程的nice值,其中nice值为进程的优先级,与静态优先级有关(nicestatic_prio-120)。 nice的取值范围:-20 ~ 19 内核源码 根据内核的注释可以知道:task_n…

时间12小时和24时转换方法

24小时时间转为12小时制 function convertTo12Hour(time24h){let [hours, minutes] time24h.split(:);let modifier 上午;if (parseInt(hours, 10) > 12) {modifier 下午;hours (parseInt(hours, 10) - 12).toString();}if (parseInt(hours, 10) 12) {modifier 下午;}…

Arduino 与树莓派常用的 IMU 传感器

惯性测量单元(IMU)是一种高度集成的传感器系统,广泛应用于需要高精度运动和姿态信息的领域。某些高精度要求下,还需要辅以温度、气压等其他传感器信息。 一、组成与功能 1. 组成 9 轴 IMU 由三个主要部分组成:3 轴加…