离散被解释变量

news2025/1/11 18:41:36

一、二值选择模型

采用probit或者logit模型

logit y x1 x2 ,nolog r vce(cluster clustervar) or

nolog表示不用显示迭代过程

vce(cluster cluster)表示运用聚类标准误,由于二值选择模型一般采用稳健标准误的意义不大,所以常常使用聚类标准误。

or 表示结果不是显示系数,而是几率比,解释的话即变量增加一单位,y变成1 的概率就会增加多少,注意stata直接显示的是倍数,即y选择1状态的概率是另一种的多少倍。

(1)计算预测的准确率

estat clas

(2)数据可能存在异方差,可以添加你认为可能导致发生异方差的解释变量

 hetprob y x1 x2 x3,het(varlist)  //varlist处填写

解决的问题:

a. 为什么一般不考虑文件标准误

因为在两点分布的情况下,稳健标准误就等于MLE的普通标准误,如果模型设定正确,则无需使用稳健标准误。而如果模型设定存在问题,则probit 和logit并不能一致估计相关系数,采用稳健标准误的意义也不存在了。

但可以利用观察稳健标准误情况下是否与普通回归具有较大差距判断模型设定是否存在问题。

b. probit和logit有什么区别

总体而言,差别存在于对被解释变量的残差的前提假定不同:probit假定的是正态分布,Logit假定的是logitistic分布。

一般来说没有较大的差别

二、多值选择模型

存在两种变量,分别为随个体而变动的和随方案变动的。只存在随个体而变的则为多项logit,只存在随方案变动的则为条件logit,两种变量均存在则为混合logit

1. 多项logit

mlogit y x1 x2 x3,rrr base(n)

其中rrr表示显示风险比率
base(n)表示选取哪一组作为对照组,系统默认为样本数量最多的一组。

2. 条件logit

每个个体包括所有的方式,如统计某个家庭最终选择哪种交通方式,每一种旅行方式对应分别的旅行时间和费用,但是最终只会选择一个。

clogit choice train bus time invc,group(id) nolog or

其中id代表拥有所有选项的个体

 3. 混合logit

语法结构:
asclogit y x1 x2 x3,case(varname) alternatives(varname) casevars(varmane) base(n) or 

其中case指定个体
alternatives指定方案
casevars指定只随个体变动的解释变量

asclogit choice time invc, case(id) alternatives(mode) casevars(hinc psize) base(3) nolog or

 该模型需要手动计算R方

asclogit y x1 x2 x3,case(varname) alternatives(varname) casevars(varmane) base(n) nolog or 

asclogit y ,case(varname) alternatives(varname)  base(n) nolog or 

dis (log2-log1)/(log2) 

4. feologit:固定效应有序logic

feologit hourscat age union msp nev_mar tenure ln_wage,or nolog group(idcode)

命令下载 安装

net sj 20-2
net install st0596 (to install program files, if available)
net get st0596 (to install ancillary files, if available)
help feologit

语法结构

feologit depvar indepvars [if] [in] [weight],     ///
         group(varname)                           ///
         [thresholds clones(#) keepsample seed(#) ///
          cluster(clustvar) or otheropts]

其中:

depvar 是有序类别变量,即被解释变量
indepvars 是解释变量
if 是设定样本范围的条件语句
in 用于设定观察值范围
weight 用于设定权重

 

 5. 排序型

当被解释变量存在一定排序关系,例如债券评级等,则需要运用到排序模型

ologit y x1 x2 x3,nolog

oprobit y x1 x2 x3,nolog

三、多值模型计数型

泊松回归和负二项回归的抉择 

存在过度分散的情况下,但对被解释变量的方差函数并不清楚地时候,可采取泊松回归+稳健标准误的方式, 但在了解方差函数的情况下,当然负二项回归能够提供更加有效的估计。也可进行LR检验进行精准判断。

1. 泊松回归

poisson y x1 x2 x3,r irr

poisson y x1 x2 x3,r exposure(x1)

poisson y x1 x2 x3,r offset(x1)

irr表示显示发生比率
exposure(x1)表示将ln(x1)作为解释变量,并令其系数为1
offset(x1)表示单纯地把x1作为解释变量,其系数为1

2. 负二项回归

泊松回归地前提假设是被解释变量的期望和方差相等,即均等分散。但在实际数据中往往存在方差明显大于期望的情况,此时急需要采取负二项回归。dispersion(constant)表示采取NB1模型,默认是采取NB2模型。

nbreg y x1 x2 x3,r exposure(x1)

nbreg y x1 x2 x3,r dispersion(constant) offset(x1)

3. 零膨胀

当计数数据中存在大量的0时,需要考虑零膨胀模型。

zip y x1 x2 x3,inflate(varlist) voung

zinb y x1 x2 x3,inflate(varlist) voung

观察最后的vuong检验的p值,可以发现强烈拒绝标准泊松回归,而应该采用零膨胀。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/94706.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据可视化:对比漏斗图多维度分析大学在校实际开销情况

都说80后90后是“苦逼”的一代,他们读小学的时候,上大学免费;等到他们上大学了,读小学免费。可事实真的是这样吗?下面小编用一款数据可视化软件,带你解读一下现在的大学生,开销到底有多少。 漏…

怎样判断一个变量是数组还是对象?

判断的基本方法 1. typeof(不可以) 通常情况下,我们第一时间会想到typeof运算符,因为typeof是专门用于类型检测的,但是typeof并不能满足这样的需求,比如 let a [7,4,1] console.log(typeof(a)) //输出object 复制代码 2. in…

以太网 VLAN的5种划分方式(基于端口、基于MAC地址、基于IP子网、基于协议、基于策略)介绍与基础配置命令

2.8.3 以太网 VLAN(VLAN划分方式) VLAN的划分方式有2.8.3 以太网 VLAN(VLAN划分方式)一、基于端口划分二、基于MAC地址划分三、基于IP子网划分四、基于协议划分五、基于策略划分一、基于端口划分 简述:端口上进行手动…

bitset位图的介绍与使用

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录bitset的介绍位图的引入位图的概念位图的应用bitset的使用bitset的定义方式bitset的成员函数bitset运算符的使用如有错误,多多指教!bitset的介…

传奇GEE引擎微端架设教程

传奇GEE引擎微端架设教程 GEE引擎架设微端需要准备好微端程序,用网站下载在服务器的版本 Mirserver文件一般都是自带微端程序的,偶尔也有版本没有微端程序那我们只需要到别的版本或者资源把微端程序拉到我们的文件夹里面D:\Mirserver 这个就…

MyBatisPlus常用注解

MyBatisPlus常用注解 TableName:自定义表名 给User实体类添加注解 aplication.yml中添加mp的配置 # 配置mp的日志 mybatis-plus:configuration:log-impl: org.apache.ibatis.logging.stdout.StdOutImpl# 设置MyBatis-Plus的全局配置global-config:db-config:table…

java基础巩固-宇宙第一AiYWM:为了维持生计,架构知识+分布式微服务+高并发高可用高性能知识序幕就此拉开(三:注册中心balabala)~整起

比如咱们作为客户端进行购物时,那么多服务提供者【服务提供者有很多实例,可能人家已经搞了拆分模块后的分布式集群,那实例就不少啦】,如果用非技术的眼光看就是,你提供多个,我挑一个买,咱们的访…

立足浙江 辐射全国 护航数字经济发展|美创科技亮相首届数贸会

12月11日-14日,首届全球数字贸易博览会在杭州隆重召开。作为国内唯一经党中央、国务院批准的以数字贸易为主题的国家级、全球性专业博览会,首届数贸会由浙江省人民政府和商务部联合主办,杭州市人民政府、浙江省商务厅和商务部贸发局共同承办。…

EtherCAT设备协议详解二、EtherCAT状态机及配置流程

EtherCAT状态机(ESM) EtherCAT状态机定义了每个EtherCAT从站设备的分步设置,并指示了可用的功能。设备可以拒绝来自主站的状态请求,并通过错误指示(AL 状态寄存器中的错误标志)和相关错误代码(A…

Linux高级 I/O

目录 一、五种I/O模型 1. 阻塞式I/O 2. 非阻塞式I/O 3. I/O复用(多路转接) 4. 信号驱动式I/O 5. 异步I/O 二、五种I/O模型的比较 三、I/O复用典型使用在下列网络应用场合 一、五种I/O模型 阻塞式I/O非阻塞式I/OI/O复用(多路转接&a…

ios 计算label宽度方法效率对比

方式1: 设置好label的文字,字号等属性后,调用 self.label.text "111"; self.label.font [UIFont systemFontOfSize:17]; [self.label sizeToFit]; 方式2: 使用字符串的方法计算文字宽度, - (CGRect)boun…

TheFuck—Python写的超实用命令纠正工具

序言 哈喽兄弟们,我们在学习Python的过程中,有这么一款工具,可以轻松纠正我们写错的命令,简直太好用了~ The Fuck 是一款功能强大的、Python编写的应用程序,可用于纠正控制台命令中的错误,非常强大。此外…

Linux多线程(二):线程控制

文章目录一、前言二、认识线程控制函数1.线程创建2.线程退出3.线程等待4.查看线程id5.线程分离6.综合demo三、线程id本质是地址?一、前言 上篇博客谈到,Linux并没有真线程,而是通过复用进程的数据结构来模拟实现线程的。因此 Linux 自然不会提…

所有的为时已晚都是恰逢其时,社科院与杜兰大学金融管理硕士邀你在职读研

最近有咨询的同学询问,我年龄快35岁了读研晚吗?记得在网上看到过一句话,你觉得为时已晚的时候,恰恰是最早的时候。你可以确定一下你的内心,是不是真的想读研,既然迟早要读的话,与其等到了40、50…

ISO 15765-2协议分享(一)- TP时间参数详解

文章目录 前言一、时间参数协议定义二、使用步骤 1.引入库2.读入数据总结前言 无大志者常立志,让自己生活中时时有目标,有努力的方向。 老规矩,正文前分享喜欢的文字: 生活中,你越是去竭力回避不适的感觉,就越是难以推进生活中的重要转变。 不回避,积极面对,是提升自…

蓝奥声网关为什么会受到广大用户的欢迎?

蓝奥声GP20蓝牙网关是一款支持无线和有线连接的智能网关,配有独特的网口驱动,支持带有TCP/IP的以太网接口。用于互联网访问和与主机服务器的通信,用于远程命令和本地处理数据的数据上传/下载。它支持 RJ45/POE 和 WiFi 两种网络角色。 GP20蓝…

点面科技荣获优胜企业奖,圆满从2022“创·在上海”国际创新创业大赛之“创·加速营”毕业

创在上海 赢在未来 “创在上海”国际创新创业大赛暨中国创新创业大赛 (上海赛区) 是一项具有广泛影响力的创新创业活动。 为提升入围全国赛的参赛企业的参赛能力,“创在上海”将充分整合和调动多方资源,结合国赛进程,创新推出针对入围国赛企…

Git常用命令总结

配置git 本地创建 ssh key: ssh keygen -t rsa -c “email” // email:github上注册用的邮箱 把上面生成的 key 粘贴到 gitHUb中的 sshkey中 验证 是否成功 ssh -T gitgithub.com 如果是第一次的会 提示 是否continue ,输入 yes 就会看到 You’ve succe…

Springboot健康上报小程序: element后台管理系统(完整代码)

这几天接到了个学生的需求,挺简单的,大概就是按照她的需求做一个疫情期间常态化管理的小程序,由于我对java不熟悉,基本上是边做边学,这里我将对本次项目做个记录 ✨✨欢迎订阅本专栏或者关注我,大家一起努力…

内科大机器学习框架课程重点内容笔记

文章目录一.背景二.内容一.背景 这是2020届内科大机器学习框架课程的考试复习内容 二.内容 1.变量间的相互关系: (1)确定性关系或函数关系:研究的是确定现象非随机变量间的关系。 (2)相关关系或统计依赖关系:研究的是非确定现象随机变量间…