零膨胀泊松回归案例分析

news2024/12/25 0:22:14

零膨胀泊松回归分析

计数研究模型中,常用泊松回归模型,但泊松回归模型理论上是要求平均值与标准差相等,如果不满足,则可使用负二项回归模型

在实际研究中,会出现一种情况即因变量为计数变量,并且该变量包括非常多的数字0,当出现此种情况下,此时可考虑使用零膨胀泊松回归模型,也或者零膨胀负二项回归模型。零膨胀模型的特点是将模型分为两阶段进行(即设置为混合分布模型),第1阶段(零膨胀阶段)为计数变量是否为0的拟合,SPSSAU默认使用二元logit模型进行拟合,第2阶段为泊松分布模型拟合。零膨胀泊松回归模型如下所示:

 

零膨胀泊松回归模型分为两个阶段,第1阶段即零膨胀阶段可拟合因变量是否为0,此阶段中可放入一些自变量X用于拟合因变量是否取数字0的模型,当然也可不放入;第2阶段放入的自变量X为真实研究的变量项。

实际研究中,如果因变量中出现较多的数字0时,则可使用零膨胀泊松回归进行研究,当然还可以使用零膨胀负二项回归模型。至于零膨胀泊松回归模型与零膨胀负二项回归模型的选择上,建议可结合AIC或BIC信息准则进行判断,以信息准则值较小的模型作为最终模型。除此之外,相关文献中还使用Vuong检验进行判断,该检验在学术研究中受到置疑问,SPSSAU暂未来提供该检验(具体可参考下述文献: Wilson P . The misuse of the Vuong test for non-nested models to test for zero-inflation[J]. Economics Letters, 2015.)。


1 背景

当前有一份关于美国犯罪率的研究,数据包括被捕次数,该变量为计数变量,并且包括大量的数字0(即被捕次数为0),除此之外,包括另外5个自变量,分别是‘有前科比例’、‘平均判邢月数’、‘18岁以来入狱月数’、‘1986年合法收’和‘是否黑人’,其中是否黑人这项,使用数字1表示黑人,数字0表示不是黑人。部分数据截图如下:

2 理论

零膨胀泊松回归模型研究X对于Y的影响,且Y为计数变量且Y包括较多的数字0。除此之外,零膨胀泊松回归模型分为两个阶段,第1阶段为判断Y是否为0的二元logit模型,第1阶段中可包括影响Y是否为数字0的影响因素X,当然也可没有(如果没有此为常数);第2阶段为真实的研究模型。

特别提示:

  • 很多时候需要零膨胀泊松回归模型与零膨胀负二项回归模型进行选择对比使用,建议结合模型输出的AIC或BIC信息准则,以该两值较小值对应的模型作为最终模型。
  • 研究中也可考虑首先过滤掉数字0然后进行普通泊松回归(甚至OLS回归研究),但此种做法会丢失大量有意义样本。

3 操作

本例子中研究被捕次数的影响因素,其中影响因素包括‘有前科比例’、‘平均判邢月数’、‘18岁以来入狱月数’、‘1986年合法收’和‘是否黑人’,操作截图如下。

本案例时第1阶段零膨胀模型并不包括任何影响因素,因而‘零膨胀项X【可选】’框留空,不放入分析项。与此同时,本案例数据为原始数据并非带‘基数Exposure’格式数据,因而基数项框留空。

 

4 SPSSAU输出结果

零膨胀泊松回归模型一共输出4个表格,说明如下:

 

5文字分析

上表格展示‘被捕次数’的数字0分布情况,从上表格可以看到,共计2725个样本中有72.29%为数字0,因而意味着应该使用零膨胀模型较为适合。

 

从上表格可以看到:模型通过似然比检验(χ2 =213.709, p =0.000<0.05),即意味着模型构建有意义。除此之外,上表格展示出AIC值和BIC值,如果需要进行模型对比选优,可使用该两个指标,该两个指标值越小越好。

 

上表格展示出零膨胀泊松回归结果,首先零膨胀模型中仅列出常数值,因为本案例中零膨胀模型并没有设置影响‘被捕次数’是否为0的影响因素项。

从上表格可以看到:有前科比例呈现出0.01水平的显著性,回归系数值为-0.489,即意味着有前科比例越高时,被捕次数反倒越少。与此同时,合法收入也呈现出0.01水平的显著性,该项回归系数为-0.009<0,即意味着合法收越高的群体,其被捕次数越低。是否黑人这项的回归系数为0.493并且呈现出0.01水平的显著性,即说明相对来讲,黑人群体被捕次数明显会更高。与此同时,平均判刑月数、18岁以来入狱月数这两项对于被捕次数并没有影响关系,p值均大于0.05。

SPSSAU针对模型回归系数进行简化格式展示,如上表格所示。

6 剖析

零膨胀泊松分析涉及以下几个关键点,分别如下:

  • 首先需确保因变量包括较多的数字0,如果不是这样,此时应使用普通的泊松模型即可;
  • 如果需要在零膨胀泊松回归模型或者零膨胀负二项回归模型之间进行取值,建议结合AIC或BIC信息准则越小越好原理进行决择即可。
  • 零膨胀模型时共有两个阶段,第1阶段为零膨胀模型即研究因变量是否为0的模型,该模型中也可放入影响因素X,不放入时则该模型中仅有常数;第2阶段模型为真实研究和关注的模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/126222.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Lua闭包和Upvalue上值

一、lua中的作用域 在Lua语言中声明的变量默认是全局变量&#xff0c;声明局部变量需要使用local关键字&#xff0c;和其他语言相比这有点特殊。 -- 全局变量 a 10function func()b 100 -- 仍然是全局变量local c 20 -- func的局部变量 end func()print(a b) -- 输出…

终极.NET混淆器丨.NET Reactor产品介绍

无与伦比的 .NET 代码保护系统&#xff0c;可完全阻止任何人反编译您的代码。 产品优势 01、混淆技术 .NET Reactor通过向 .NET 程序集添加不同的保护层来防止逆向工程。除了标准的混淆技术之外&#xff0c;它还包括NecroBit、虚拟化、x86代码生成或防篡改等特殊功能。NET Re…

xilinx srio ip学习笔记之初识srio

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 xilinx srio ip学习笔记之初识srio前言IP 设置总结前言 因为工作原因&#xff0c;需要对rapidio 的协议进行了解&#xff0c;在xilinx的IP核中&#xff0c;是对应着Serial R…

这支隐藏“球队”,颠覆消费品「赛场」

【潮汐商业评论/原创】 大好的黄金周末&#xff0c;Fred约了几个朋友来家里看球。按照他的计划&#xff0c;周五准备下班后&#xff0c;他赶紧得去一趟附近的大型超市扫货&#xff0c;买一批零食酒水招待朋友。没想到的是&#xff0c;好不容易等到快下班了&#xff0c;领导通知…

外包呆一年,外包的工作经历怎么写?外包的项目经验怎么写?

0. 先来看下大家的各种问题&#xff1f; 外包的工作经历怎么写&#xff1f;外包的项目经验怎么写&#xff1f;外包如何优化简历&#xff1f;进入外包后黑化了简历&#xff0c;如何成功跳出外包圈&#xff1f;外包该如何提升自己&#xff1f;外包仔如何自我救赎&#xff1f; ……

前端基础_离线Web应用概述

离线Web应用概述 在Web应用中使用缓存的原因之一是为了支持离线应用。在全球互联的时代&#xff0c;离线应用仍有其实用价值。当无法上网的时候&#xff0c;你会做什么呢&#xff1f;你可能会说如今网络无处不在&#xff0c;而且非常稳定&#xff0c;不存在没有网络的情况。但…

【服务器数据恢复】误操作导致ocfs2文件系统被格式化的数据恢复案例

服务器故障&#xff1a; 用户误操作将linux文件系统误装入到Ocfs2文件系统的数据卷上&#xff0c;导致原始Ocfs2文件系统被格式化为Ext4文件系统。 因为Ext4文件系统每隔几百兆就会写入文件系统的原始信息&#xff0c;所以本案例中的原始Ocfs2文件系统中的数据可能受到一定程度…

搭建开源版个人图床

在微博图床、gitee、jsDelivr 陆续被 ban 的今天&#xff0c;很有必要搭建自己的图床系统了。 兰空图床 兰空图床官网&#xff1a;https://www.lsky.pro docker版本&#xff1a;https://hub.docker.com/r/halcyonazure/lsky-pro-docker 本次讲解使用 docker 版本进行部署使用 …

linux跟踪技术之ebpf

ebpf简介 eBPF是一项革命性的技术&#xff0c;起源于 Linux 内核&#xff0c;可以在操作系统内核等特权上下文中运行沙盒程序。它可以安全有效地扩展内核的功能&#xff0c;而无需更改内核源代码或加载内核模块。 比如&#xff0c;使用ebpf可以追踪任何内核导出函数的参数&…

漫画电学原理

电是什么 电压 电压是两点的电势差。 电流是指每秒在导线中流动的电量。 电功率是指在1s内消耗的电能。 电的本质是什么 万物都是有原子构成,原子有原子核(正电),核外电子(负电)构成。电子的定向移动形成了电。 电子离开原子,原子的电子减少,从而带正电。带正电的…

互联网时代“陨落”,国家发布元宇宙战略的信号对失业和担心失业的我们带来了什么启迪?

互联网这头“猪 ”真的掉下来了 流量红利已经一去不复返了&#xff01;3年前业界其实已经发出各种密集信号&#xff0c;在当时无论是BAT还是一些经济学家在3年前都已经预测过&#xff0c;互联网的流量模式已经衰竭&#xff0c;并且它将一去不复返。 曾经处于互联网大潮的我们…

day10Git

1.Git介绍 1.1版本控制(理解) 无论是代码编写&#xff0c;还是文档编写&#xff0c;我们都会遇到对文档内容反复修改的情况 1.2开发中存在的问题(理解) 程序员小明负责的模块就要完成了&#xff0c;就在即将提交发布之前的一瞬间&#xff0c;电脑突然蓝屏&#xff0c;硬盘光…

HTC FOCUS 3连接FOHEART H1数据手套

本教程介绍使用H1数据手套与HTC腕带式追踪器驱动VR中的虚拟手运动&#xff0c;实现手部的追踪及定位。 需要准备的硬件&#xff1a; 1、FOHEART H1数据手套 2、HTC VIVE Focus 3一体机 3、HTC VIVE 腕带式追踪器 01 一体机连接腕带追踪器 首先断开Focus3的手柄&#x…

【JavaWeb】Mybatis深度进阶练习

学习目标 能够使用映射配置文件实现CRUD操作能够使用注解实现CRUD操作 文章目录1、配置文件实现CRUD1.1 环境准备1.2 查询所有数据1.2.1 编写接口方法1.2.2 编写SQL语句1.2.3 编写测试方法1.2.4 起别名解决上述问题1.2.5 使用resultMap解决上述问题1.2.6 小结1.3 查询详情1.3.1…

(一) 初识python

1. python的特点&#xff1a; 可读性强 可读性远比听上去重要的多得多。一个程序会被反复的修改&#xff0c;可读性意味这让你可以在更短时间内学习和记忆&#xff0c;直接提高生产率。高效、简洁 研究证明&#xff0c;程序员每天可编写的有效代码是有限的。完成同样功能只用一…

浙大MBA复试经验分享——复试备考流程及要点提醒

最近身边有很多小伙伴都在咨询关于复试的问题&#xff0c;趁着今天有空把我的复试准备过程按照时间线梳理出来分享给大家&#xff0c;希望可以帮助到大家。 联考结束后&#xff0c;趁着考完印象还深刻&#xff0c;我们首先要做的就是估分&#xff08;辅导班或者小红书、知…

【06】概率图推断之变量消除算法

概率图推断之变量消除算法 文章目录说明性示例消除变量因子因子运算排序变量消除算法举例证据变量消除的时间复杂度选择变量消除顺序接下来&#xff0c;我们将注意力转向图模型中的推断问题。 给定概率模型&#xff08;如贝叶斯网络或马尔可夫随机场&#xff09;&#xff0c;…

开个脑洞,带你写一个自己的极狐GitLab CI Runner

极狐GitLab Runner 是极狐GitLab CI/CD 执行的利器&#xff0c;能够帮助完成 CI/CD Pipeline Job 的执行。 目前极狐GitLab Runner 是一个开源项目&#xff0c;以 Golang 编写。 极狐Gitlab 有个不错的特性&#xff0c;就是你可以使用自己的极狐Gitlab CI Runner。可是&#xf…

Oracle 单实例如何开机自启动

作者 | JiekeXu来源 |公众号 JiekeXu DBA之路&#xff08;ID: JiekeXu_IT&#xff09;如需转载请联系授权 | (个人微信 ID&#xff1a;JiekeXu_DBA)大家好&#xff0c;我是 JiekeXu,很高兴又和大家见面了,今天和大家一起来看看 Oracle 单实例如何开机自启动&#xff0c;欢迎点击…

盘点JAVA程序猿必备的webserver

作为java工程师&#xff0c;除了必备的java编程能力&#xff0c;我们还需要些什么呢&#xff1f; 一般而言&#xff0c;要从工程师进化为构架师&#xff0c;一个合格的java工作者需要掌握一些关于构架的知识&#xff0c; 比如互联网的结构&#xff0c;服务器的建设&#xff0c…