零膨胀负二项回归案例分析

news2025/1/6 8:37:25

零膨胀负二项回归分析

计数研究模型中,常用泊松回归模型,但泊松回归模型理论上是要求平均值与标准差相等,如果不满足,则可使用负二项回归模型,负二项回归放宽了平均值=标准差这一理论假定。

在实际研究中,会出现一种情况即因变量为计数变量,并且该变量包括非常多的数字0,当出现此种情况下,此时可考虑使用零膨胀负二项回归模型。零膨胀模型的特点是将模型分为两阶段进行(即设置为混合分布模型),第1阶段(零膨胀阶段)为计数变量是否为0的拟合,SPSSAU默认使用二元logit模型进行拟合,第2阶段为负二项分布模型拟合。

零膨胀负二项回归模型分为两个阶段,第1阶段即零膨胀阶段可拟合因变量是否为0,此阶段中可放入一些自变量X用于拟合因变量是否取数字0的模型,当然也可不放入;第2阶段放入的自变量X为真实研究的变量项。


1 背景

当前有一份关于美国犯罪率的研究,数据包括被捕次数,该变量为计数变量,并且包括大量的数字0(即被捕次数为0),除此之外,包括另外5个自变量,分别是‘有前科比例’、‘平均判邢月数’、‘18岁以来入狱月数’、‘1986年合法收’和‘是否黑人’,其中是否黑人这项,使用数字1表示黑人,数字0表示不是黑人。部分数据截图如下:

2 理论

零膨胀负二项回归模型研究X对于Y的影响,且Y为计数变量且Y包括较多的数字0。除此之外,零膨胀负二项回归模型分为两个阶段,第1阶段为判断Y是否为0的二元logit模型,第1阶段中可包括影响Y是否为数字0的影响因素X,当然也可没有(如果没有此为常数);第2阶段为真实的研究模型。

3 操作

本例子中研究被捕次数的影响因素,其中影响因素包括‘有前科比例’、‘平均判邢月数’、‘18岁以来入狱月数’、‘1986年合法收’和‘是否黑人’,操作截图如下。

本案例时第1阶段零膨胀模型并不包括任何影响因素,因而‘零膨胀项X【可选】’框留空,不放入分析项。与此同时,本案例数据为原始数据并非带‘基数Exposure’格式数据,因而基数项框留空。

4 SPSSAU输出结果

零膨胀泊松回归模型一共输出4个表格,说明如下:

表格名称说明
零膨胀数据汇总结果展示因变量中数字0和不是数字0的分布情况
零膨胀负二项回归模型似然比检验展示模型似然比检验及信息准则指标等
零膨胀负二项回归分析结果汇总输出模型拟合回归系数结果
零膨胀负二项回归分析结果汇总-简化格式输出简化版格式模型结果

5文字分析

零膨胀数据汇总结果
样本量百分比
数字为0197072.29%
数字不为075527.71%
总计2725100%

上表格展示‘被捕次数’的数字0分布情况,从上表格可以看到,共计2725个样本中有72.29%为数字0,因而意味着应该使用零膨胀模型较为适合。

零膨胀负二项回归模型似然比检验
模型-2倍对数似然值卡方值dfpAIC 值BIC 值
仅截距4581.381
最终模型4365.366216.01550.0004377.3664412.827

从上表格可以看到:模型通过似然比检验(χ2 =216.015, p =0.000<0.05),即意味着模型构建有意义。除此之外,上表格展示出AIC值和BIC值,如果需要进行模型对比选优,可使用该两个指标,该两个指标值越小越好。

特别提示:

  • 如果需要对比选择零膨胀泊松回归和零膨胀负二项回归模型,直接对比AIC或BIC值选择较小时对应的模型即可。
  • 与此同时,当前案例直接进行零膨胀泊松回归时,会发现AIC值/BIC值非常接近,而且下述的回归分析表格数字和结论基本一致。

上表格展示出零膨胀泊松回归结果,首先零膨胀模型中仅列出常数值,因为本案例中零膨胀模型并没有设置影响‘被捕次数’是否为0的影响因素项。

 

从上表格可以看到:有前科比例呈现出0.01水平的显著性,回归系数值为-0.479,即意味着有前科比例越高时,被捕次数反倒越少。与此同时,合法收入也呈现出0.01水平的显著性,该项回归系数为-0.009<0,即意味着合法收越高的群体,其被捕次数越低。是否黑人这项的回归系数为0.498并且呈现出0.01水平的显著性,即说明相对来讲,黑人群体被捕次数明显会更高。与此同时,平均判刑月数、18岁以来入狱月数这两项对于被捕次数并没有影响关系,p值均大于0.05。

SPSSAU针对模型回归系数进行简化格式展示,如上表格所示。

6 剖析

零膨胀负二项回归分析涉及以下几个关键点,分别如下:

  • 首先需确保因变量包括较多的数字0,如果不是这样,此时应使用普通的负二项回归模型即可;
  • 如果需要在零膨胀泊松回归模型或者零膨胀负二项回归模型之间进行取值,建议结合AIC或BIC信息准则越小越好原理进行决择即可。
  • 零膨胀模型时共有两个阶段,第1阶段为零膨胀模型即研究因变量是否为0的模型,该模型中也可放入影响因素X,不放入时则该模型中仅有常数;第2阶段模型为真实研究和关注的模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/127859.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网络协议类型

网络协议是一组规则、约定和数据结构&#xff0c;用于规定设备如何跨网络交换数据。换句话说&#xff0c;网络协议可以等同于两个设备必须理解的语言&#xff0c;以实现信息的无缝通信&#xff0c;无论其基础设施和设计差异如何。 OSI 模型&#xff1a;网络协议的工作原理 要…

Oracle数据库安装配置详细教程汇总(含11g、12c、18c、19c、21c)

不论你是数据库小白&#xff0c;还是久经沙场的技术专家&#xff0c;你接触和运维Oracle数据库的第一步可能都是安装配置。并且随着软硬件的升级、替换以及业务场景的变化&#xff0c;数据库安装也将是你常常会进行的操作之一。 这里先为大家附上Oracle各版本支持的生命周期及…

阶段性回顾(2)

1. 移位操作符的对象只能是整数&#xff0c;只能对整数的二进制位进行移动。 2. 二进制是数值的一种表示形式。一个整数占了四个字节&#xff0c;相当于一个整数可以用32位二进制位序列表示&#xff0c;那么这时候该如何判断正负呢?规定&#xff1a;这32位二进制序列的头一位如…

第二十二讲:神州路由器OSPF单区域路由的配置

实验拓扑图如下所示 设备 端口 IP 子网掩码 网关 Router-A F0/0 172.16.1.1 255.255.255.0 无 F0/3 172.16.0.1 255.255.255.0 无 Router-B F0/0 172.16.1.2 255.255.255.0 无 F0/3 172.16.2.1 255.255.255.0 无 PC1 172.16.0.2 255.255.255.0 172.1…

解决docker容器因报错无法启动的问题,检查、修复容器错误并重启

问题复现 使用&#xff1a; sudo docker ps -a查看当前的docker容器&#xff1a; 我们想启动name为【docker-mongo】的这个容器&#xff0c;因此要执行 sudo docker start docker-mongo但是执行后仍旧没有重启&#xff0c;大概率是重启的时候报错了&#xff0c;查看日志&a…

Spring Boot骚操作-多数据源Service层封装

mysql, es, mongodb 三个数据源用配置文件方式连接&#xff0c;JPA只是正对dao做了封装&#xff0c;本文主要介绍如何对service层进行封装。 Spring Boot - 多个数据源Service层封装 类关系图 封装的一些配置 application.yml pom.xml 封装后使用 MySQL 动态数据访问 Mong…

坦克大战1.0,java时间处理机制

1.java 绘图坐标体系 1.1 坐标体系-介绍 下图说明了Java坐标系。坐标原点位于左上角&#xff0c;以像素为单位。在Java坐标系中,第一个是x坐标,表示当前位置为水平方向&#xff0c;距离坐标原点x个像素;第二个是y坐标&#xff0c;表示当前位置为垂直方向,距离坐标原点y个像素。…

金融业务如何高性能传输数据

对系统要求高&#xff0c;通常按金融级标准设计。金融数据传输要求速度快&#xff0c;流量大&#xff0c;极强容灾。 案例分析 简化版券商算法交易平台对接交易所&#xff1a; 涉及场景多。既有事务数据&#xff0c;也有市场数据模型简单。只涉及到2个主体复杂度可选。连接交…

【结构型】装饰模式(Decorator)

目录装饰模式(Decorator)适用场景装饰模式实例代码&#xff08;Java&#xff09;装饰模式(Decorator) 动态地给一个对象添加一些额外的职责。就增加功能而言&#xff0c;装饰模式 (Decorator) 比生成子类更加灵活。 适用场景 在不影响其他对象的情况下&#xff0c;以动态、透…

2023让工作效率直线飞升

2022年马上就要过去&#xff0c;过去的一年&#xff0c;腾讯云HiFlow和众多腾讯系应用也帮助了许多企业完成数字化转型&#xff0c;许多没有代码基础的业务人员也能通过搭建工作流&#xff0c;高效的处理生活&工作的繁杂事务&#xff0c;时间精力节省50%。把时间花在更重要…

开源 | 携程机票跨端 Kotlin DSL 数据库框架 SQLlin

作者简介禹昂&#xff0c;携程机票移动端资深工程师&#xff0c;专注于 Kotlin 移动端跨平台领域&#xff0c;Kotlin 中文社区核心成员&#xff0c;图书《Kotlin 编程实践》译者。一、背景2022年9月 Kotlin 1.7.20 发布之后&#xff0c;Kotlin Multiplatform Mobile&#xff08…

【计算机图形学入门】笔记7:Shading着色1(光照与基本着色模型)

07Shading着色&#xff08;光照与基本着色模型&#xff09;1.深度缓冲Z-buffering1.画家算法&#xff1a;先把远处的东西画在屏幕上&#xff0c;再画近处的&#xff0c;从而近处物体覆盖远处物体。&#xff08;油画家&#xff09;2.深度缓冲2.Shading着色1.我们目前学了哪些知识…

CleanMyMacX2023系统清理优化工具使用评测

如果你的macbook有点年头空间不够开始卡顿了&#xff0c;或者你是windows用户刚转来的&#xff0c;我强烈建议你安装一个cleanmymac&#xff01;Mac电脑清理是可以直接使用储存空间管理&#xff08;关于本机->储存空间->管理&#xff09;来清理&#xff0c;但是这里的其他…

Android开发笔记(一百九十)增强了日志功能的第二版Logcat

从Android Studio Dolphin开始&#xff0c;查看应用日志的Logcat全面升级&#xff0c;堪称Logcat 2.0版本。下面就让我们看看LogcatV2.0究竟带来了什么新特性吧。 对于Android Studio的老用户来说&#xff0c;小海豚版本新出的LogcatV2.0在用法上有不小的差异&#xff0c;一开始…

Fisher卡方全流程汇总

Fisher卡方 卡方检验研究数据的独立性&#xff0c;在分析样本量较少&#xff08;比如小于40&#xff09;&#xff0c;也或者期望频数出现小于5时&#xff0c;此时使用fisher卡方检验较为适合。SPSSAU医学研究模块中的卡方检验时&#xff0c;有提供2*2即4表格时提供fisher卡方检…

魔方(14)133魔方、一阶鬼魔魔方、双心魔方

目录 133魔方 1&#xff0c;魔方三要素 2&#xff0c;复原方法 一阶鬼魔魔方 1&#xff0c;魔方三要素 2&#xff0c;复原方法 双心魔方 133魔方 1&#xff0c;魔方三要素 &#xff08;1&#xff09;组成部件 9个块&#xff0c;1个中心块&#xff0c;4个棱块&#xff…

ZYNQ - 以太网远程更新SD卡应用程序

写在前面 对于ZYNQ系列的板卡固化&#xff0c;可以通过JTAG接口&#xff0c;使用SDK固化到FLASH中&#xff0c;或者可将SD卡取出将SD卡中保存的固化工程进行修改&#xff0c;但在很多情况下&#xff0c;离线更新会很不方便&#xff0c;本文借鉴网上常见的远程更新QSPI FLASH的…

思维导图 制作

PPT e.g&#xff1a; WPS中ppt 新建 文本框一定要 在外框之内。 左键 全选中&#xff0c;就会出来如下。 可直接点居中&#xff0c;就不用浪费time调位置 全选中&#xff0c;右键&#xff0c;【组合】 形成整体&#xff0c;可复制到word中 选择性粘贴到word中 skill: 左键…

《Linux运维总结:Centos7.6源码安装单实例redis6.2.8》

一、部署redis服务 1.1、环境信息 环境信息如下&#xff1a; 主机IP操作系统Redis版本CPU架构192.168.1.191Centos7.66.2.8x86_641.2、二进制方式 1、安装环境依赖 [rootlocalhost ~]# yum -y install gcc2、安装包下载 [rootlocalhost ~]# wget https://download.redis.io…

Linux-线程(LWP)

文章目录线程线程概念进程今天的进程 vs之前的进程私有和共享资源实验验证线程的优点&#xff1a;线程的缺点&#xff1a;线程异常线程的用途&#xff1a;线程控制创建线程(1)先创建两个线程&#xff1a;链接时要引入第三方库。(2)创建多个线程&#xff1a;(3)线程的健壮性不强…