R语言对二分连续变量进行逻辑回归数据分析

news2025/1/12 4:09:27

教育或医学的标准情况是我们有一项连续的措施,但随后我们对那些具有临床/实践意义的措施有了切入点。一个例子是BMI。 

 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

逻辑回归Logistic模型原理和R语言分类预测冠心病风险实例

,时长06:48


最近我们被客户要求撰写关于逻辑回归的研究报告,包括一些图形和统计输出。您可能有一个成绩测试,合格分数为70。研究人员有时可能会对30岁以上的BMI建模感兴趣,或者对通过/失败作的结果感兴趣。实质性问题通常落在对某人超过/低于此临床上显着阈值的概率进行建模的范畴之内。因此,我们将连续测量结果分为两部分,并使用逻辑回归等方法分析。

回到介绍性统计信息,您会听到类似的信息:大多数人宁愿使用规则线性回归而不是逻辑回归。但是,在上述情况下,出于实质性原因,我们经常有理由将结果一分为二。

因此,这是建议:

  • 估计连续结果的线性模型
  • 可以对它们取幂以获取赔率。
  • 我们不在乎线性回归的截距,因为它会受到阈值的影响。

那么这种方法在实践中如何起作用?在使用逻辑回归分析之前尝试在不同阈值上将连续变量二等分的任何人都知道,估计的系数确实会发生变化,并且它们会发生很大的变化!这是否与结果不应依赖阈值的说法相符?

我们可以使用模拟进行检查。首先,我将逐步介绍数据生成过程:

set.seed(12345) # Set seed for reproducible results

# Our single x variable is binary with 50% 0s and 50% 1s
# so like random assignment to treatment and control
# Our sample size is 300
dat <- data.frame(x = rbinom(300, 1, .5))
# Outcome ys = intercept of -0.5, the coefficient of x is 1 and there is logistic error
dat$yc <- -.5 + dat$x + rlogis(nrow(dat))

yc

 

然后,我们可以yc在各个点上将结果分为两部分,以查看x当使用逻辑回归时是否会影响估计系数:

        x
0.9619012

       x
1.002632

        x
0.8382662

数字有些不同。如果我们yc直接将线性回归应用?

# First, we create an equation to extract the coefficients and
# transform them using the transform to logit formula above.

       x
1.157362

所有这些数字彼此之间并没有太大差异。如果我们对它们求幂以获得比值比,它们的差异会更大。现在,我们可以重复此过程几次,以比较结果中的模式。我重复2500次:


    vlt.x      lt.x      mt.x      ht.x     vht.x     ols.x
1.0252116 1.0020822 1.0049156 1.0101613 1.0267511 0.9983772

这些数字是不同方法的平均回归系数。

v代表非常,l / m / h代表低/中/高,t代表阈值,ols是回归结果。因此,例如,vlt.x是来自极低阈值模型的平均x系数。

所有方法的这些估计系数平均约为1,这就是我们编写的程序!每个方法的可变性如何?

boxplot(res)

Boxres

我们看到,尽管平均值大致相同,但是当阈值极高时,估计的系数就更加可变。最小的可变系数是变换后的线性回归系数,因此当我们使用线性回归方法时,结果有些稳定。阈值越极端,我们获得的可变系数就越多。我们经常将数据二分法用于极端情况下的逻辑回归。

不同方法之间的估计系数如何?


对

我们看到,尽管所有方法声称x的系数y平均为1,但阈值非常低时的估计系数与阈值非常高时的估计系数非常弱相关(.13)。这些差异仅反映阈值,并且可能在实际数据分析中产生误导。人们可能会相信,在不同的阈值处的估计值差异很大,而在不同的阈值下却代表不同的人口参数(真实系数)。与每种方法最相关的方法是线性回归方法。线性回归方法与中阈值结果最相关。它也是最稳定的。


从本质上讲,当将数据按极端阈值二等分时,我们是否应该相信这些发现?还是应该只使用变换后的线性回归系数?

在结果的不同分位数处,预测变量和结果之间的关系也可能不同--分位数回归情况探讨。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/83649.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springcloud04:Feign使用接口方式调用服务以及Hystrix服务熔断

Feign使用接口方式调用服务以及Hystrix服务熔断Feign负载均衡客户端集成FeignHystrixHystrix定义服务熔断服务端集成Hystrix(springcloud-provider-dept-hystrix)实现服务熔断客户端集成Hystrix实现服务降级服务监控Feign负载均衡 简介 客户端集成Feign pom文件 <!--Feig…

golang编译tag学习

官方资料 官方解释&#xff1a; https://pkg.go.dev/cmd/go#hdr-Build_constraints ,go help buildconstraint 也能看到描述 根据官方描述&#xff0c;go1.16开始建议使用go:build方式&#xff0c;与build相比更容易被人阅读。 有关go:build注释的解析&#xff1a; src/go/buil…

[附源码]Node.js计算机毕业设计道岔故障监测系统设计Express

项目运行 环境配置&#xff1a; Node.js最新版 Vscode Mysql5.7 HBuilderXNavicat11Vue。 项目技术&#xff1a; Express框架 Node.js Vue 等等组成&#xff0c;B/S模式 Vscode管理前后端分离等等。 环境需要 1.运行环境&#xff1a;最好是Nodejs最新版&#xff0c;我…

CSS -- 05. CSS定位方式总结

文章目录CSS定位1 定位1.1 为什么需要定位1.2 定位组成1.3 静态定位 static&#xff08;了解&#xff09;1.4 相对定位 relative&#xff08;重要&#xff09;1.5 绝对定位 absolute&#xff08;重要&#xff09;1.6 子绝父相1.7 固定定位 fixed&#xff08;重要&#xff09;1.…

SpringMVC(三) 获取请求参数(干货、超详细)

1.环境搭建 见SpringMVC(一) 2.获取参数 2.1使用Servlet API获取请求参数 将HttpServletRequest作为控制器方法的形参&#xff0c;DispatcherServlet发现控制器方法有HttpServletRequest形参&#xff0c;就把参数给传进来&#xff0c;HttpServletRequest就是javaWeb中的Htt…

[附源码]计算机毕业设计房屋租赁信息系统Springboot程序

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; Springboot mybatis MavenVue等等组成&#xff0c;B/S模式…

Python文件操作详解(一)

今天继续给大家介绍Python相关知识&#xff0c;本文主要内容是Python文件操作详解。 一、Python文件处理简介 使用Python可以编写程序处理文件&#xff0c;Python可以处理的文件值得是任何存储在辅助存储器上的数据序列。 在Python中&#xff0c;对于文件的处理通常由一定的流…

Code::Blocks(V20.03)工具安装、汉化、使用一条龙介绍

文章目录1、猿如意介绍2、Code::Blocks简介3、Code::Blocks安装3.1 下载3.2 安装3.3 汉化&#xff08;可选项&#xff09;4、Code::Blocks使用4.1 基本界面一览4.2 单个小工程5、Code::Blocks使用感受1、猿如意介绍 猿如意官网客户端下载地址 正如官网页面介绍猿如意的功能和作…

Allegro如何创建Group操作指导

Allegro如何创建Group操作指导 Allegro支持把器件,过孔和走线等等做成一个Group,对于PCB设计也很大帮助,如何创建一个group,具体操作如下 以下面图片为例 选择edit-groups Options选项里输出任意一个Group的名字 之后会出现一个Create Group弹窗,选择是 之后find选择…

年终将近,如何快速处理销售数据分析

编者按&#xff1a;如何做好企业销售数据分析&#xff0c;基于低代码平台实现的智能销售系统&#xff0c;以四大数据引擎为支撑&#xff0c;助力企业数据管理。 关键词&#xff1a;低代码平台&#xff0c;企业域管理&#xff0c;数据视图&#xff0c;智能报表&#xff0c;数据…

FFmpeg音视频编解码详解

本文你可以了解到 如何在 NDK 层调用 OpenGL ES &#xff0c;以及使用 OpenGL ES 来渲染 FFmpeg 解码出来的视频数据。 一、渲染流程介绍 在 Java 层&#xff0c;Android 已经为我们提供了 GLSurfaceView 用于 OpenGL ES 的渲染&#xff0c;我们不必关心 OpenGL ES 中关于 EGL…

开发游戏相关业务该如何选择云服务器及相关产品?

游戏开发分为两种&#xff0c;第一种就是角色扮演类&#xff0c;另一种就是休闲类游戏&#xff0c;角色扮演类游戏对于计算能力以及游戏安全有很大的尤其&#xff1b;而休闲类游戏对于资源、运维、成本控制有所要求&#xff0c;下面就给大家展示一下腾讯云官方给出的解决方案&a…

如何去做一个完整的网站 SEO 优化方案?

想要做好网站优化&#xff0c;就必须制定一套适合自己的网站优化方案。优化只是一个过程&#xff0c;更多的是简单工作的重复&#xff0c;但也有技巧和方法。这个时候&#xff0c;你的网站优化方案就显得尤为重要。为您指明今后优化工作的途径&#xff0c;您在上一篇文章《传:东…

网络小白入门之路之以太网链路聚合 ---尚文网络奎哥

随着业务的发展和园区网络规模的不断扩大&#xff0c;用户对于网络的带宽、可靠性要求越来越高。传统解决方案通过升级设备方式提高网络带宽&#xff0c;同时通过部署冗余链路并辅以STP&#xff08;Spanning Tree Protocol&#xff0c;生成树协议&#xff09;协议实现高可靠。传…

使用Idea中Docker插件部署并远程Debug

目前在java开发中&#xff0c;由于一套完整的项目所涉及到的微服务模块很多&#xff0c;要是按照传统的方式一个一个部署比较麻烦&#xff0c;所以很多情况下我们都会使用docker镜像的方式进行部署。当我们的应用部署好之后&#xff0c;若运行过程中出现问题&#xff0c;我们也…

docker搭建服务监控 prometheus+node_export+grafana

文章目录下载镜像node-exporter 收集数据prometheus监控搭建grafana数据可视化下载镜像 docker pull grafana/grafana docker pull prom/node-exporter docker pull prom/prometheus链接&#xff1a;点击 提取码&#xff1a;yyds node-exporter 收集数据 docker run -d -p 9…

Android:为了突破瓶颈,你总得新学点什么吧?

一眨眼就到了12月份了&#xff0c;在这拥有“35岁魔咒”IT场上工作多年的你&#xff0c;是否遇到了发展瓶颈&#xff1f;想突破瓶颈有时需要一个机遇&#xff0c;但这个合适的机会很难遇到。这时候&#xff0c;或许你可以思考&#xff0c;自己是否还有改变的空间&#xff1f;如…

不会开赛车的管理者不是好的开发人

今天要讲述的人物&#xff0c;身上的标签比较多元。 他是微软 RD&#xff08; Regional Director &#xff09;兼微软 MVP&#xff1b;在制造业领域深耕十多年&#xff0c;擅长在不同的角色用不同观点看待软件开发流程&#xff0c;热爱探索商业需求和解决方案之间的平衡&#…

目标检测中的不均衡问题综述

导推荐的&#xff0c;简单看了一下&#xff0c;&#xff08;太菜&#xff0c;太多不懂&#xff0c;希望以后会懂&#xff0c;简单做个记录 其实做的是xmind&#xff0c;但是想放到csdn上只能导出成md了。 Imbalance Problems in Object Detection: A Review 类别不平衡 简单…

01GO入门

GO入门一、hello&#xff0c;world二、运行一、hello&#xff0c;world 对上图的说明 1.go文件的后缀是.go 2.package main ​ 表示该hello.go 文件所在的包是main&#xff0c;在go中每个文件都必须归属于一个包。 3.import“fmt” ​ 表示&#xff1a;引入一个包&#xf…