R语言探索BRFSS数据可视化

news2024/12/26 3:00:18

设定

加载包

最近我们被客户要求撰写关于BRFSS数据的研究报告,包括一些图形和统计输出。在本实验中,我们将使用dplyr软件包探索数据,并使用ggplot2软件包对其进行可视化以进行数据可视化

library(ggplot2)
library(dplyr)

载入资料

load("brfss2013.RData")
dim(brfss2013)
## [1] 491775    330

我们可以看到数据集的维度。我们的数据集包含491775个观测值(行)和330个变量(列)


第1部分:数据

关于BRFSS

行为风险因素监视系统(BRFSS)是每年对美国超过40万人进行的电话调查。该系统收集有关美国居民与健康相关的危险行为,长期健康状况,以及使用预防服务。顾名思义,BRFSS旨在识别成年人口中的危险因素并报告新出现的健康趋势。 

数据收集方法

通过与家庭居民进行电话采访,从美国各州,哥伦比亚特区和参与的美国领土收集了数据。2011年进行了超过50万次此类采访,使用随机抽样收集了电话采访和手机访问的样本,从一个州根据密度按分层抽样方法获得了电话样本,而手机样本则是从一个随机抽样中抽取的。  

为了保持各州之间的一致性,BRFSS遵循标准的数据收集协议,其中包括对符合条件的家庭进行随机抽样,构建调查表,进行手机采访,维护程序以保护受访者的机密性并确保采访过程的质量。一个月的样本电话采访在同一个月内进行。 

关于数据收集对推断范围的影响的评论

BRFSS的调查涵盖了50个州和美国领土,其中包括对随机收集的家庭数据进行的超过500,000次电话采访,这些数据仅是随机样本,并且在数据收集中建立了严格的程序以确保代表性人口样本。 

由于这是一项观察性研究,而不是具有随机控制的踪迹和目标样品的随机分配的实验性研究,因此无法推断变量之间的因果关系。


第2部分:研究问题

研究问题1:

身心健康与睡眠之间有关联吗? 

这个问题涉及对人的健全健康影响睡眠的年龄 的问题。 这将是从该数据集中探索的有趣相关性。正在考虑的变量有:

  • physhlth:天数身体健康不好
  • menthlth:心理健康的天数不好
  • sleptim1:您睡多少时间
  • 性别:受访者性别

研究问题2:

收入水平和就业状况是否会改善健康状况?

 因为收入水平和就业状况对个人的自我价值和心理状态具有巨大影响。金融不安全会给个人造成巨大的精神伤害,因此我们希望这些人具有不利的健康状况。

考虑的变量有:

  • genhlth:一般健康
  • 受雇1:就业状况
  • 收入2:收入水平

研究问题3:

肥胖(高BMI​​)会加剧心脏病发作和高胆固醇水平的风险吗?

这个问题试图回答肥胖对加重心脏病发作健康风险的影响。心脏骤停是影响所有背景人群的最常见疾病之一。我们将尝试寻找高胆固醇水平,BMI升高与心脏病风险之间的关系。

正在考虑的变量有:

  • _bmi5cat:计算体重指数类别
  • tellhi2:高胆固醇血症
  • cvdinfr4:曾经被诊断出患有心脏病

第3部分:探索性数据分析

研究问题1:

V1<-brfss2013%>%
  filter(!is.na(physhlth),!is.na(sleptim1),!is.na(menthlth),!is.na(sex))%>%
  select(physhlth,sleptim1,menthlth,sex)

我们创建了一个新的数据框V1,其中包含4个连续变量。在删除了包含NA输入的行之后,我们对数据进行了分类。

ggplot(data=V1,aes(x=sleptim1,y=physhlth,color=sex))+
  geom_point()+scale_fill_manual(values =c("red","seagreen3"))

研究问题2:

清理目标变量的数据集并将结果存储在新的V2中

研究问题3:

新的变量V3存储由3个目标变量组成的数据帧。

count(V3,cvdinfr4)
## # A tibble: 2 x 2
##   cvdinfr4      n
##     <fctr>  <int>
## 1      Yes  26935
## 2       No 370021
ggplot(data=V3,aes(x=cvdinfr4,fill=X_bmi5cat))+
  geom_bar()

 超重和肥胖的人似乎最容易受到心脏病的影响。

高胆固醇血症最严重的原因是超重或肥胖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/75846.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

初识Netty框架

总体概述 Netty作为一款网络通信框架&#xff0c;底层封装了NIO。我们在使用Netty时&#xff0c;无需再关注NIO细节。下图为Netty处理流程图&#xff1a; 应用程序中使用Netty作为网络通信框架后&#xff0c;会形成一条PipeLine链&#xff0c;PipeLine链上有一个一个的事件处…

buuctf10(异或注入中文字符绕过preg_match伪随机数漏洞seed)

目录 [WUSTCTF2020] 颜值成绩(异或注入) [Zer0pts2020]Can you guess it?(中文字符绕过preg_match) [FBCTF2019]RCEService(/bin/调用命令 || 回溯绕过preg_match) [GKCTF 2021]easycms(后台弱口令&任意文件下载) [GWCTF 2019]枯燥的抽奖(伪随机数漏洞seed) [MRCTF20…

msprofiler 性能调优命令行实战(口罩识别推理)

案例介绍 本案例使用口罩识别推理程序作为例子进行演示&#xff0c;硬件平台是华为昇腾310设备(Ascend 310)&#xff0c;该口罩识别使用目标检测中SSD模型&#xff0c;检测的结果有两个类别&#xff1a;戴口罩的脸、没带口罩的脸。成功执行推理程序后我们对其进行了推理调优&a…

连续7年领跑!在华为云桌面,藏了一盘数字办公的大棋

作者 | 曾响铃 文 | 响铃说 连续7年领跑&#xff01;在国内虚拟客户端计算软件市场&#xff0c;华为云再度占据行业第一的位置&#xff0c;力压Citrix、Microsoft和VMware等全球知名厂商。 所谓的虚拟客户端计算软件市场&#xff0c;简单来理解就是云桌面市场。伴随着数字办…

Oracle报错:ORA-28001:口令已失效

一、链接Oracle报错 &#xff1a;ORA-28001&#xff1a;口令已失效 解决办法 原因&#xff1a;Oracle11G创建用户时缺省密码过期限制是180天&#xff08;即6个月&#xff09;&#xff0c; 如果超过180天用户密码未做修改则该用户无法登录 解决方式&#xff1a; 方式一&#xf…

R语言可视化探索BRFSS数据并逻辑回归Logistic回归预测中风

第1部分&#xff1a;关于数据 行为风险因素监视系统&#xff08;BRFSS&#xff09;是美国的年度电话调查。最近我们被客户要求撰写关于BRFSS的研究报告&#xff0c;包括一些图形和统计输出。BRFSS旨在识别成年人口中的危险因素并报告新兴趋势。例如&#xff0c;询问受访者饮食…

Python 并发编程

一.Python 对并发编程的支持 多线程&#xff1a;threading&#xff0c;利用CPU和IO可同时执行的原理&#xff0c;让CPU不会干巴巴等待IO完成&#xff0c;而是切换到其他Task&#xff08;任务&#xff09;&#xff0c;进行多线程的执行。多进程&#xff1a;multiprocessing&…

微前端总结

微前端概述 微前端概念是从微服务概念扩展而来的&#xff0c;摒弃大型单体方式&#xff0c;将前端整体分解为小而简单的块&#xff0c;这些块可以独立开发、测试和部署&#xff0c;同时仍然聚合为一个产品出现在客户面前。可以理解微前端是一种将多个可独立交付的小型前端应用…

使用极限学习机进行股市预测(Matlab代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f389;3 参考文献 &#x1f468;‍&#x1f4bb;4 Matlab代码 &#x1f4a5;1 概述 极限学习机&#xff08;Extreme Learning Machine,ELM&#xff09;作为前馈神经网络学习中一种全新的训练框架,在行为识别、情…

EPICS -- 使用asynPortDriver类编写示一个示例程序

本示例展示了如何使用asynPortDriver类编写一个EPICS端口驱动程序的示例。 这个驱动程序参数库中一个有5个参数&#xff0c;分别支持5个EPICS记录。 如下是具体步骤&#xff1a; 1&#xff09; 用makeBaseApp.pl脚本建立这个IOC应用程序的框架&#xff1a; [blctrlmain-mach…

IDEA中如何实现git的cherry-pick可视化操作?

目录 问题现象&#xff1a; 问题分析&#xff1a; 解决方法&#xff1a; 拓展&#xff1a;如何回退提交记录&#xff1f; 问题现象&#xff1a; 今天在学习了git的cherry-pick功能&#xff0c;于是引出了一个问题&#xff1a; IDEA中如何实现git的cherry-pick可视化操作&am…

【Docker学习教程系列】7-如何将本地的Docker镜像发布到阿里云

在上一篇中&#xff0c;我们使用docker commit 命令&#xff0c;创建了一个带有vim的Ubuntu镜像。那么怎么将这个镜像分享出去呢&#xff1f;本文就来讲解如何将本地的docker镜像发布到阿里云上。 本文主要内容&#xff1a; 1&#xff1a;本地镜像发布到阿里云流程 2&#xf…

Linux网络原理与编程(4)——第十四节 传输层协议

目录 前置知识 再谈端口号 几个函数 netstat telnet UDP报文 UDP协议端格式 UDP首部&#xff1a; UDP的特点 UDP的缓冲区 TCP报文详解 Tcp报头详解 传输层是在应用层的下面一层&#xff0c;我们在讲解传输层协议之前&#xff0c;先来说一说一些前置知识即命令函数等…

看完就会flink基础API

文章目录一、执行环境&#xff08;Execution Environment&#xff09;1、创建执行环境2、执行模式(Execution Mode)3、触发程序执行二、源算子&#xff08;Source&#xff09;1、数据源类准备2、从集合中读取数据3、从文件中读取数据4、从Socket中读取数据5、从Kafka中读取数据…

ISCSLP 2022 Program|希尔贝壳邀您参加第十三届中文口语语言处理国际会议

第十三届中文口语语言处理国际会议将于2022年12月11-14日&#xff08;本周日~下周三&#xff09;正式开启&#xff0c;本次会议中的部分Session将通过语音之家视频号进行线上直播&#xff0c;欢迎大家参加&#xff01; 官网&#xff1a;www.iscslp2022.org 大会简介 中文口语…

ABAP学习笔记之——第十二章:SALV

一、概要 在Net Weaver 2004 平台上集合了利用函数和 GRID 的功能发布的 SALV 包程序 (SALV也称为 New ALV)。SALV 可以像利用函数生成 ALV 的不用创建屏幕就可以调用的全屏式ALV&#xff0c;还可以利用控制器在屏幕的控制器中显示 ALV。利用GRID 的ALV 虽然不能注册成 Batch …

速卖通知识产权规则介绍,如何才能规避侵权的问题?

最近有商家咨询到我&#xff0c;关于速卖通对商品知识产权是怎么评判的&#xff0c;今天就来给大家科普一下平台关于知识产权的规则介绍 速卖通平台严禁用户未经授权发布、销售涉嫌侵犯第三方知识产权的商品或发布涉嫌侵犯第三方知识产权的信息。 若卖家发布涉嫌侵犯第三方知…

从股票市场选择配对的股票:距离计算方法

我们来看看如何定义距离的计算方法。 回想一下&#xff0c;在共同趋势模型中&#xff0c;协整的必要条件是从共同趋势得到的新息序列必须完全相关。APT中的共同因子回报就理解成是从共同趋势得到的新息序列&#xff0c;因此&#xff0c;新息序列之间的相关系数就是共同因子回报…

网关性能大PK,Spring Cloud Gateway让人大失所望

现在的架构基本都是使用微服务的&#xff0c;而网关作为微服务的统一门户在架构模式中用得越来越多&#xff0c;API网关是所有客户端的单一入口点。 API网关模式是微服务体系结构的一个很好的起点&#xff0c;因为它能够将特定的请求路由到我们从整体上分离的不同服务。事实上…

嘿嘿嘿,10个我经常逛的“小网站”,不骗人

反思一下&#xff0c;为什么你会点进来~ 咳咳&#xff0c;步入正题。 工欲善其事必先利其器&#xff0c;你们的收藏夹里收藏了多少“小网站”&#xff1f;今天和大家分享10个我压箱底的效率工具/平台&#xff0c;现在用不上不要紧&#xff0c;赶紧收藏最关键&#xff01; 1.G…