R语言数据可视化分析案例:探索BRFSS数据

news2025/1/12 8:45:20

最近我们被客户要求撰写关于BRFSS数据的研究报告,包括一些图形和统计输出。

 加载包 


library(tidyr)
library(knitr)
opts_chunk$set(echo = TRUE, fig.align = "center")

载入资料

load("brfss2013.RData")

第1部分:数据

描述如何收集样本中的观测值,以及此数据收集方法对推断范围(可概括性/因果关系)的影响。CDC - BRFSS,以及下面的“有关数据的更多信息”部分。

“ BRFSS是一项横断面电话调查,州卫生部门每月通过座机和电话进行调查,并获得标准化问卷和CDC的技术和方法支持。在进行BRFSS座机电话调查时,访问员从一个家庭中随机选择的成年人那里收集数据。在进行BRFSS问卷的电话版本时,访问员从成年人中收集数据。”

推论范围(普遍性/因果关系):

普遍性:调查数据是从50个州和美国领土收集的,这使得数据看起来足够随机样本,从而可以将其推广到整个美国人口。

因果关系:由于所有参与者均未接受指定的治疗和对照组的治疗-无法假设因果关系-只能测量相关性。

方法论,偏见和需要改进的方面的问题:通过电话调查,有可能低估了几种类型的个人:

1.没有座机或手机的个人

2.拒绝回答或参加电话调查的个人。

3.在进行调查时无法通过电话联系/无法联系到调查的个人。

采访问题的答案尚未通过验证,这意味着受访者可以通过以下方式修改其回答:

1.过度报告理想的行为和/或特征。

2.漏报不良行为。

3.夸大或歪曲某些特征,例如身高,学历或收入。

4.错误地提供关键信息。

5.参与的机构之间的面试做法和问题集可能不一致。

供以后参考,如果数据集包含有关每个访谈的详细信息,例如收集数据的时间和访谈的持续时间,将很有用。

第2部分:研究问题

研究问题1:体重指数(BMI)是否与受访者自己的健康看法相关?

这个问题探讨了BMI“正常”的人是否对自己的健康状况有更好的认识。虽然BMI并不是完美的健康指标,但仍被公认为健康的初始指标。

使用的总变量:2

genhlth-一般健康

X_bmi5cat-将BMI分为4类(体重过轻,正常,超重,肥胖)的计算变量

————-

研究问题2:一个人的夜间睡眠时间与他们的能量水平之间是否存在相关性?性别之间有区别吗?

这是一个有趣的问题,因为经常吹嘘睡眠是维持良好总体健康的重要组成部分。研究表明,那些睡眠时间少于5小时的人甚至更容易患慢性或严重疾病。

使用的总变量:3

sleptim1-报告的睡眠时间

qlhlth2-在过去30天中,有几天被报告为“全力以赴”

性别-报告的生物性别

————-

研究问题3:总体生活满意度与受教育程度之间是否存在相关性?性别之间有什么区别吗?

这个问题将试图看看总体生活满意度和个人受教育程度之间是否存在任何关联。一些研究表明,与受教育程度较低的人相比,受教育程度较高的人较少出现婚姻问题,并且可能享有更好的健康状况。它将进一步探讨男性和女性之间是否存在任何差异。

使用的总变量:3

满意-整体生活满意度

教育-教育水平

性别-个人的生物性别

第3部分:探索性数据分析

研究问题1:体重指数(BMI)是否与受访者自身健康的看法相关?

load("brfss2013.RData")
dim(brfss2013)
## [1] 491775    330

 
q1 <- select(brfss2013,genhlth,X_bmi5cat) %>% na.omit()
dim(q1)
 
## [1] 463275      2

拥有460,000多个观察值,通过表格进行观察更容易,如下所示:

prop.table(table(q1$genhlth,q1$X_bmi5cat),2)
##            
##             Underweight Normal weight Overweight      Obese
##   Excellent  0.19987805    0.26019496 0.17373887 0.07933813
##   Very good  0.26402439    0.35069868 0.35401238 0.26824837
##   Good       0.26146341    0.24667514 0.30698451 0.37088006
##   Fair       0.15829268    0.09751640 0.11943759 0.19913468
##   Poor       0.11634146    0.04491484 0.04582665 0.08239876

 表中 有大量的数据。 

g1 <- ggplot(q1) + aes(x=X_bmi5cat,fill=genhlth) + geom_bar(position = "fill")
g1

每列代表4种BMI类别(体重过轻,正常,超重,肥胖)和描述自己健康状况的受访者比例。

可以得出结论,在一定程度上,对这一问题的回答是“是”。个体的BMI与他或她自己对健康的看法之间似乎存在关联。

 研究问题2:一个人的夜间睡眠时间与他们的能量水平之间是否存在相关性?性别之间有区别吗?

##     qlhlth2          sex         sleptim1     
##  Min.   : 0.00   Male  :162   Min.   : 2.000  
##  1st Qu.: 2.00   Female:287   1st Qu.: 6.000  
##  Median :15.00                Median : 7.000  
##  Mean   :15.56                Mean   : 7.013  
##  3rd Qu.:28.00                3rd Qu.: 8.000  
##  Max.   :30.00                Max.   :12.000
## Warning: Removed 12 rows containing non-finite values (stat_smooth).
## Warning: Removed 12 rows containing missing values (geom_point).

睡眠时间和充满能量的天数之间似乎总体上呈正相关。女性的相关性似乎比男性略强,因为男性的数据分布更广泛。

++++++++++++++++++++++++

研究问题3:总体生活满意度与受教育程度之间是否存在相关性?性别之间有什么区别吗?

## # A tibble: 4 x 2
##   lsatisfy          count
##   <fct>             <int>
## 1 Very satisfied     5378
## 2 Satisfied          5506
## 3 Dissatisfied        598
## 4 Very dissatisfied   161
q3 %>% group_by(educa) %>%   summarise(count=n())
## # A tibble: 6 x 2
##   educa                                                        count
##   <fct>                                                        <int>
## 1 Never attended school or only kindergarten                      10
## 2 Grades 1 through 8 (Elementary)                                496
## 3 Grades 9 though 11 (Some high school)                         1078
## 4 Grade 12 or GED (High school graduate)                        3708
## 5 College 1 year to 3 years (Some college or technical school)  3055
## 6 College 4 years or more (College graduate)                    3296
q3 %>% group_by(sex) %>%   summarise(count=n())
## # A tibble: 2 x 2
##   sex    count
##   <fct>  <int>
## 1 Male    4078
## 2 Female  7565

男性和女性的教育水平和总体生活满意度之间似乎总体上呈正相关。至少完成了高中(或同等学历)的人的满意度似乎更高。数据中还存在某些异常值,其中一些反馈者在没有受过教育的情况下会“满意”或“非常满意”。由于大多数人口至少已从高中毕业,因此该数据似乎准确地代表了受访者的分布。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/76244.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring Boot ActuatorAdmin

Spring Boot Actuator&Admin 指标监控简介 干嘛的&#xff1a; 主要运用在微服务架构&#xff0c;所以我建议你先学微服务&#xff0c;否则可能get不到它的用处&#xff0c;只有大型的分布式系统才会用到指标监控… Why&#xff1a;&#xff1f; 对于一个大型的几十个、…

低代码如何自定义主题?一文教会你

SuccAP低代码开发平台&#xff0c;除了提供了多主题供选择外&#xff0c;还支持自定义报表主题&#xff0c;当系统自带的主题无法满足项目需求时&#xff0c;可以根据项目设计并新增主题&#xff0c;本文将介绍如何去新增自定义主题。 新增自定义主题可按如下步骤操作&#xf…

APS高级计划排程在乳制品行业的应用

目前乳制品行业供应链管理中存在的主要问题 生产盲目性&#xff0c;应对市场变化能力不足。现如今牛奶已经成为人们日常饮食需求的必需品&#xff0c;很多生产厂家就开始大量的生产&#xff0c;全然不顾市场的需求度&#xff0c;应对市场变化的能力不足&#xff0c;导致了有一…

计算机毕业设计ssm+vue基本微信小程序的心理服务平台 uniapp 小程序

项目介绍 随着计算机技术的发展,带来社会各行业的进步,信息化逐渐运用到人们的生活中。传统模式的青少年心理健康管理满足不了现代人的生活追求,服务质量、服务速度,之前的很多网站由于功能、或者框架设计等原因,无法完美的展现它的特色,优势,浪费了很多资源。使用管理系统进行…

今天步行数5000多

今天步行数量比较多的&#xff0c;有五千多步吧&#xff0c;希望明天能继续保持下去。

企业知识分享系统的设计与实现

摘 要 随着信息技术和网络技术的飞速发展&#xff0c;人类已进入全新信息化时代&#xff0c;传统管理技术已无法高效&#xff0c;便捷地管理信息。为了迎合时代需求&#xff0c;优化管理效率&#xff0c;各种各样的管理系统应运而生&#xff0c;各行各业相继进入信息管理时代&…

两种方案解决vscode浏览器跨域问题

一、 问题 1.1 在接收 json 数据的时候出现了以下错误&#xff1b; 打开测试用的 json 文件发现数据并没有问题&#xff0c;而第一个报错可以看到 Cross origin requests are only supported for protocol schemes&#xff1a;… &#xff0c;也就是说所使用的数据不在跨域的许…

毕业后5年,我终于变成了月薪13000的软件测试工程师

目录 我为什么选择转行 工作环境 我选择了转行软件测试 写在最后 《软件测试工程师发展规划路线》 一、测试基础 了解测试的基础技能&#xff0c;掌握主流缺陷管理工具的使用&#xff0c;熟练测试环境的操作与运维 二、Linux必备知识 Linux作为现在最流行的软件环境系…

场景案例│数字员工助力医疗行业打通信息系统壁垒,实现高效率运营

据埃森哲研究预测&#xff0c;到2026年人工智能技术每年将为医疗保健行业节省1500亿美元。 随着人们对数字化的需求日益增长&#xff0c;数字技术成为转型升级的新兴力量&#xff0c;许多医疗机构积极采用数字员工推进数字化转型的步伐。 在数字员工的支持下&#xff0c;医疗…

Redis Replication

高可用架构-Redis Replication 今天学习下如何基于Redis 复制功能构建高可用架构-主从复制&#xff0c;Redis Replication 支持数据复制和故障切换。Redis复制是允许Redis实例完全复制主实例的过程。默认情况下&#xff0c;复制是一个异步过程。Redis复制在主机端和副本端都是…

2023最新SSM计算机毕业设计选题大全(附源码+LW)之java毕业设计选题档案管理系统bvr3c

毕业设计其实不难&#xff0c;主要毕业的时候任务太紧了&#xff0c;所以大家都非常忙没有时间去做&#xff0c;毕业设计还是早做准备比较好&#xff0c;多花点时间也可以做出来的&#xff0c;建议还是自己动手去做&#xff0c;比如先选一个题&#xff0c;这样就有方向&#xf…

Flutter实现文件上传华为对象存储(OBS)

本文主要讲述在 Flutter 项目中如何实现将文件上传到华为 OBS&#xff08;对象存储&#xff09;中&#xff0c;并封装为三方库方便灵活使用。 背景介绍 在大多项目中都会存在文件上传的需求&#xff0c;之前的实现都是调用后台的文件上传接口将文件上传到服务器上&#xff0c;…

从投资人发现“新大陆”,看“产融星城”为何成?

文丨熔财经 作者|陈小江 “我从来不把《我要投资》节目看作是秀&#xff08;综艺&#xff09;&#xff0c;要知道《我要投资》是在前面的&#xff0c;秀&#xff08;综艺&#xff09;只是一种形式而已。本质上&#xff0c;&#xff08;参加节目&#xff09;还是为了投资”。 …

「Redis数据结构」跳跃表(SkipList)

「Redis数据结构」跳跃表&#xff08;SkipList&#xff09; 文章目录「Redis数据结构」跳跃表&#xff08;SkipList&#xff09;一、概述二、结构跳跃表节点跳跃表三、特点一、概述 跳表&#xff08;SkipList&#xff0c;全称跳跃表&#xff09;是用于有序元素序列快速搜索查找…

shell编程二

目录语法引号exprtestif...then...fiif...elseif...elseif嵌套case…esacforwhilebreak 和 continue函数语法 引号 " ":如果有字符串&#xff0c;字符串原样输出&#xff0c;如果有$变量则查看变量的值 :所有的字符无论是否有变量都原样输出 ˋˋ:在该引号包含的…

如何批量查询网站的搜狗收录情况?搜狗收录么查询

如何批量查询网站的搜狗收录情况&#xff1f;搜狗收录么查询 查询网站的搜狗收录的具体操作&#xff1a; 第一步、打开网站综合查询工具 第二步、添加需要查询的网站域名 第三步、勾选要查询的功能&#xff08;勾选搜狗是否收录和搜狗总收录&#xff09; 第…

redis 主从复制(读写分离)集群搭建(含错误处理)

目录 1.概述 2.搭建 2.1.安装配置 2.2.认主 2.3.错误处理 3.原理 1.概述 当面临大流量时&#xff0c;redis可以采取集群的方式进行扩容&#xff0c;将压力分散到集群中的多个结点上去防止redis被打挂。redis的扩容方式有两种&#xff1a; 垂直扩容&#xff0c;即读写分离…

【移动端测试】了解Android的配置和使用过程

Android 是基于JAVA语言来进行开发编写的&#xff0c;但是对于Android体系中最底层是Linux层&#xff0c;现在说一下android 项目的结构目录: 整体结构和一个普通的java项目很类似 每一个项目都有一个主Activity 相当于java类中的main 方法是程序的入口 比如 该项目中的ListVi…

centos7搭建nginx主从以及集群

一、nginx升级之路 之前因为业务量并不是很大&#xff0c;所以公司nginx采用的是单机。因为nginx单机性能也很好&#xff0c;所以也没有发生过什么问题。不过后来还是慢慢进行了几次调整。最终换成了多IP地址解析和nginx主从。下面就介绍一下怎么一步步升级的。 1.最初版本&a…

天翼物联携手6家单位发起移动物联网高质量发展共同倡议

近日&#xff0c;由工信部指导&#xff0c;中国信息通信研究院&#xff08;以下简称“中国信通院”&#xff09;、中国通信学会、无锡市人民政府、人民邮电报社、江苏省工业和信息化厅、江苏省通信管理局共同主办&#xff0c;无锡物联网创新促进中心、天翼物联科技有限公司等单…