CHARLS 是一项具备中国大陆 45 岁及以上人群代表性的追踪调查,旨在建设一个高质量的公共微观数据库,采集的信息涵盖社会经济状况和健康状况等多维度的信息,以满足老龄科学研究的需要。
为利用国际上最佳的数据采集方式,并确保研究结果的国际可比性CHARLS 参照包括美国的健康与退休研究(HRS)在内的系列国际老龄调查研究开展调查设计。其全国基线调查于 2011-12 年进行,于 2013 年、2015 年、2018 年和 2020 年分别开展了 4 轮常规问卷的追踪调查,并于 2014 年完成了中国中老年人生命历程调查。为确保样本的代表性,CHARLS 基线调查覆盖了全国 150 个国家/地区、450 个村庄/城市社区,涉及 10,257户家庭的 17,708 人,反映了中国中老年人群的总体情况。2019 年底到 2020 年初,新冠疫情在中国爆发,为及时记录新冠疫情对中国中老年人生活和健康的影响,在 2020 年的第 5 轮调查中增加采集了疫情相关的信息。
在上一篇文章《CHARLS数据库系列教程(3)—绘制(加权和不加权)基线表一》中,咱们以文章《Association Between Triglyceride Glucose Index and Risk of New-Onset Diabetes Among Chinese Adults: Findings From the China Health and Retirement Longitudinal Study》为例子,介绍了咱们绘制加权和不加权的基线表格,今天咱们继续介绍文章的核心表格就是文章的表三的制作,以及文章中限制立方样条图的绘制。加权和不加权都会介绍一遍,取舍看自己的。
首先咱们导入好咱们整理的数据,不会的看前几张有详细的介绍。
setwd(“E:/公众号文章2024年/charls数据库/class4”) #设置你放数据文件的地址
library(haven)
library(tidyverse)
library(scitb)
library(survival)
bc<-read.csv("data.final.csv",sep=',',header=TRUE)
dput(names(bc))
这个数据我就不详细介绍了,可以看上一章,或者看文章《Association Between Triglyceride Glucose Index and Risk of New-Onset Diabetes Among Chinese Adults: Findings From the China Health and Retirement Longitudinal Study》的基线表,有详细的介绍。
分类变量转成因子
#分类变量转成因子
bc$sex<-as.factor(bc$sex)
bc$edu<-as.factor(bc$edu)
bc$smoking<-as.factor(bc$smoking)
bc$married<-as.factor(bc$married)
全部文章内容请看下面这篇文章:
CHARLS数据库系列教程(4)–多模型效应分析、Per SD、P for trend及限制立方样条图绘制