R包compareGroups详细用法

news2024/9/21 0:36:44

compareGroups

compareGroups 是一个功能强大的 R 包,专为数据质量控制、数据探索和生成用于出版的单变量或双变量表格而设计。它能够创建各种格式的报表,如纯文本、HTML、LaTeX、PDF、Word 或 Excel 格式,并显示统计数据(均值、中位数、频率、发生率等)。此外,它还能生成可视化图表(如箱线图、条形图、正态分布图等),帮助快速理解数据分布。根据变量的性质(正态、非正态或定性变量),compareGroups 可以自动选择合适的统计检验(如t检验、方差分析、Kruskal-Wallis检验、Fisher检验、log-rank检验等)。它还支持基因数据的总结与分析,显示单核苷酸多态性(SNPs)的等位基因频率,并进行哈迪-温伯格平衡检验等常见的基因统计分析。

1、cGroupsGUI–基于tcltk工具的图形用户界面

描述

该函数允许用户通过图形界面以简单直观的方式构建表格,并修改多个选项。

用法

cGroupsGUI(X) 
  1. X: 一个矩阵或 data.frame。X 必须存在于 .GlobalEnv 中。

注意

如果通过 X 参数传递了 data.frame 或矩阵,或通过 ‘加载数据’ GUI 菜单加载该对象,此对象将被放置在 .GlobalEnv 中。当 GUI 界面打开时,操作此 data.frame 或矩阵可能会导致 GUI 操作执行时出错。

示例

data(regicor)
cGroupsGUI(regicor)

2、cGroupsWUI–基于 Shiny 工具的 Web 用户界面

描述

该函数使用基于 shiny 包的图形界面,在 Web 浏览器中打开界面。

用法

cGroupsWUI(port = 8102L)  
  1. port: 整数类型,与 runAppport 参数相同。默认值为 8102L。如果启动 Web 浏览器时发生错误,可以通过更改端口号来解决。

示例

require(compareGroups)
cGroupsWUI()

3、compareGroups–按组描述性统计

描述

该函数执行按组的描述性统计,适用于多个变量。根据这些变量的性质,计算不同的描述性统计(均值,中位数,频率或 K-M 概率),并根据需要进行不同的统计检验(t 检验,ANOVA,Kruskal-Wallis,Fisher,log-rank 等)。

用法

compareGroups(formula, 
              data, 
              subset, 
              na.action = NULL, 
              y = NULL, 
              Xext = NULL, 
              selec = NA, 
              method = 1, 
              timemax = NA, 
              alpha = 0.05, 
              min.dis = 5, 
              max.ylev = 5, 
              max.xlev = 10, 
              include.label = TRUE, 
              Q1 = 0.25, 
              Q3 = 0.75, 
              simplify = TRUE, 
              ref = 1, 
              ref.no = NA, 
              fact.ratio = 1, 
              ref.y = 1, 
              p.corrected = TRUE, 
              compute.ratio = TRUE, 
              include.miss = FALSE, 
              oddsratio.method = "midp", 
              chisq.test.perm = FALSE, 
              byrow = FALSE, 
              chisq.test.B = 2000, 
              chisq.test.seed = NULL, 
              Date.format = "d-mon-Y", 
              var.equal = TRUE, 
              conf.level = 0.95, 
              surv=FALSE, 
              riskratio = FALSE, 
              riskratio.method = "wald", 
              compute.prop = FALSE, 
              lab.missing = "'Missing'", 
              p.trend.method = "spearman")
  1. formula: 一个"公式"类的对象(或可以被转换为该类的对象)。~ 的右侧必须以加法方式包含项,左侧必须包含分组变量的名称。如果留空,则计算整个样本的描述性统计,而不进行测试。

  2. data: 一个可选的数据框、列表或环境(或可以被 as.data.frame 转换为数据框的对象),包含模型中的变量。如果在 data 中找不到这些变量,则从 environment(formula) 中提取。

  3. subset: 一个可选的向量,指定用于计算过程的个体子集。它应用于所有行变量。subsetselec 在每个行变量上以 & 的方式结合应用。

  4. na.action: 一个函数,指示当数据中包含缺失值时应采取的操作。默认值为 NULL,相当于 na.pass,这意味着不采取任何操作。na.exclude 对于希望在任何变量中移除所有缺失值的情况很有用。

  5. y: 一个向量变量,用于区分分组。它必须是数字、字符、因子或 NULL。默认值为 NULL,表示计算整个样本的描述性统计,而不进行测试。

  6. Xext: 一个数据框或矩阵,包含与 X 相同的行/个体,但可能具有不同的变量/列。此参数用于 compareGroups.default,以便在 Xext 和/或 .GlobalEnv 中搜索在 selec 参数中指定的变量。如果 Xext 为 NULL,则从 X 加上 y 的变量创建 Xext。默认值为 NULL。

  7. selec: 一个与行变量数量相同的列表。如果列表长度为 1,则对所有行变量进行回收。selec 的每个组件是一个表达式,将被评估以选择要分析的个体。否则,命名列表指定应用于 selec 行变量。如果没有定义 .else 变量,则对其余变量应用默认值。默认值为 NA;所有个体都会被分析(不进行子集)。

  8. method: 一个整数向量,具有与行变量数量相同的组件。如果其长度为 1,则对所有行变量进行回收。它仅适用于连续行变量(对于因子行变量,将被忽略)。可能的值是:

    • 1:强制分析为"正态分布";
    • 2:强制分析为"连续非正态";
    • 3:强制分析为"分类";
    • 4:NA,执行 Shapiro-Wilk 检验以决定正态或非正态。 否则,命名向量指定应用于 method 行变量。如果没有定义 .else 变量,则对其余变量应用默认值。默认值为 1。
  9. timemax: 一个双精度向量,具有与行变量数量相同的组件。如果其长度为 1,则对所有行变量进行回收。它仅适用于 Surv 类行变量(对于所有其他行变量,将被忽略)。该值指示在何时计算 K-M 概率。否则,命名向量指定应用于 timemax 行变量。如果没有定义 .else 变量,则对其余变量应用默认值。默认值为 NA;K-M 概率在观察到的时间的中位数时计算。

  10. alpha: 介于 0 和 1 之间的双精度值。Shapiro-Wilk 正态性检验的显著性阈值,适用于连续行变量。默认值为 0.05。

  11. min.dis: 一个整数。如果非因子行变量包含少于 min.dis 个不同值,并且 method 参数设置为 NA,则将其转换为因子。默认值为 5。

  12. max.ylev: 一个整数,表示分组变量(y)的最大水平数量。如果 y 包含超过 max.ylev 的水平,则函数 compareGroups 会产生错误。默认值为 5。

  13. max.xlev: 一个整数,表示行变量作为因子时的最大水平数量。如果行变量是因子(或转换为因子,例如字符),并且包含超过 max.xlev 的水平,则会从分析中移除该变量,并打印警告。默认值为 10。

  14. include.label: 逻辑值,指示结果中是否显示变量标签。默认值为 TRUE。

  15. Q1: 一个双精度值,介于 0 和 1 之间,指示要在双变量表中显示的第一个数字的分位数。要计算最小值,只需输入 0。默认值为 0.25,表示第一个四分位数。

  16. Q3: 一个双精度值,介于 0 和 1 之间,指示要在双变量表中显示的第二个数字的分位数。要计算最大值,只需输入 1。默认值为 0.75,表示第三个四分位数。

  17. simplify: 逻辑值,指示是否在分组变量和行变量中删除没有值的水平。默认值为 TRUE。

  18. ref: 一个整数向量,具有与行变量数量相同的组件。如果其长度为 1,则对所有行变量进行回收。它仅适用于分类行变量。或者,命名向量指定应用于 ref 的行变量(一个保留名称是 .else,定义其余变量的参考类别);如果没有定义 .else 变量,则对其余变量应用默认值。默认值为 1。

  19. ref.no: 一个字符,指定作为 Odds Ratio 或 Hazard Ratio 的参考水平的名称。此名称不区分大小写。特别适用于是/否变量。默认值为 NA,表示 ref 指定的类别作为参考。

  20. fact.ratio: 一个双精度向量,具有与行变量数量相同的组件,指示 HR/OR 的单位(注意这不影响描述性统计)。如果其长度为 1,则对所有行变量进行回收。否则,命名向量指定应用于 fact.ratio 的行变量。.else 是一个保留名称,定义其余变量的参考类别;如果没有定义 .else 变量,则对其余变量应用默认值。默认值为 1。

  21. ref.y: 一个整数,指示 y 变量的参考类别,用于计算 OR,当 y 是二元因子时。默认值为 1。

  22. p.corrected: 逻辑值,指示是否必须校正成对比较的 p 值。这仅适用于具有超过 2 个类别的分组变量。默认值为 TRUE。

  23. compute.ratio: 逻辑值,指示是否必须计算 Odds Ratio(对于二元响应)或 Hazard Ratio(对于时间事件响应)。默认值为 TRUE。

  24. include.miss: 逻辑值,指示是否将缺失值视为分类变量的新类别。默认值为 FALSE。

  25. oddsratio.method: 指定计算 Odds Ratio 的方法。参见 oddsratio 参数(来自 epitools 包)。默认值为 “midp”。

  26. byrow: 逻辑值或 NA。应按行(TRUE)、列(FALSE)还是按行和列总结为 1(NA)报告分类变量的百分比。默认值为 FALSE,表示按列报告百分比(在组内)。

  27. chisq.test.perm: 逻辑值。它应用排列卡方检验(chisq.test),而不是精确的 Fisher 检验(fisher.test)。这仅适用于某些单元的预期计数低于 5 的情况。

  28. chisq.test.B: 整数。在计算排列卡方检验时的次数。默认值为 2000。

  29. chisq.test.seed: 整数或 NULL。进行排列卡方检验的种子。默认值为 NULL,这表示不设置种子。必须输入与 NULL 不同的数字,以便在执行排列卡方检验时重现结果。

  30. date.format: 字符,指示日期的显示方式。默认值为 “d-mon-Y”。有关更多信息,请参见 chron。

  31. var.equal: 逻辑值,指示在比较均值时是否考虑相等方差,适用于正态分布变量的多个组。如果为 TRUE,则应用 anova 函数,否则应用 oneway.test。默认值为 TRUE。

  32. conf.level: 双精度值,表示均值、中位数、比例或发生率,以及危险、赔率和风险比的置信区间的置信水平。默认值为 0.95。

  33. surv: 逻辑值。计算生存(TRUE)还是发生率(FALSE),适用于时间事件行变量。默认值为 FALSE。

  34. riskratio: 逻辑值。计算 Odds Ratio(FALSE)还是风险比(TRUE)。默认值为 FALSE。

  35. riskratio.method: 指定计算 Odds Ratio 的方法。参见 riskratio 参数(来自 epitools 包)。默认值为 “wald”。

  36. compute.prop: 逻辑值。计算比例(TRUE)还是百分比(FALSE),适用于分类行变量。默认值为 FALSE。

  37. lab.missing: 字符。缺失类别的标签。仅在 include.missing = TRUE 时适用。默认值为 “Missing”。

  38. p.trend.method: 字符,指示用于趋势 p 值的测试名称。它仅适用于数值非正态变量。可能的值为 “spearman”、“kendall” 或 “cuzick”。默认值为 “spearman”。

详细信息

根据行变量被视为连续正态分布(1)、连续非正态分布(2)或分类变量(3),执行以下描述性统计和检验:

  1. 正态分布:计算均值、标准差,并进行 t 检验或 ANOVA。
  2. 非正态分布:计算中位数、第 1 和第 3 四分位数(默认),并进行 Kruskal-Wallis 检验。
  3. 分类变量:计算绝对频率和相对频率,并在某些单元格的期望频率小于 5 时进行卡方检验或精确 Fisher 检验。

此外,行变量可以是 Surv 类。此时,计算在固定时间(通过 timemax 参数设置)下的"事件"概率,并进行 logrank 检验。

当组数超过 2 时,还会执行成对比较,调整多重检验(当行变量为正态分布时使用 Tukey 方法,否则使用 Benjamini & Hochberg 方法),并计算趋势的 p 值。对于正态分布的行变量,趋势的 p 值通过 Pearson 检验计算;对于连续非正态分布的变量,使用 Spearman 检验计算趋势的 p 值。此外,对于连续非正态分布的变量,可以使用 Kendall 检验(method='kendall' 来自 cor.test)或 Cuzick 检验(cuzickTest)计算趋势的 p 值。如果行变量为 Surv 类,则从 Cox 模型中计算得分检验,其中分组变量作为整数变量预测因子引入。如果行变量为分类变量,则通过 Mantel-Haenszel 趋势检验计算趋势的 p 值。

如果有两个组,将为每个行变量计算 Odds Ratio 或 Risk Ratio。而如果响应是 Surv 类(即时间到事件),则计算 Hazard Ratios。当 x 变量为因子时,使用 epitools 包中的 oddsratioriskratio 分别计算 Odds Ratio 和 Risk Ratio。当 x 变量为连续变量时,在具有典型链接和对数链接的逻辑回归下计算 Odds Ratio 和 Risk Ratio。对于 Hazard Ratios 的 p 值,在行变量为分类或连续时,分别通过 logrank 检验或 Wald 检验计算。

示例

require(compareGroups)
require(survival)

# 加载 REGICOR 数据
data(regicor)

# 计算心血管事件的时间变量
regicor$tcv <- with(regicor, Surv(tocv, as.integer(cv=='Yes')))
attr(regicor$tcv,"label")<-"Cardiovascular"

# 计算总体死亡时间变量
regicor$tdeath <- with(regicor, Surv(todeath, as.integer(death=='Yes')))
attr(regicor$tdeath,"label") <- "Mortality"

# 按性别计算描述性统计
res <- compareGroups(sex ~ .-id-tocv-cv-todeath-death, data = regicor)
summary(res)

# 单变量绘图
## plot(res)

# 性别分层的所有行变量的绘图
## plot(res, bivar = TRUE)

# 更新响应变量为心血管事件的时间
## update(res, tcv ~ . + sex- tdeath- tcv)

4、compareSNPs–按组描述遗传统计数据

描述

该函数提供了您 SNP 数据的广泛摘要范围,使您能够对基因分型结果进行深入的质量控制,并在分析之前探索数据。摘要指标包括等位基因和基因型频率及计数、缺失率、哈迪-温伯格平衡等,可以在整个数据集或按其他变量(如病例对照状态)进行分层。它还可以测试组间缺失率的差异。

用法

compareSNPs(formula, 
            data, 
            subset, 
            na.action = NULL, 
            sep = "", 
            verbose = FALSE, ...)
  1. formula: 一个"公式"类对象(或可以转换为该类的对象)。~ 的右侧必须以加法方式包含项,这些项必须引用 data 中的变量,并且必须是字符或因子类,其级别是以其水平写出的基因型(例如,A/A、A/T 和 T/T)。~ 的左侧必须包含分组变量的名称,或者可以留空(在这种情况下,将为整个样本提供摘要数据,并且不进行缺失性检验)。

  2. data: 一个可选的数据框、列表或环境(或可以通过 as.data.frame 转换为数据框的对象),包含模型中的变量。如果在 data 中找不到它们,则从 environment(formula) 中获取变量。

  3. subset: 一个可选的向量,指定用于计算过程的个体子集(适用于所有遗传变量)。

  4. na.action: 一个指示数据中包含 NAs 时应采取何种措施的函数。默认值为 NULL,相当于 na.pass,意味着不采取任何措施。na.exclude 对于希望删除任何变量中有缺失值的所有个体时可能会很有用。

  5. sep: 字符串,指示等位基因之间的分隔符(例如,当使用 A/A、A/T 和 T/T 基因型编码时,sep 应设置为 /。默认值为 “”,表示基因型编码为 AA、AT 和 TT。

  6. verbose: 逻辑值,打印 HWChisq 函数的结果。默认值为 FALSE。

  7. : 目前被忽略的参数。

示例

require(compareGroups)

# load example data
data(SNPs)

# visualize first rows
head(SNPs)

# select casco and all SNPs
myDat <- SNPs[,c(2,6:40)]

# QC of three SNPs by groups of cases and controls
res<-compareSNPs(casco ~ .-casco, myDat)
res

# QC of three SNPs of the whole data set
res<-compareSNPs( ~ .-casco, myDat)
res

5、createTable–分组描述表:二元表

描述

这个函数用分组的描述构建一个"紧凑"和"漂亮"的表。

用法

createTable(x, 
            hide = NA, 
            digits = NA, 
            type = NA, 
            show.p.overall = TRUE,
            show.all, 
            show.p.trend, 
            show.p.mul = FALSE, 
            show.n, 
            show.ratio =FALSE, 
            show.descr = TRUE, 
            show.ci = FALSE, 
            hide.no = NA, 
            digits.ratio = NA,
            show.p.ratio = show.ratio, 
            digits.p = 3, 
            sd.type = 1, 
            q.type = c(1, 1),
            extra.labels = NA, 
            all.last = FALSE, 
            lab.ref = "Ref.", 
            stars = FALSE)

参数

  1. x: 一个 “compareGroups” 类对象。

  2. hide: 一个向量(或列表),包含与行变量数量相同的整数或字符。如果其长度为 1,则对所有行变量进行回收。每个组件指定必须隐藏且不显示的类别(如果是字符,则为类别的文字名称;如果是整数,则为位置)。此参数仅适用于分类行变量,对于连续行变量将被忽略。如果为 NA,则显示所有类别。或者是一个命名向量(或命名列表),指定应用于哪些行变量的 ‘hide’,其余行变量应用默认值。默认值为 NA。

  3. digits: 一个整数向量,其组件数量与行变量相同。如果其长度为 1,则对所有行变量进行回收。每个组件指定要显示的有效小数位数。或者是一个命名向量,指定 ‘digits’ 应用于哪些行变量(一个保留名称是 ‘.else’,定义其余变量的 ‘digits’);如果没有定义 ‘.else’ 变量,则对其余变量应用默认值。默认值为 NA,表示使用"适当"的小数位数(详细信息请参见说明文档)。

  4. type: 一个整数,指示是否显示绝对和/或相对频率:1 - 仅相对频率;2 或 NA - 绝对和相对频率(以括号显示);3 - 仅绝对频率。

  5. show.p.overall: 逻辑值,指示是否显示整体组显著性(‘p.overall’ 列)的 p 值。默认值为 TRUE。

  6. show.all: 逻辑值,指示是否显示 ‘[ALL]’ 列(未按组分层的所有数据)。如果定义了分组变量,则默认值为 FALSE;如果没有组,则为 FALSE。

  7. show.p.trend: 逻辑值,指示是否显示 p-trend。如果组少于 3,则始终为 FALSE。如果缺少此参数且组数超过 2 且分组变量为有序因子,则显示 p-trend。默认情况下,p-trend 不显示;当组数超过 2 且分组变量为有序因子类时显示。

  8. show.p.mul: 逻辑值,指示是否显示成对(组间)比较的 p 值。组数少于 3 时始终为 FALSE。默认值为 FALSE。

  9. show.n: 逻辑值,指示是否在 ‘descr’ 表中显示每个行变量分析的个体数量。默认值为 FALSE,当没有组时为 TRUE。

  10. show.ratio: 逻辑值,指示是否显示 OR / HR。默认值为 FALSE。

  11. show.descr: 逻辑值,指示是否显示描述性统计(即均值、比例等)。默认值为 TRUE。

  12. show.ci: 逻辑值,指示是否显示均值、中位数、比例或发生率的置信区间。如果是,则显示在方括号之间。默认值为 FALSE。

  13. hide.no: 字符,指定要隐藏的名称级别,适用于所有具有 2 个类别的分类变量。大小写不敏感。结果是该变量只显示名称而不显示类别。这对是/否变量尤其有用。对于 ‘hide’ 参数不同于 NA 的分类行变量将被忽略。默认值为 NA,表示不隐藏任何类别。

  14. digits.ratio: 与 ‘digits’ 参数相同,但适用于风险比或赔率比。

  15. show.p.ratio: 逻辑值,指示是否显示与每个风险比/赔率比对应的 p 值。

  16. digits.p: 整数,指示所有 p 值显示的小数位数。默认值为 3。

  17. sd.type: 一个整数,指示标准偏差的显示方式:1 - 均值(SD),2 - 均值 ± SD。

  18. q.type: 一个包含两个整数的向量。第一个组件指非正态行变量显示的括号类型(1 - 方形,2 - 圆形),第二个组件指百分位数分隔符(1 - ‘;’,2 - ‘,’,3 - ‘-’)。默认值为 c(1, 1)。

  19. extra.labels: 字符向量,包含 4 个组件,对应于附加到正常、非正态、分类或生存行变量标签的关键标签。默认值为 NA,不附加任何额外关键字。如果设置为 c(“”,“”,“”,“”),则附加"Mean (SD)"、“Median [25th; 75th]”、“N (%)” 和 “Incidence at time=timemax”(请参阅 compareGroups 函数中的 timemax 参数)。

  20. all.last: 逻辑值。整个样本的描述性统计放在按组描述性统计之后。默认值为 FALSE,表示整体队列的描述性统计放在第一位。

  21. lab.ref: 字符。参考类别的显示字符串。默认值为 “Ref.”。

  22. stars: 逻辑值,指示是否在 p 值旁边附加星号;‘**’:p 值 < 0.05,‘*’ 0.05 <= p 值 < 0.1;“” p 值 >= 0.1。默认值为 FALSE。

  23. which.table: 字符,指示打印哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’(允许部分匹配),分别打印按组描述性统计表、可用数据表或两个表。默认值为 ‘descr’。

  24. nmax: 逻辑值,指示是否显示所有行变量中至少具有一个有效值的主题数量。默认值为 TRUE。

  25. nmax.method: 整数,有两个可能的值:1 - 在至少一个行变量中具有有效值的观察数量;2 - 数据集或组中的总观察数量或行数。默认值为 1。

  26. header.labels: 一个命名字符向量,包含 ‘all’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’ 组件,指示 ‘[ALL]’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’(可用数据)的标签。默认值为零长度向量,不做更改,即 ‘[ALL]’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’ 标签显示在整个队列的描述性统计、全局 p 值、趋势的 p 值、HR/OR 和每个 HR/OR 的 p 值以及可用数据中。

  27. : 传递给 print.default 的其他参数。

示例

# 加载所需的包
require(compareGroups)
require(survival)

# 加载 REGICOR 数据
data(regicor)

# 计算心血管事件的时间变量
regicor$tcv <- with(regicor, Surv(tocv, as.integer(cv == 'Yes')))
attr(regicor$tcv, "label") <- "Cardiovascular incidence"

# 根据心血管事件的时间计算描述性统计,以 'no' 类别作为参考来计算 HR。
res <- compareGroups(tcv ~ age + sex + smoker + sbp + histhtn + chol + txchol + bmi + phyact + pcs + tcv, regicor, ref.no = 'no')

# 构建显示 HR 的表格,并隐藏 'no' 类别
restab <- createTable(res, show.ratio = TRUE, hide.no = 'no')
restab  # 打印可用信息表

# 进行总结
summary(restab)  # 更多...

## 不运行的代码:
# 添加 '可用数据' 列
update(restab, show.n = TRUE)

# 整个队列的描述性统计
update(restab, x = update(res, ~ .))

# 将响应变量更改为性别
# 显示比值比(OR)而不是风险比(HR)。
# 请注意,现在可以计算按死亡时间或心血管事件时间的描述性统计,但不能计算 OR。
# 将 timemax 设置为 5 年,以报告 5 年的死亡概率和心血管事件概率:
update(restab, x = update(res, sex ~ . - sex + tdeath + tcv, timemax = 5 * 365.25))

## 组合表格:
# a) 按行:将前四个变量作为一组,其余变量作为另一组:
rbind("First group of variables" = restab[1:4], "Second group of variables" = restab[5:length(res)])

# b) 按列:将按性别分层的表格并排放置:
res1 <- compareGroups(year ~ . - id - sex, regicor)
restab1 <- createTable(res1, hide.no = 'no')
restab2 <- update(restab1, x = update(res1, subset = sex == 'Male'))

6、createTable–执行描述并构建二元表

描述

这个函数一步构建一个双变量表,调用compareGroups和createTable函数。

用法

descrTable(formula,
          data,
          subset,
          na.action = NULL,
          y = NULL,
          Xext = NULL,
          selec = NA,
          method = 1,
          timemax = NA,
          alpha = 0.05,
          min.dis = 5,
          max.ylev = 5,
          max.xlev = 10,
          include.label = TRUE,
          Q1 = 0.25,
          Q3 = 0.75,
          simplify = TRUE,
          ref = 1,
          ref.no = NA,
          fact.ratio = 1,
          ref.y = 1,
          p.corrected = TRUE,
          compute.ratio = TRUE,
          include.miss = FALSE,
          oddsratio.method = "midp",
          chisq.test.perm = FALSE,
          byrow = FALSE,
          chisq.test.B = 2000,
          chisq.test.seed = NULL,
          Date.format = "d-mon-Y",
          var.equal = TRUE,
          conf.level = 0.95,
          surv = FALSE,
          riskratio = FALSE,
          riskratio.method = "wald",
          compute.prop = FALSE,
          lab.missing = "'Missing'",
          p.trend.method = "spearman",
          hide = NA,
          digits = NA,
          type = NA,
          show.p.overall = TRUE,
          show.all,
          show.p.trend,
          show.p.mul = FALSE,
          show.n,
          show.ratio = FALSE,
          show.descr = TRUE,
          show.ci = FALSE,
          hide.no = NA,
          digits.ratio = NA,
          show.p.ratio = show.ratio,
          digits.p = 3,
          sd.type = 1,
          q.type = c(1, 1),
          extra.labels = NA,
          all.last = FALSE,
          lab.ref = "Ref.",
          stars = FALSE
)

  1. : 参数均同 compareGroups 和 createTabel。

示例

require(compareGroups) 

# load REGICOR data 
data(regicor) 

# perform descriptives by year and build the table. 
# note the use of arguments from compareGroups (formula and data set) and
# arguments from createTable (hide.no and show.p.mul) 
descrTable(year ~ ., regicor, hide.no="no", show.p.mul=TRUE)

7、export2csv–将描述表导出为纯文本(CSV)格式

描述

该函数接受createTable的结果,并将表导出为纯文本(CSV)格式。

用法

export2csv(x, 
           file, 
           which.table="descr", 
           sep=",", 
           nmax = TRUE, 
           nmax.method = 1, 
           header.labels = c(), 
           ...)
  1. x: 一个 ‘createTable’ 类的对象。

  2. file: 将以 CSV 格式写入的文件。此外,还会写入一个扩展名为 ‘_appendix’ 的文件,其中包含可用数据表。

  3. which.table: 字符,指示打印哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’(允许部分匹配),分别导出按组的描述性统计表、可用数据表或两个表。默认值为 ‘descr’。

  4. sep: 字符。变量分隔符,与 write.tablesep 参数相同。默认值为 ‘,’。

  5. nmax: 逻辑值,指示是否显示在所有行变量中至少有一个有效值的受试者数量。默认值为 TRUE。

  6. nmax.method: 整数,具有两个可能的值:1- 在至少一个行变量中具有有效值的观察数量;2- 数据集或组中的观察总数或行数。默认值为 1。

  7. header.labels: 参见 createTableheader.labels 参数。

  8. : 其他传递给 write.table 的参数。

示例

require(compareGroups) 
data(regicor) 
res <- compareGroups(sex ~.-id-todeath-death-tocv-cv, regicor) 
export2csv(createTable(res, hide.no = 'n'), file=tempfile(fileext=".csv"))

8、export2html–导出描述表为HTML格式

描述

该函数接受createTable的结果,并将表导出为HTML格式。

用法

export2html(x, 
            file, 
            which.table="descr", 
            nmax = TRUE, 
            nmax.method = 1, 
            header.labels = c(), 
            ...)
  1. x: 一个 ‘createTable’ 类的对象。

  2. file: 将以 HTML 格式写入的文件。此外,还会写入一个扩展名为 ‘_appendix’ 的文件,其中包含可用数据表。如果缺失,将返回 HTML 代码。

  3. which.table: 字符,指示打印哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’(允许部分匹配),分别导出按组的描述性统计表、可用数据表或两个表。默认值为 ‘descr’。

  4. nmax: 逻辑值,指示是否显示在所有行变量中至少有一个有效值的受试者数量。默认值为 TRUE。

  5. nmax.method: 整数,具有两个可能的值:1- 在至少一个行变量中具有有效值的观察数量;2- 数据集或组中的观察总数或行数。默认值为 1。

  6. header.labels: 参见 createTableheader.labels 参数。

  7. : 当前被忽略的其他参数。

示例

require(compareGroups) 
data(regicor) 
res <- compareGroups(sex ~.-id-todeath-death-tocv-cv, regicor) 
export2html(createTable(res, hide.no = 'n'), file=tempfile(fileext=".html"))

9、export2latex–导出描述表为LaTeX格式

描述

这个函数接受createTable的结果,并将表导出为LaTeX格式。

用法

export2latex(x, ...) 
## S3 method for class 'createTable' 
export2latex(x, f
             ile, 
             which.table = 'descr', 
             size = 'same', 
             nmax = TRUE, 
             nmax.method = 1, 
             header.labels = c(), 
             caption = NULL, 
             loc.caption = 'top', 
             label = NULL, 
             landscape = NA, 
             colmax = 10, ...) 
## S3 method for class 'cbind.createTable' 
export2latex(x, 
             file, 
             which.table = 'descr', 
             size = 'same', 
             nmax = TRUE, 
             nmax.method = 1, 
             header.labels = c(), 
             caption = NULL, 
             loc.caption = 'top', 
             label = NULL, 
             landscape = NA, 
             colmax = 10, 
             ...)
  1. x: 一个 ‘createTable’ 类的对象。

  2. file: 要保存结果代码的文件名称。如果文件缺失,则输出将在屏幕上显示。此外,还会写入一个扩展名为 ‘_appendix’ 的文件,其中包含可用数据表。

  3. which.table: 字符,指示导出哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’(允许部分匹配),分别导出按组的描述性统计表、可用数据表或两个表。默认值为 ‘descr’。

  4. size: 字符,指示表元素的大小。可能的值有:‘tiny’、‘scriptsize’、‘footnotesize’、‘small’、‘normalsize’、‘large’、‘Large’、‘LARGE’、‘huge’、‘Huge’ 或 ‘same’(允许部分匹配)。默认值为 ‘same’,表示表的字体大小与主 LaTeX 文档中指定的相同。

  5. nmax: 逻辑值,指示是否显示在所有行变量中至少有一个有效值的受试者数量。默认值为 TRUE。

  6. nmax.method: 整数,具有两个可能的值:1- 在至少一个行变量中具有有效值的观察数量;2- 数据集或组中的观察总数或行数。默认值为 1。

  7. header.labels: 参见 createTableheader.labels 参数。

  8. caption: 字符,指定描述性统计和可用数据表的标题。如果 which.table='both',则 caption 的第一个元素将分配给描述性表,第二个元素分配给可用数据表。如果设置为 “”,则不插入标题。默认值为 NULL,将为描述性表写入 'Summary descriptives table by groups of ‘y’,为可用数据表写入 'Available data by groups of ‘y’。

  9. label: 字符,指定描述性统计和可用数据表的标签。这在 LaTeX 文档的其他地方引用表格时可能很有用。如果 which.table='both',则 label 的第一个元素将分配给描述性表,第二个元素分配给可用数据表。默认值为 NULL,不会为表格分配标签。

  10. loc.caption: 字符,指定表格标题的位置。可能的值为 ‘top’ 或 ‘bottom’(允许部分匹配)。默认值为 ‘top’。

  11. landscape: 逻辑值,指示表格是否应放置为横向,或者 NA,当列数超过 ‘colmax’ 时将表格放置为横向。默认值为 NA。

  12. colmax: 整数,指示最大列数,以便表格不放置为横向。此参数仅在 ‘landscape’ 参数为 NA 时适用。默认值为 10。

  13. : 当前被忽略的其他参数。

示例

require(compareGroups) 
data(regicor) 
res <- compareGroups(sex ~.-id-todeath-death-tocv-cv, regicor) 
export2latex(createTable(res, hide.no = 'n'), file=tempfile(fileext=".tex"))

10、export2md–导出描述表为Markdown格式

描述

该函数接受createTable的结果,并将表导出为markdown格式。当在Markdown文件(. rmd)中插入R代码块时,它可能很有用。

用法

export2md(x, 
          which.table = "descr", 
          nmax = TRUE, 
          nmax.method = 1, 
          header.labels = c(), 
          caption = NULL, 
          format = "html", 
          width = Inf, 
          strip = FALSE, 
          first.strip = FALSE, 
          background = "#D2D2D2", 
          size = NULL, 
          landscape=FALSE, 
          header.background=NULL, 
          header.color=NULL, 
          position="center", 
          ...)
  1. x: 一个 ‘createTable’ 类的对象。

  2. which.table: 字符,指示打印哪个表。可能的值为 ‘descr’ 或 ‘avail’(允许部分匹配),分别导出按组的描述性统计表或可用数据表。默认值为 ‘descr’。

  3. nmax: 逻辑值,指示是否显示在所有行变量中至少有一个有效值的受试者数量。默认值为 TRUE。

  4. nmax.method: 整数,具有两个可能的值:1- 在至少一个行变量中具有有效值的观察数量;2- 数据集或组中的观察总数或行数。默认值为 1。

  5. header.labels: 参见 createTableheader.labels 参数。

  6. caption: 字符,指定描述性统计和可用数据表的标题。如果 which.table='both',则 caption 的第一个元素将分配给描述性表,第二个元素分配给可用数据表。如果设置为 “”,则不插入标题。默认值为 NULL,将为描述性表写入 'Summary descriptives table by groups of ‘y’,为可用数据表写入 'Available data by groups of ‘y’。

  7. export2md: 字符,具有三个选项:‘html’、‘latex’ 或 ‘markdown’。如果缺失,它会尝试猜测插入表的 Rmarkdown 文件的默认选项,或者如果不在 Rmarkdown 文件中或格式未指定,则为 html。

  8. width: 字符串,指定描述性表第一列的宽度。导出到 Word 时会被忽略。默认值为 Inf,这使得第一列自动调整为变量名称。其他示例有 ‘10cm’、‘3in’ 或 ‘30em’。

  9. strip: 逻辑值。它阴影每个变量对应的表线。

  10. first.strip: 逻辑值。它确定是阴影第一个变量(TRUE)还是第二个变量(FALSE)。它仅在 strip 参数为 true 时适用。

  11. background: 颜色代码,以 HEX 格式表示阴影线的颜色。您可以使用 rgb 函数将红色、绿色和蓝色转换为 HEX 代码。默认颜色为 ‘#D2D2D2’。

  12. size: 数字。描述性表的大小。默认值为 NULL,这会创建默认大小的表。

  13. landscape: 逻辑值。它确定是否将表格放置为横向(水平)格式。它仅在格式为 ‘latex’ 时适用。默认值为 FALSE。

  14. header.background: 字符,用于表头的颜色或 ‘NULL’。默认值为 ‘NULL’。

  15. header.color: 表头文本的颜色。默认颜色为 ‘NULL’。

  16. position: 字符,指定表格位置。可能的值为 ‘left’、‘center’、‘right’、‘float_left’ 和 ‘float_right’。它仅在编译为 HTML 或 PDF 时适用。默认值为 ‘center’。有关更多信息,请参见 kable_styling 的 position 参数。

  17. : 传递给 kable 的其他参数。

示例

---
title: "Report"
output: 
  html_document: default
---
```{r setup, include=FALSE} 
knitr::opts_chunk$set(echo = FALSE, warning=FALSE, message=FALSE) 
```

```{r} 
library(compareGroups) 
data(regicor) 
res <- compareGroups(year~., regicor) 
restab <- createTable(res) 
```
## Report section 
The following table contains descriptives of **REGICOR** data 

```{r} 
export2md(restab, strip = TRUE, first.strip = TRUE) 
```

11、export2pdf–将表格导出为PDF文件

描述

这个函数会自动创建一个带有表格的PDF。另外,LaTeX代码存储在指定的文件中。

用法

export2pdf(x, 
           file, 
           which.table="descr", 
           nmax=TRUE, 
           header.labels=c(), 
           caption=NULL, 
           width=Inf, 
           strip=FALSE, 
           first.strip=FALSE, 
           background="#D2D2D2", 
           size=NULL, 
           landscape=FALSE, 
           numcompiled=2, 
           header.background=NULL, 
           header.color=NULL)
  1. x: 一个 ‘createTable’ 类的对象或其子类。

  2. file: 字符,指定编译 LaTeX 代码后生成的 PDF 文件。相应的 LaTeX 代码也会保存在同一文件夹中,并以 .tex 扩展名存储。当 ‘compile’ 参数为 FALSE 时,仅保存 .tex 文件。

  3. which.table: 字符,指示打印哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’(允许部分匹配),分别打印按组的描述性统计表、可用数据表或两个表。默认值为 ‘descr’。

  4. nmax: 逻辑,指示是否显示至少在一个行变量中具有有效值的受试者数量。默认值为 TRUE。

  5. header.labels: 一个字符命名向量,包含 ‘all’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’ 组件,指示标签分别为 ‘[ALL]’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’(可用数据)。默认值为零长度向量,这意味着不做任何更改。

  6. caption: 字符,指定描述性和可用数据表的标题。如果 which.table=‘both’,则 ‘caption’ 的第一个元素将分配给描述性表,第二个元素分配给可用数据表。如果设置为 “”,则不插入标题。默认值为 NULL。

  7. width: 字符串,指定描述性表第一列的宽度。默认值为 Inf,意味着第一列自动调整到变量名称。其他示例包括 ‘10cm’、‘3in’ 或 ‘30em’。

  8. strip: 逻辑。它影藏每个变量对应的表格线。

  9. first.strip: 逻辑。它确定是否影藏第一个变量(TRUE)或第二个变量(FALSE)。仅在 strip 参数为真时适用。

  10. background: HEX 格式的颜色代码,用于阴影线。默认颜色为 ‘#D2D2D2’。

  11. size: 数字。描述性表的大小。默认值为 NULL,表示以默认大小创建表。

  12. landscape: 逻辑。它决定是否以横向格式放置表格。仅在格式为 ‘latex’ 时适用。默认值为 FALSE。

  13. numcompiled: 整数。LaTeX 代码编译的次数。默认编译两次。

  14. header.background: 表头的颜色字符或 ‘NULL’。默认值为 ‘NULL’。

  15. header.color: 表头文本的颜色字符。默认颜色为 ‘NULL’。

示例

require(compareGroups)
data(regicor)
# example on an ordinary table
res <- createTable(compareGroups(year ~ . -id, regicor), hide = c(sex=1), hide.no = 'no')
export2pdf(res, file=tempfile(fileext=".pdf"), size="small")

12、export2word–将表格导出为WORD文件

描述

这个函数用表格自动创建一个Word文件。

用法

export2word(x, 
            file, 
            which.table="descr", 
            nmax=TRUE, 
            header.labels=c(),
            caption=NULL, 
            strip=FALSE, 
            first.strip=FALSE, 
            background="#D2D2D2",
            size=NULL, 
            header.background=NULL, 
            header.color=NULL)
  1. x: 一个 ‘createTable’ 类的对象或其子类。

  2. file: 字符,指定编译相应的 Markdown 代码后生成的 Word 文件 (.doc 或 .docx)。

  3. which.table: 字符,指示打印哪个表。可能的值为 ‘descr’ 或 ‘avail’(允许部分匹配),分别导出按组的描述性统计表或可用数据表。默认值为 ‘descr’。

  4. nmax: 逻辑,指示是否显示至少在一个行变量中具有有效值的受试者数量。默认值为 TRUE。

  5. header.labels: 参见 ‘createTable’ 的 ‘header.labels’ 参数。

  6. caption: 字符,指定描述性和可用数据表的标题。如果 which.table=‘both’,则 ‘caption’ 的第一个元素将分配给描述性表,第二个元素分配给可用数据表。如果设置为 “”,则不插入标题。默认值为 NULL。

  7. strip: 逻辑。它影藏每个变量对应的表格线。

  8. first.strip: 逻辑。它确定是否影藏第一个变量(TRUE)或第二个变量(FALSE)。仅在 strip 参数为真时适用。

  9. background: HEX 格式的颜色代码,用于阴影线。默认颜色为 ‘#D2D2D2’。

  10. size: 数字。描述性表的大小。默认值为 NULL,表示以默认大小创建表。

  11. header.background: 表头的颜色字符或 ‘NULL’。默认值为 ‘NULL’。

  12. header.color: 表头文本的颜色字符。默认颜色为 ‘NULL’。

示例

require(compareGroups)
data(regicor)

# example on an ordinary table
res <- createTable(compareGroups(year ~ . -id, regicor), hide = c(sex=1), hide.no = 'no')
export2word(res, file = tempfile(fileext=".docx"))

13、export2xls–将描述表导出为excel格式(.xlsx或.xls)

描述

该函数接受createTable的结果,并将表导出为Excel格式(.xlsx或.xls)。

用法

export2xls(x, 
           file, 
           which.table="descr", 
           nmax=TRUE, 
           nmax.method=1, 
           header.labels=c())
  1. x: 一个 ‘createTable’ 类的对象。

  2. file: 文件,指定将以 Excel 格式写入的表格。

  3. which.table: 字符,指示打印哪个表。可能的值为 ‘descr’、‘avail’ 或 ‘both’(允许部分匹配),分别导出按组的描述性统计表、可用数据表或两个表格。在后者的情况下(‘both’),将生成两个工作表,每个表对应一个。默认值为 ‘descr’。

  4. nmax: 逻辑,指示是否显示至少在一个行变量中具有有效值的受试者数量。默认值为 TRUE。

  5. nmax.method: 整数,有两个可能的值:1-表示在至少一个行变量中具有有效值的观察数量;2-数据集或组中的观察总数或行数。默认值为 1。

  6. header.labels: 参见 ‘createTable’ 的 ‘header.labels’ 参数。

示例

require(compareGroups)
data(regicor)
res <- compareGroups(sex ~. -id-todeath-death-tocv-cv, regicor)
export2xls(createTable(res, hide.no = 'n'), file=tempfile(fileext=".xlsx"))

14、getResults–轻松检索作为r对象(矩阵和向量)的汇总数据

描述

这个函数从一个compareGroups对象中提取特定的结果(描述、p值、比值/风险比等)作为矩阵或向量。

用法

getResults(obj, what = "descr")
  1. obj: 一个 ‘compareGroups’ 或 ‘createTable’ 类的对象。

  2. what: 字符,指示要检索的结果类型:描述性统计、p 值、趋势 p 值、成对 p 值,或比值比/风险比。可能的值为:“descr”、“p.overall”、“p.trend”、“p.mul” 和 “ratio”。默认值为 “descr”。

  • what = “descr”: 一个数组或矩阵,列数等于变量/类别数量,七列对应所有可能的描述性统计(均值、标准差、中位数、Q1、Q3、绝对和相对频率)。当分析不同组时,数组的第三维对应组;否则,结果将是没有第三维的矩阵。

  • what = “p.overall”: 一个向量,其元素为每个分析变量的 p 值。

  • what = “p.trend”: 一个向量,其元素为每个分析变量的趋势 p 值。

  • what = “p.mul”: 一个矩阵,包含成对 p 值,行对应分析变量,列对应每对组。

  • what = “ratio”: 一个矩阵,行数等于变量/类别数量,四列对应比值比/风险比、置信区间和 p 值。

示例

require(compareGroups)
data(regicor)
res<-compareGroups(sex ~ . ,regicor,method=c(triglyc=2))
# retrieve descriptives
getResults(res)
# retrieve OR and their corresponding p-values
getResults(res,what="ratio")

15、missingTable–失踪者分组统计表

描述

该函数返回一个表,其中包含已构建的二元表中不可用的频率。

用法

missingTable(obj,...)
  1. obj: 一个 ‘compareGroups’ 或 ‘createTable’ 类的对象。

  2. : 传递给 createTable 的其它参数。

示例

require(compareGroups)
# load regicor data
data(regicor)
# table of descriptives by recruitment year
res <- compareGroups(year ~ age + sex + smoker + sbp + histhtn +
chol + txchol + bmi + phyact + pcs + death, regicor)
restab <- createTable(res, hide.no = "no")
# missingness table
missingTable(restab,type=1)
## Not run:
# also create the missing table from a compareGroups object
miss <- missingTable(res)
miss
# some methods that works for createTable objects also works for objects
# computed by missTable function.
miss[1:4]
varinfo(miss)
plot(miss)
#... but update methods cannot be applied (this returns an error).
update(miss,type=2)
## End(Not run)

16、padjustCompareGroups–根据多次比较更新p值

描述

给定一个compareGroups对象,返回使用以下方法之一调整的p值(stats::p.adjust)

用法

padjustCompareGroups(object_compare, 
                     p = "p.overall", 
                     method = "BH")
  1. object_compare: 一个 ‘compareGroups’ 类的对象。

  2. p: 字符串,指定需要校正的 p 值。可能的值为 ‘p.overall’ 和 ‘p.trend’(默认值为 ‘p.overall’)。

  3. method: 校正方法,字符串。可以使用简写形式(参见 p.adjust 函数)。

示例

# Define simulated data
set.seed(123)
N_obs<-100
N_vars<-50
data<-matrix(rnorm(N_obs*N_vars), N_obs, N_vars)
sim_data<-data.frame(data,Y=rbinom(N_obs,1,0.5))

# Execute compareGroups
res<-compareGroups(Y~.,data=sim_data)
res

# update p values
res_adjusted<-padjustCompareGroups(res)
res_adjusted

# update p values using FDR method
res_adjusted<-padjustCompareGroups(res, method ="fdr")
res_adjusted

17、printTable–“漂亮的”表格

描述

这个函数以“nice”格式在控制台上打印一个表。

用法

printTable(obj, row.names = TRUE, justify = 'right')
  1. obj: 一个 ‘data.frame’ 或 ‘matrix’ 类的对象。它必须至少包含两列,第一列被视为 ‘row.names’ 并且左对齐(如果 ‘row.names’ 参数设置为 TRUE),而其余列右对齐。

  2. row.names: 逻辑值,指示第一列或变量是否作为 ‘row.names’ 列处理并且必须左对齐。默认值为 TRUE。

  3. justify: 字符串,类似于 format 函数的 ‘justify’ 参数。当 ‘row.names’ 参数为 FALSE 时,应用于整个数据框或矩阵的所有列;否则,应用于除第一列之外的所有列。默认值为 ‘right’。

示例

require(compareGroups)
data(regicor)

# example of the coefficients table from a linear regression
model <- lm(chol ~ age + sex + bmi, regicor)
results <- coef(summary(model))
results <- cbind(Var = rownames(results), round(results, 4))
printTable(results)

# or visualize the first rows of the iris data frame.
# In this example, the first column is not treated as a row.names column and it is right justified.
printTable(head(iris), FALSE)

# the same example with columns centered
printTable(head(iris), FALSE, 'centre')

18、radiograph–列出数据集中的值

描述

此函数创建数据集中原始数据的报告。对于每个变量,一个唯一条目的有序列表(作为字符串读取),用于检查输入错误。

用法

radiograph(file, 
           header = TRUE, 
           save=FALSE, 
           out.file="", ...)
  1. file: 字符串,指定数据集所在的文件。

  2. header: 参见 read.tableheader 参数。

  3. save: 逻辑值,指示输出是应存储在文件中 (TRUE) 还是打印在控制台上 (FALSE)。默认值为 FALSE。

  4. out.file: 字符串,指定结果要输出的文件。仅当 save 参数设置为 TRUE 时适用。

  5. : 传递给 read.table 的其他参数。

示例

## Not run:
require(compareGroups)
# read example data of regicor in plain text format with variables separated by '\t'.
datafile <- system.file("exdata/regicor.txt", package="compareGroups")
radiograph(datafile)
## End(Not run)

19、regicor–REGICOR横断面数据

描述

这些数据来自西班牙西北部赫罗纳省REGICOR研究中对具有代表性的个人进行的3次不同的横断面调查。

用法

data(regicor)

20、report–描述性表格和图的报告

描述

该函数自动创建一个PDF,其中包含描述性表以及可用性数据和所有图。该文件的结构和索引方式使用户可以浏览文档中的所有表格和图形。

用法

report(x, 
       file, 
       fig.folder, 
       compile = TRUE, 
       openfile = FALSE, 
       title = "Report",
       author, 
       date, 
       perc=FALSE, ...)

  1. x: 一个 ‘createTable’ 类的对象。

  2. file: 字符串,指定在编译 LaTeX 代码后生成的 PDF 文件。LaTeX 代码也存储在同一文件夹中,扩展名为 .tex。如果 compile 参数为 FALSE,仅保存 .tex 文件。

  3. fig.folder: 字符串,指定放置表格中所有行变量对应的图形的文件夹。如果省略,将在 file 文件的相同文件夹中创建一个名为 file_figures 的文件夹。

  4. compile: 逻辑值,指示是否使用 texi2pdf 函数编译 .tex 文件。默认值为 TRUE。

  5. openfile: 逻辑值,指示是否打开已编译的 PDF 文件。目前已弃用,默认值为 FALSE。

  6. title: 字符串,指定封面上的报告标题。默认值为 “Report”。

  7. author: 字符串,指定封面上的作者姓名。当省略时,封面上不显示作者姓名。

  8. date: 字符串,指定封面上的报告日期。当省略时,显示当前日期。

  9. perc: 逻辑值,指示是否在条形图中为分类变量显示相对频率(百分比)而不是绝对频率。

  10. : 传递给 export2latex 的其他参数。

示例

## Not run:
require(compareGroups)
data(regicor)
# example on an ordinary table
res <- createTable(compareGroups(year ~ . -id, regicor), hide = c(sex=1), hide.no = 'no')
report(res, "report.pdf" ,size="small", title="\Huge \textbf{REGICOR study}",
        author="Isaac Subirana \\ IMIM-Parc de Salut Mar")
# example on an stratified table by sex
res.men <- createTable(compareGroups(year ~ . -id-sex, regicor, subset=sex=='Male'),
hide.no = 'no')
res.wom <- createTable(compareGroups(year ~ . -id-sex, regicor, subset=sex=='Female'),
hide.no = 'no')
res <- cbind("Men"=res.men, "Wom"=res.wom)
report(res[[1]], "reportmen.pdf", size="small",
title="\Huge \textbf{REGICOR study \\ Men}", date="") # report for men / no date
report(res[[2]], "reportwom.pdf", size="small",
title="\Huge \textbf{REGICOR study \\ Women}", date="") # report for wom / no date
## End(Not run)

20、SNPs–病例对照研究中的snp

描述

snp数据框架包含病例对照研究中选定的snp和其他病例和对照的临床协变量。
snp .info.pos data.frame包含数据集“snp”中包含的snp的名称,包括它们的染色体和它们的基因组位置。

用法

data(SNPs)

21、strataTable–分层描述表

描述

该函数在由变量定义的层中重新构建描述性表。

用法

strataTable(x, 
            strata, 
            strata.names = NULL, 
            max.nlevels = 5)
  1. x: 一个 ‘createTable’ 类的对象。

  2. strata: 字符串,指定定义分层的变量名称或该变量的值/水平。

  3. strata.names: 字符向量,包含与分层变量相关的名称。如果设置为 NULL(默认值),将使用分层变量水平的名称。

  4. max.nlevels: 整数,指定分层变量的最大唯一值或水平数。默认值为 5。

示例

require(compareGroups)
# load REGICOR data
data(regicor)
# compute the descriptive tables (by year)
restab <- descrTable(year ~ . - id - sex, regicor, hide.no="no")
# re-build the table stratifying by gender
strataTable(restab, "sex")

22、varinfo–提取变量名和标签

描述

该函数构建并打印一个包含变量名及其标签的表。

用法

varinfo(x, ...)
## S3 method for class 'compareGroups'
varinfo(x, ...)
## S3 method for class 'createTable'
varinfo(x, ...)
  1. x: 一个 ‘compareGroups’ 或 ‘createTable’ 类的对象。

  2. : 其他当前被忽略的参数。

示例

require(compareGroups)
data(regicor)
res<-compareGroups(sex ~ . ,regicor)
#createTable(res, hide.no = 'no')
varinfo(res)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2150599.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【目标检测论文必备】通俗易懂地讲解用绿色、蓝色、红色框可视化描述YOLO模型权重对于单个图片的训练效果(TP、FP、FN)

可视化步骤 一、生成自定义权重对图片的预测类别坐标信息二、创建需要预测的文件夹三、可视化运行 一、生成自定义权重对图片的预测类别坐标信息 新建脚本文件/path/to/your/ultralytics/savetxt.py放入对应参数运行会得到一个个独立的/path/to/your/runs/detect/output/outpu…

移动技术开发:简单计算器界面

1 实验名称 简单计算器界面 2实验目的 掌握基本布局管理器的使用方法和基本控件的使用方法&#xff0c;以及事件监听处理的使用方法 3 实验源代码 布局文件代码&#xff1a; <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:and…

2024年港澳台华侨生联考分数线继续更新来啦

导读 在最近的一系列分享中&#xff0c;我们和大家一同分享了2024年港澳台华侨生联考的分数线。今天我们继续和大家一起分享一些2024年港澳台联考的高校录取分数线吧&#xff01; 首都师范大学 首都师范大学和首都医科大学作为被低估的两所高校&#xff0c;这两年的分数线也是…

web基础—dvwa靶场(十)XSS

XSS(DOM) 跨站点脚本&#xff08;XSS&#xff09;攻击是一种注入攻击&#xff0c;恶意脚本会被注入到可信的网站中。当攻击者使用 web 应用程序将恶意代码&#xff08;通常以浏览器端脚本的形式&#xff09;发送给其他最终用户时&#xff0c;就会发生 XSS 攻击。允许这些攻击成…

Linux ubuntu debian系统安装UFW防火墙图形化工具GUFW

GUFW是UFW的图形化前端&#xff0c;可以通过以下命令安装&#xff1a; sudo apt install gufw安装成功后&#xff0c;可以通过应用程序菜单启动GUFW&#xff0c;在图形界面中&#xff0c;可以方便地添加、修改和删除规则&#xff0c;查看状态和日志。

【数据结构取经之路】图解红黑树

目录 前言 红黑树的概念 红黑树的性质 红黑树结点的定义 左右旋动图 红黑树的插入分析 红黑树的插入代码 红黑树与AVL-tree比较 红黑树的应用场景 前言 AVL-tree之外&#xff0c;另一个颇具历史且被广泛使用的平衡二叉搜索树是红黑树(RB-tree)&#xff0c;这名字听起来…

码头童话,“丈量”行业数智化转型

作者 | 曾响铃 文 | 响铃说 一箱车厘子从地球正对的另一边远渡重洋来到中国&#xff0c;而一旦到达&#xff0c;5个小时内它就能变成北京、天津、河北、河南等区域老百姓果盘里的美味。 这一幕&#xff0c;来自央视联合华为制作发布的《新智中国说-谈智一会间》第一期“码头…

PHP邮件发送教程:如何用PHP发送电子邮件?

php邮件怎么实现发送电子邮件&#xff1f;php怎么给邮箱发邮件&#xff1f; PHP作为一种广泛使用的服务器端脚本语言&#xff0c;提供了多种方法来实现电子邮件的发送。AokSend将详细介绍如何使用PHP邮件功能来发送电子邮件&#xff0c;帮助开发者轻松实现这一重要功能。 PHP…

30道常见的软件测试面试题(含答案+文档)

&#x1f345; 点击文末小卡片&#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 1、什么项目适合做自动化测试&#xff1f; 关键字&#xff1a;不变的、重复的、规范的 1&#xff09;任务测试明确&#xff0c;需求不会频繁变动 2&#xff09;项…

vulnhub靶场 DC-3

地址: https://download.vulnhub.com/dc/DC-3-2.zip 开启NAT模式 namp只扫到了一个端口 打开网页有一个登录的页面 目录扫描一下,可以找到一个 后台登录界面 看一下指纹信息 joomla cms 网上搜一下可以发现存在一个JoomScan工具 在kali上面安装一下 apt install joomscan …

4. 密码协议

4. 密码协议 (1) 协议的基本概念 协议是一种在两个或多个参与者之间进行通信的规范,它定义了参与者之间的交互方式、消息格式和通信过程。协议的目的是确保通信的可靠性和安全性,防止信息被篡改、伪造或泄露。 (2) 密码协议分类及基本密码协议 密码协议是用于加密和解密数…

【Python报错已解决】ModuleNotFoundError: No module named ‘tensorflow‘

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525; 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 专栏介绍 在软件开发和日常使用中&#xff0c;BUG是不可避免的。本专栏致力于为广大开发者和技术爱好者提供一个关于BUG解决的经…

浅谈“流量回放”

一、流量回放定义 “流量回放”通常指的是将之前记录的网络请求和响应数据重新发送到系统中&#xff0c;以模拟真实用户的操作。这种技术主要用于测试和调试目的&#xff0c;帮助开发人员和测试人员更好地理解系统在特定条件下的行为。 二、流量回放的技术原理&#xff1a; 数…

前端动画库大比拼:为何选择Velocity.js

前端动画库大比拼&#xff1a;为何选择Velocity.js 前言 在现代网页设计中&#xff0c;动画效果是提升用户体验的重要手段。 Velocity.js: 一个与 jQuery 动画 API 兼容的动画引擎&#xff0c;以其卓越的性能和丰富的功能&#xff0c;成为了开发者的好工具。 本文将详细介绍…

大数据Flink(一百二十二):阿里云Flink MySQL连接器介绍

文章目录 阿里云Flink MySQL连接器介绍 一、特色功能 二、​​​​​​​语法结构 三、​​​​​​​​​​​​​​WITH参数 阿里云Flink MySQL连接器介绍 阿里云提供了MySQL连接器&#xff0c;其作为源表时&#xff0c;扮演的就是flink cdc的角色。 一、特色功能 MySQ…

【Qt笔记】QToolBox控件详解

目录 引言 一、QToolBox的基本功能 1.1 分页布局 1.2 可点击标签 1.3 图标支持 1.4 信号与槽 二、 QToolBox的属性设置 2.1 设置指定索引位置可用性 2.2 设置指定索引位置图标 2.3 设置标题 2.4 设置提示信息 2.5 获取信息 三、QToolBox的常用API 3.1 构造函数…

前端vue-单选按钮的实现

要把name“sex”和value"男" 和 要把name“sex”和value"女"写上&#xff0c;然后在各自的标签内部写上v-model绑定属性。data中定义v-model的绑定值&#xff0c;后面的值是默认选中的男或者女性。

Google Play金融类应用上了又被下,怎么搞定设备短信权限问题?

不久前谷歌对金融类产品应用更新了政策要求&#xff0c;即8月31日起新注册的开发者账号必须得注册为企业账号才可以上架金融类产品应用&#xff0c;这对原本就是用企业号的开发团队或公司没什么影响&#xff0c;但如果用的是个人号得做点准备了。 可以看出&#xff0c;谷歌对金…

剑灵服务端源码(c#版本+数据库+配套客户端+服务端)

剑灵服务端源码&#xff0c;喜欢的下载研究研究。谁技术牛B的话&#xff0c;能把最新版本的客户端接上&#xff0c;就好了。 剑灵服务端源码&#xff08;c#版本数据库配套客户端服务端&#xff09; 下载地址&#xff1a; 通过网盘分享的文件&#xff1a;【源码】剑灵服务端源码…

利士策分享,自我和解:通往赚钱与内心富足的和谐之道

利士策分享&#xff0c;自我和解&#xff1a;通往赚钱与内心富足的和谐之道 在这个快节奏、高压力的时代&#xff0c;我们往往在追求物质财富的同时&#xff0c;忽略了内心世界的和谐与平衡。 赚钱&#xff0c;作为现代生活中不可或缺的一部分&#xff0c;它不仅仅是生存的手段…