ggpubr包是个很经典的R包,能绘制专业的论文绘图,它是对ggplot2进行了加强,R包的说明也是介绍用于创建和自定义基于“ggplot2”的出版物绘图,就是个为SCI而生的R包呀,今天咱们使用ggpubr绘制专业的论文需要的带统计数据的箱线图
下面咱们开始,先导入R包和数据,使用R软件自带的ToothGrowth数据
library(ggpubr)
data("ToothGrowth")
df <- ToothGrowth
这是R软件自带的数据,描述维生素C对豚鼠牙齿生长的影响,结果是60只豚鼠的成牙本质细胞(负责牙齿生长的细胞)的长度。每只动物通过两种递送方法之一,即橙汁或抗坏血酸(维生素C的一种形式,编码为VC),接受三种剂量水平的维生素C(0.5、1和2 mg/天)中的一种。
Len:牙齿长度,supp干预方式,有维生素C或者抗坏血栓2种(VC or OJ)。Dose:药物的剂量。
绘制箱线图的函数是ggboxplot函数,咱们先来绘制个基础箱线图,x是类别,如果是数字的话要转成因子。Y是牙齿长度,需要是连续变量。
p <- ggboxplot(data=ToothGrowth, x = "supp", y = "len",
color = "supp", palette = "npg", add = "jitter")
p
palette是调色板,看你需要那中风格,有"npg", “aaas”, “lancet”, “jco”, “ucscgb”, “uchicago”, “simpsons” and “rickandmorty”.可选。咱们换个风格看看
p <- ggboxplot(data=ToothGrowth, x = "supp", y = "len",
color = "supp", palette = "ucscgb", add = "jitter")
p
add = "jitter"是加上散点,我们不加试一下
p <- ggboxplot(data=ToothGrowth, x = "supp", y = "len",
color = "supp", palette = "ucscgb")
p
ggpubr包的优点是可以计算相关数据的统计值,并且优美的展现出来,下面咱们来演示一下,给它添加一个P值
p + stat_compare_means()
默认的是Wilcoxon秩和检验,假如我们想换成T检验
p + stat_compare_means(method = "t.test")
假如咱们想对两个数据进行配对比较
ggpaired(ToothGrowth, x = "supp", y = "len",
color = "supp", line.color = "gray", line.size = 0.4,
palette = "ucscgb")+
stat_compare_means(paired = TRUE)
假如咱们想进行更多的组别比较,比如说对不同的计量进行比较,先要进行设定要比较的组,这里设定0.5,1,2这3个组比较
my_comparisons <- list( c("0.5", "1"), c("1", "2"), c("0.5", "2") )
绘图
ggboxplot(ToothGrowth, x = "dose", y = "len",
color = "dose", palette = "npg")+
stat_compare_means(comparisons = my_comparisons, label.y = c(29, 35, 40))+
stat_compare_means(label.y = 45)
假如咱们设置0.5这组为参考组,其他组和它进行比较,这里使用了anova的方法
# Multiple pairwise test against a reference group
ggboxplot(ToothGrowth, x = "dose", y = "len",
color = "dose", palette = "npg")+
stat_compare_means(method = "anova", label.y = 40)+ # Add global p-value
stat_compare_means(aes(label = after_stat(p.signif)),
method = "t.test", ref.group = "0.5")
也可以进行亚组数据中相关类别的比较,非常实用。这里选择的是药物dose的剂量为分组
p <- ggboxplot(ToothGrowth, x = "supp", y = "len",
color = "supp", palette = "npg",
add = "jitter",
facet.by = "dose", short.panel.labs = FALSE)
p
也可以求出每组的P值
p + stat_compare_means(
aes(label = paste0("p = ", after_stat(p.format)))
)
表明在不同剂量下。不同药物对老鼠的牙齿影响有区别。
最后总结一下,这个是个非常使用的R包,有非常多的使用绘图函数。