利用R分别绘制配对连线散点图、云雨图、山脊图

news2025/1/16 8:49:19

       大家好,我是带我去滑雪!

       精美的科研绘图总会给人眼前一亮,今天学习利用R绘制多组配对连线散点图、云雨图、山脊图,这三幅图最近都曾出现在Nature Communications (IF 16.6)中,比如配对连线散点图,如下所示:

        因此值得一学,方便后续用于自己的科研论文中,下面逐一进行学习。

目录

1、多组配对连线散点图

(1)什么是配对连线散点图?

(2)应用场景

(3)代码实现

2、云雨图

(1)什么是云雨图?

(2)运用场景

(3)代码实现

3、山脊图

 (1)什么是山脊图?

(2)应用场景

(3)代码实现


1、多组配对连线散点图

(1)什么是配对连线散点图?

       多组配对连线散点图(Paired Line Scatter Plot)是一种用于可视化配对变量之间关系的图表。这种图表通过在图中连接配对点之间的线段,展示两个变量在不同配对观测值之间的关联性。在配对设计的研究中,每个观测都有两个相关的变量的测量结果。这些变量可能是在相同个体或实验单位上测量的两个不同指标,或者是对同一组样本在不同时间点上取得的测量结果。配对连线散点图可用于可视化这两个变量之间的关系,并显示出配对观测之间的连接。

(2)应用场景

       多组散点图结合配对连线和差异分析在很多领域中都可以应用,例如:

       在生物医学研究中,可以使用多组散点图和配对连线来探索不同组别或不同时间点下的相关性和趋势。例如,可以比较药物治疗前后的指标变化,将每个个体的两个时间点的测量结果绘制成散点图,并使用配对线来表示个体之间的相关性。此外,可以使用差异分析方法如配对 t 检验或重复测量方差分析来评估两个时间点之间的差异。

       在执行实验/介入研究研究中,可以使用多组散点图和配对连线来比较不同实验组或处理组之间的结果差异。例如,在药物治疗研究中,可以比较不同药物组或剂量组的治疗效果。绘制每个个体在不同组别下的测量结果散点图,并使用配对连线来表示个体之间的配对关系。然后,使用差异分析方法如方差分析(ANOVA)来评估组别之间的差异。

       在教育研究中,可以使用多组散点图和配对连线来比较教学干预对学生学业成绩的影响。例如,可以比较不同教学方法或教学环境下的学生成绩。绘制每个学生在不同条件下的成绩散点图,并使用配对连线表示每个学生的配对关系。然后,使用差异分析方法如配对 t 检验或重复测量方差分析来评估教学干预的效果。

(3)代码实现

install.packages("tidyverse")
install.packages("reshape2")
install.packages("ggthemes")
install.packages("rstatix")

# 生成示例数据
dt = data.frame(sample = paste0('sample',1:25),
                A = runif(25,5,368),
                B = runif(25,100,400),
                C = runif(25,1,200))
head(dt)
# 长宽转换
library(tidyverse)
library(reshape2)
dt_long <- melt(dt,
                measure.vars = c("A","B",'C'),
                variable.name = "group",
                value.name = "value")
# 绘图
library(ggplot2)
library(ggthemes)
head(dt_long)
# 绘制散点图+配对连线
p1 <- ggplot(dt_long,aes(group, value, fill = group))+
  geom_line(aes(group = sample),
            size = 0.5)+#图层在下,就不会显示到圆心的连线
  geom_point(shape = 21,
             size = 3,
             stroke = 0.6,
             color = 'black')+
  scale_x_discrete(expand = c(-1.05, 0)) + # 坐标轴起始
  scale_fill_manual(values = c('#800040','#fc6666','#108080'))+
  geom_rangeframe() + # 坐标轴分离
  theme_tufte() +
  theme(legend.position = 'none',  # 标签字体等
        axis.text.y = element_text(size = 14,
                                   face = "bold"),
        axis.text.x = element_text(size =14,
                                   face = "bold"),
        axis.title.y = element_text(size = 15, 
                                    color = "black",
                                    face = "bold")) +
  labs(x = ' ', 
       y = 'Values')

p1

# 为了绘制原图的差异形式 手动计算p值
library(rstatix)
result = t_test(dt_long,value~group)  
head(result)

# 添加显著性标记
p2 <- p1 +  
  coord_cartesian(clip = 'off',ylim = c(0,500))+ 
  theme(plot.margin = margin(1,0,0,0.5,'cm'))+ 
  annotate('segment',x=1,xend=1.99,y=510,yend=510,color='black',cex=.6)+
  annotate('segment',x=1,xend=1,y=505,yend=515,color='black',cex=.6)+
  annotate('segment',x=1.99,xend=1.99,y=505,yend=515,color='black',cex=.6)+
  annotate('segment',x=2.01,xend=3,y=510,yend=510,color='black',cex=.6)+
  annotate('segment',x=2.01,xend=2.01,y=505,yend=515,color='black',cex=.6)+
  annotate('segment',x=3,xend=3,y=505,yend=515,color='black',cex=.6)+
  annotate('segment',x=1,xend=3,y=530,yend=530,color='black',cex=.6)+
  annotate('segment',x=1,xend=1,y=525,yend=535,color='black',cex=.6)+
  annotate('segment',x=3,xend=3,y=525,yend=535,color='black',cex=.6)+
  annotate("text", x = 1.5, y = 520, label ="p = 0.080",size = 6)+
  annotate("text", x = 2.5, y = 520, label ="p = 0.129",size = 6)+
  annotate("text", x = 2, y = 540, label ="p = 0.0004",size = 6)
p2
ggsave('绘图.pdf',p2,width = 8,height = 7)

输出结果:

2、云雨图

(1)什么是云雨图?

       云雨图(Cloud and Rain Plot)是一种数据可视化图表,被用于展示不同组别或条件下的数据分布和差异。它是一种变种的多组散点图,结合了散点图和柱状图的特点,以形象地呈现数据的分布情况。通常,对于两组或两组以上的数据展示其特征和比较不同组之间的大致差异时,我们会选择箱线图或箱线图加添加扰动的散点图进行展示。但是,由于箱线图和散点图本身的局限,例如不能提供关于数据分布偏态和尾重程度的精确度量、对于批量比较大的数据批,反应的形状信息更加模糊和用中位数代表总体评价水平有一定的局限性等,人们亟需对数据的信息进行更全面可视化的图形。在这种背景下,云雨图也就孕育而成。顾名思义,云雨图即使“云”(小提琴图半边)和“雨”(散点图),外加箱线图的一种联合体。它通过中位数和置信区间很好地提供了原始数据、概率分布和“一目了然的统计推断”的概述。

      云雨图由两个部分组成:云部分和雨部分。在云部分:使用散点图来展示数据的分布情况。每一个散点代表一个数据点,它们根据 x 轴上的数值来水平分布,并根据 y 轴上的数值来显示垂直位置。云部分的目的是展示数据的分布情况和密度。在雨部分使用柱状图来展示不同组或条件下的数据统计量,通常是均值或中位数。每个柱状图代表一个组别或条件,其高度表示该组别或条件的数据统计量。雨部分的目的是比较不同组别或条件之间的数据差异。

        云雨图的优点是同时展示了数据的分布和差异。云部分提供了对数据分布的直观了解,可以看出数据的聚集程度和离群值的存在。雨部分则强调了组别或条件之间的数值差异,帮助我们理解和比较不同情况下的数据特征。

(2)运用场景

       云雨图适用于多种运用场景,其中一些示例包括:

        第一,在医学研究中,云雨图可用于展示不同患者群体或治疗方案之间的数据分布和差异。例如,在药物研究中,可以使用云雨图展示不同剂量组中患者的生物标志物水平,同时比较各组之间的数据差异。

        第二,在社会科学研究中,云雨图可用于比较不同群体(例如性别、年龄组等)之间的数据分布和差异。例如,在心理学研究中,可以使用云雨图展示不同性别群体在某一心理测量指标上的得分分布,以及性别群体之间的差异。

        第三,在市场调研中,云雨图可用于比较不同市场细分或消费者群体之间的数据分布和差异。例如,对于某种产品或服务的用户调研数据,可以使用云雨图展示不同年龄段或地理位置的用户在关键指标上的得分分布,并比较不同群体之间的数据差异。

       第四,在教育评估中,云雨图可用于比较不同学校、班级或教育介入项目之间的学业成绩或评估指标的数据分布和差异。例如,可以使用云雨图展示不同学校在某一学科考试成绩上的分布,并比较各学校之间的差异。

      第五,在质量控制中,云雨图可用于比较不同生产批次或供应商之间的产品质量数据分布和差异。例如,在制造业中,可以使用云雨图展示不同供应商提供的产品在某项指标上的测试结果分布,并比较各供应商之间的数据差异。

(3)代码实现

install.packages("gghalves")
library(ggplot2)
library(gghalves)

dat <- iris[, c(2, 5), drop = F]
dat$Group <- rep(1:(nrow(dat)/3), times = 3)
head(dat, 5)

## 绘制“云朵” - 小提琴图的左半边
ggplot(dat, aes(x = Species, y = Sepal.Width, fill = Species))+
  geom_half_violin(side = "r", trim = F, color = NA)+
  scale_fill_manual(limits = base::unique(dat$Species),
                    values = rainbow(3))

## 添加“雨滴” - 抖动散点图
ggplot(dat, aes(x = Species, y = Sepal.Width, fill = Species))+
  geom_half_violin(side = "r", trim = F, color = NA, alpha = 0.75,
                   position = position_nudge(x = 0.15, y = 0))+
  geom_point(aes(x = as.numeric(Species) - 0.15, y = Sepal.Width, color = Species),
             position = position_jitter(width = 0.05, seed = 2021), size = 0.8, shape = 19)+
  scale_fill_manual(limits = base::unique(dat$Species),
                    values = rainbow(3))

## 添加箱线图,并更改为经典主题背景
ggplot(dat, aes(x = Species, y = Sepal.Width, fill = Species))+
  geom_half_violin(side = "r", trim = F, color = NA, alpha = 0.75,
                   position = position_nudge(x = 0.15, y = 0))+
  geom_point(aes(x = as.numeric(Species) - 0.15, y = Sepal.Width, color = Species),
             position = position_jitter(width = 0.05, seed = 2021), size = 0.8, shape = 19)+
  geom_boxplot(width = 0.1, alpha = 0.75)+
  scale_fill_manual(limits = base::unique(dat$Species),
                    values = rainbow(3))+
  theme_classic()


## 翻转图形
ggplot(dat, aes(x = Species, y = Sepal.Width, fill = Species))+
  geom_half_violin(side = "r", trim = F, color = NA, alpha = 0.75,
                   position = position_nudge(x = 0.15, y = 0))+
  geom_point(aes(x = as.numeric(Species) - 0.15, y = Sepal.Width, color = Species),
             position = position_jitter(width = 0.05, seed = 2021), size = 0.8, shape = 19)+
  geom_boxplot(width = 0.1, alpha = 0.75)+
  scale_fill_manual(limits = base::unique(dat$Species),
                    values = rainbow(3))+
  coord_flip()+
  theme_classic()
p2=ggplot(dat, aes(x = Species, y = Sepal.Width, fill = Species))+
  geom_half_violin(side = "r", trim = F, color = NA, alpha = 0.75,
                   position = position_nudge(x = 0.15, y = 0))+
  geom_point(aes(x = as.numeric(Species) - 0.15, y = Sepal.Width, color = Species),
             position = position_jitter(width = 0.05, seed = 2021), size = 0.8, shape = 19)+
  geom_boxplot(width = 0.1, alpha = 0.75)+
  scale_fill_manual(limits = base::unique(dat$Species),
                    values = rainbow(3))+
  coord_flip()+
  theme_classic()

ggsave('绘图2.pdf',p2,width = 8,height = 7)

输出结果:

3、山脊图

 (1)什么是山脊图?

       山脊图(Ridge Plot)是一种数据可视化图表,用于展示多个核密度估计曲线(Kernel Density Estimation, KDE)的堆叠。它被用于可视化多个分布的形状和相对关系,尤其在比较不同组别或条件下的数据分布时非常有用。在山脊图中,每个核密度估计曲线代表一个组别或条件。这些曲线在水平轴上对齐,并根据其相对密度进行堆叠,形成一种山脊状的图像。曲线的高度表示对应组别的相对密度或频率。

       山脊图通常使用半透明的颜色来绘制曲线,使得堆叠的部分可以透过看到下方的曲线,以显示整体和局部的分布情况。同时,可以通过曲线的颜色来区分不同组别或条件。

(2)应用场景

       第一,在统计分析和数据探索中,山脊图可以展示不同样本、组别或条件下的数据分布情况,帮助研究人员观察和比较分布的形状、峰值位置和相对密度。

       第二,在机器学习和分类任务中,山脊图可用于可视化不同类别的特征变量分布,帮助理解类别之间的相似性和差异性,从而指导特征选择和模型建立。

       第三,在市场研究和用户行为分析中,山脊图可用于展示不同用户群体或市场细分的行为数据分布,例如购买行为、用户偏好等,以辅助市场定位和目标用户群体的识别。

(3)代码实现

install.packages("ggridges")
install.packages("cols4all")
library(ggridges)
library(ggplot2)
library(cols4all)

df <- iris
df
p <- ggplot(data = df,
            aes(x = Sepal.Length, y = Species, fill = Species)) +
  geom_density_ridges() +
  theme_classic()
p
ggsave('绘图3.pdf',p,width = 8,height = 7)

输出结果:

需要数据集的家人们可以去百度网盘(永久有效)获取:

链接:https://pan.baidu.com/s/1E59qYZuGhwlrx6gn4JJZTg?pwd=2138
提取码:2138 


更多优质内容持续发布中,请移步主页查看。

   点赞+关注,下次不迷路!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/755647.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AI智能助手的未来:与人类互动的下一代人工智能技术

自我介绍⛵ &#x1f4e3;我是秋说&#xff0c;研究人工智能、大数据等前沿技术&#xff0c;传递Java、Python等语言知识。 &#x1f649;主页链接&#xff1a;秋说的博客 &#x1f4c6; 学习专栏推荐&#xff1a;人工智能&#xff1a;创新无限、MySQL进阶之路、C刷题集、网络安…

AIGC文生图:使用ControlNet 控制 Stable Diffusion

1 ControlNet介绍 1.1 ControlNet是什么&#xff1f; ControlNet是斯坦福大学研究人员开发的Stable Diffusion的扩展&#xff0c;使创作者能够轻松地控制AI图像和视频中的对象。它将根据边缘检测、草图处理或人体姿势等各种条件来控制图像生成。 论坛地址&#xff1a;Adding…

操作系统进行设备控制的方式

一.I/O控制方式 上一篇的博客介绍了设备管理的一些概念基础知识点&#xff0c;其中I/O控制方式这一块没有详细说明。设备管理的主要任务之一是控制设备和内存或CPU之间的数据传送。外围设备和内存之间的输入/输出控制方式有4种&#xff0c;下面分别加以介绍。 二.程序直接控制…

ITIL 4—事件管理实践

1 关于本文 本文档提供事件管理实践实用指南。分为五个主要部分&#xff0c;内容包括&#xff1a; 本实践的一般信息实践的流程和活动及其在服务价值链中的作用参与实践的组织和人员支持实践的信息和技术对实践的合作伙伴和供应商的考虑。 1.1 ITIL4 认证方案 本文档的部分…

Ubuntu 安装 Docker

本文目录 1. 卸载旧版本 Docker2. 更新及安装工具软件2.1 更新软件包列表2.2 安装几个工具软件2.3 增加一个 docker 的官方 GPG key2.4 下载仓库文件 3. 安装 Docker3.1 再次更新系统3.2 安装 docker-ce 软件 4. 查看是否启动 Docker5. 验证是否安装成功 1. 卸载旧版本 Docker …

图片文字对齐 图片文字居中对齐

方法一: 用 vertical-align: middle; <view class="container"><view class="search"><image src="../../images/icon/search.png" alt="" /><text class="tex">搜索</text></view>&…

手写对象浅比较(React中pureComponent和Component区别)

PureComponent和Component的区别 PureComponent会给类组件默认加一个shouldComponentUpdate这样的周期函数 //PureComponent类似自动加了这段shouldComponentUpdate(nextProps,nextState){let { props, state } this;// props/state:修改之前的属性状态// nextProps/nextState…

layui入门增删改查

layui入门增删改查 创建Lauiyi对象1.后台准备1.dao方法2.子实现类 2.R工具类的使用3.查询前端代码实现前端页面 4.增删改实现2.浮层3分离的js代码1.userManage.js2.userEdit.js3.index.js 5.运行效果 作为一名开发人员&#xff0c;我们经常需要对数据库中的数据进行增删改查&am…

120、仿真-51单片机温湿度光照强度C02 LCD1602 报警设计(Proteus仿真+程序+元器件清单等)

方案选择 单片机的选择 方案一&#xff1a;STM32系列单片机控制&#xff0c;该型号单片机为LQFP44封装&#xff0c;内部资源足够用于本次设计。STM32F103系列芯片最高工作频率可达72MHZ&#xff0c;在存储器的01等等待周期仿真时可达到1.25Mip/MHZ(Dhrystone2.1)。内部128k字节…

刷题 DAY4

题目1 给定一个有序数组arr&#xff0c;给定一个正数aim (1)返回累加和为aim的&#xff0c;所有不同二元组 (2)返回累加和为aim的&#xff0c;所有不同三元组 问题一 暴力的解法就是 遍历每一个二元组 找和为aim的 当然 只用暴力解很难ac 想一想有序 那肯定就是能加速 我们…

RocketMQ下载安装、集群搭建保姆级教程

目录 1.下载安装 2.配置 3.测试 4.集群配置 4.1.规划 4.2.环境准备 4.3.节点配置 4.3.1.master1 4.3.2.slave2 4.3.3.master2 4.3.4.slave1 4.4.启动 4.5.测试 1.下载安装 前置条件&#xff1a; JDK环境 下载地址&#xff1a; 下载 | RocketMQ 博主下载的是4.…

排序算法笔记--摩尔投票算法

摩尔投票算法 摩尔投票算法是一种用于在数组中查找出现次数超过一半的元素的有效算法。算法的核心思想是利用候选元素和计数器进行投票&#xff0c;通过消除不同元素之间的抵消来找到出现次数超过一半的元素。 算法原理 如果数组中存在一个出现次数超过一半的元素&#xff0…

【从零开始学习CSS | 第三篇】选择器优先级

目录 前言&#xff1a; 常见选择器的优先级&#xff08;从高到低&#xff09; 选择器的权重&#xff1a; 总结&#xff1a; 前言&#xff1a; 在前几篇文章中我们介绍了大量的选择器&#xff0c;那么大量的选择器在使用的时候&#xff0c;一定是有一个优先级顺序的&#xff…

graylog源码搭建

这里主要讲如何源码安装graylog 下载地址&#xff1a; https://www.graylog.org/downloads/ 下载带有JVM的源码文件源码安装 下载graylog-5.1.3-linux-x64.tgz&#xff0c;并上传到Centos中&#xff0c;执行以下操作 tar -zxvf graylog-5.1.3-linux-x64.tgzcd /etcmkdir -p …

Python GUI编程利器:Tkinker中的颜色选择对话框(15)

小朋友们好&#xff0c;大朋友们好&#xff01; 我是猫妹&#xff0c;一名爱上Python编程的小学生。 和猫妹学Python&#xff0c;一起趣味学编程。 今日目标 学习Tkinter中的颜色对话框的使用&#xff0c;实现如下效果&#xff1a; 颜色选择对话框 颜色选择对话框可以提供一…

JavaWeb 笔记——6

JavaWeb 笔记——6 一、Vue1.1、Vue-概述1.2、Vue快速入门1.3、Vue常用指令1.3、Vue生命周期1.4、查询所有-案例1.5、新增品牌-案例 二、Element2.1、Element概述2.2、快速入门2.3、Element布局2.4、常用组件 三、综合案例3.1、换件搭建3.2、查询所有3.3、新增品牌3.4、Servlet…

集群基础2——LVS负载均衡apache(nat模式)

文章目录 一、环境说明一、配置调度器网卡二、配置后端服务器三、配置调度器四、验证五、设置https负载均衡 一、环境说明 使用lvs中的nat模型&#xff0c;对apache负载均衡集群。 主机IP角色安装服务真实IP&#xff1a;192.168.161.129VIP&#xff1a;192.168.161.130调度服务…

证照之星软件怎么样?证照之星怎么换背景色

随着科技的快速发展&#xff0c;越来越多的软件应用于各个方面&#xff0c;为人们的生活和工作带来便利。今天&#xff0c;我们要介绍的就是一款证件照制作方面的软件——证照之星。那么&#xff0c;证照之星到底是什么软件&#xff1f;它好用吗&#xff1f;这篇文章将为大家详…

【PHP面试题45】cgi与fast_cgi关系是怎么样的

文章目录 一、CGI与FastCGI简介二、CGI与FastCGI的关系三、CGI与FastCGI的应用场景四、总结 一、CGI与FastCGI简介 本文已收录于PHP全栈系列专栏&#xff1a;PHP面试专区。 计划将全覆盖PHP开发领域所有的面试题&#xff0c;对标资深工程师/架构师序列&#xff0c;欢迎大家提前…

解析!1V1直播源码开发搭建技术实时语音识别翻译功能的应用

语言是我们人类交流的工具&#xff0c;它的种类繁多&#xff0c;比如世界语言&#xff0c;像是中国的汉语、英国的英语、法国的法语等&#xff1b;又或是我们中国的方言&#xff0c;像是山东话、北京话、上海话等。可谓是五花八门&#xff0c;争奇斗艳&#xff0c;每一种世界语…