R可视乎|灯芯柱状图代码解读

news2024/11/23 14:57:25

简介

这篇推文代码来源于:TidyTuesday,主要想学习如何绘制灯芯柱状图(名字小编瞎取的),最终结果如下:

注释:与普通柱状图相比,灯芯柱状图不仅可以展示随时间变化的总体趋势(图中黑色柱子 “Rescues”),而且能够清晰展示灯芯内部数据(图中浅灰色柱子 “cats”)相对于总体的比例随时间的变化。

看到最终成品,读者是否可以根据自己所学知识,回答以下几个问题:

  1. 如何实现两个柱状图嵌套?

  2. 如何使得2020年份数据单独显示为粉色?

  3. 如何在柱状图上方添加文字,其中一些文字包括其他单词?

接下来,小编带你解读源代码,并回答以上问题。读者可以根据这些知识要点,灵活应用到其他图形中。

数据介绍

从文件 animal_rescues.txt 中读取数据,并对数据进行预处理,包括分类汇总和计数。

注意:由于时间和文章篇幅原因,数据处理部分不做过多介绍。读者可以根据格式,使用自己比较感兴趣的数据。

library(tidyverse)
library(ggtext)
library(ggrepel)
library(patchwork)
library(systemfonts)
# 数据读取+处理 ========
df_animals <- readr::read_csv('animal_rescues.txt')

df_animals_agg <-
  df_animals %>% 
  mutate(
    animal_group_aggregated = case_when(
      str_detect(animal_group_parent, "Domestic|Livestock|Farm|Horse|Cow|Sheep|Goat|Lamb|Bull") ~ "Other Domestic Animals",
      animal_group_parent %in% c("Cat", "cat") ~ "Cats",
      animal_group_parent %in% c("Bird", "Budgie") ~ "Birds",
      animal_group_parent == "Dog" ~ "Dogs",
      animal_group_parent == "Fox" ~ "Foxes",
      TRUE ~ "Other Wild Animals"
    )
  ) %>% 
  count(cal_year, animal_group_aggregated) %>% 
  group_by(animal_group_aggregated) %>% 
  mutate(
    total = sum(n),
    current = n[which(cal_year == 2021)]
  ) %>% 
  ungroup() %>% 
  mutate(
    animal_group_aggregated = fct_reorder(animal_group_aggregated, total),
    animal_group_aggregated = fct_relevel(animal_group_aggregated, "Other Domestic Animals", after = 0),
    animal_group_aggregated = fct_relevel(animal_group_aggregated, "Other Wild Animals", after = 0)
  )

df_animals_labs <-
  df_animals_agg %>% 
  filter(cal_year == 2016) %>% 
  group_by(animal_group_aggregated) %>% 
  mutate(n = case_when(
    animal_group_aggregated == "Cats" ~ 320,
    animal_group_aggregated %in% c("Birds", "Dogs") ~ 135,
    TRUE ~ 55
  ))

df_animals_annotate <-
  df_animals_agg %>% 
  mutate(label = "\n\n← Number of Rescues in 2021 so far.") %>% 
  filter(cal_year == 2021 & animal_group_aggregated == "Cats")

df_animals_sum <-
  df_animals_agg %>% 
  filter(cal_year < 2021) %>% 
  group_by(cal_year) %>% 
  summarize(n = sum(n))

绘图主要使用 df_animals_sum,以下是该数据预览:

画图

绘图代码使用了 R 中的多个包(tidyverse, ggtext, ggrepel, patchwork, systemfonts)来创建一个特定风格的统计图表。以下是代码的主要步骤和功能:

设置主题和风格:

设置基础主题为 theme_minimal,指定了基本字体大小和字体家族。使用 theme_update 对不同图表元素进行自定义,包括文本样式、轴样式、网格线样式等。

# 主题设置 ====== 
theme_set(theme_minimal(base_size = 19))
# 自定义主题细节
theme_update(
  text = element_text(color = "grey12"),
  axis.title = element_blank(),
  axis.text.x = element_text(),
  axis.text.y = element_blank(),
  panel.grid.major.y = element_blank(),
  panel.grid.minor = element_blank(),
  plot.margin = margin(20, 5, 10, 10),
  plot.subtitle = element_textbox_simple(size = 14, lineheight = 1.6),
  plot.title.position = "plot",
  plot.caption = element_text( color = "#b40059", hjust = .5, size = 10, margin = margin(35, 0, 0, 0))
)

数据可视化

为了更好解读代码中的细节部分,小编将代码进行分解,一步步展示细节内容。完整绘图代码见文末,或者可以在我的 Github 中找到源代码和数据。

  1. 创建一个柱状图 (geom_col) 表示不同年份的动物救援数量。
  df_animals_sum %>% 
  ggplot(aes(cal_year, n)) +
  geom_col(aes(fill = factor(cal_year)), width = .85) 

  1. 再添加一个柱状图,指定 datafill 参数,并通过修改 width 实现嵌套。这里数据进行过滤,选择 2021 年前数据,并且选择 animal_group_aggregated == "Cats"。另一个细节:alpha = cal_year == 2020 透明度根据是否 cal_year==2000 进行设置。 如果是则 fill = “white”。
geom_col(
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021),
    aes(alpha = cal_year == 2020), # 这里有细节!
    fill = "white", width = .5 # 宽度和透明度设置
  )

加入该代码后,绘图结果为:

  1. 使用 geom_text 在图上添加文本标签。对数据进行处理,添加新列文本数据,实现添加其他文字。df_animals_sum %>% mutate(n_lab = if_else(cal_year %in% c(2009, 2020), paste0(n, "\nRescues"), as.character(n)))
  geom_text( #添加文本+加入rescues
    data = df_animals_sum %>% 
      mutate(n_lab = if_else(cal_year %in% c(2009, 2020), paste0(n, "\nRescues"), as.character(n))),
    aes(label = n_lab), size = 4.3, lineheight = .8, 
    nudge_y = 12, vjust = 0, color = "grey12", fontface = "bold"
  ) +
  geom_text( #添加文本+加入cats
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021) %>% 
      mutate(n_lab = if_else(cal_year %in% c(2009, 2020), paste0(n, "\nCats"), as.character(n))), 
    aes(label = n_lab), 
    color = "white", lineheight = .8, size = 4.3, 
    nudge_y = 12, vjust = 0, fontface = "bold"
  ) +
  geom_text( # 手动添加年份标签
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021),
    aes(y = -15, label = cal_year, color = factor(cal_year)), 
    size = 6, hjust = .5, vjust = 1
  ) 

  1. 调整图表样式:自定义图表的标题、副标题、图例等元素的样式。通过 scale_fill_manual(values = c(rep("grey30", 11), "#b40059"), guide = "none") 实现手动颜色填充,突出 2020 年数据。
  coord_cartesian(clip = "off") +
  scale_y_continuous(limits = c(-15, NA)) +
  scale_color_manual(values = c(rep("grey30", 11), "#b40059"), guide = "none") +
  scale_fill_manual(values = c(rep("grey30", 11), "#b40059"), guide = "none") +
  scale_alpha_manual(values = c(.25, .4), guide = "none") +
  theme(
    # plot.title = element_markdown(size = 28, margin = margin(5, 35, 25, 35), color = "black"),
    # plot.subtitle = element_textbox_simple(margin = margin(5, 35, 15, 35)),
    panel.grid.major = element_blank(),
    axis.text.x = element_blank()
  )

最终结果如下:

绘图完整代码

   df_animals_sum %>% 
  ggplot(aes(cal_year, n)) +
  geom_col(aes(fill = factor(cal_year)), width = .85) +
  geom_col(
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021),
    aes(alpha = cal_year == 2020), # 这里有细节!
    fill = "white", width = .5 # 宽度和透明度设置
  ) +
  geom_text( #这里的数据处理:添加文本+加入rescues
    data = df_animals_sum %>% 
      mutate(n_lab = if_else(cal_year %in% c(2009, 2020), paste0(n, "\nRescues"), as.character(n))),
    aes(label = n_lab), size = 4.3, lineheight = .8, 
    nudge_y = 12, vjust = 0, color = "grey12", fontface = "bold"
  ) +
  geom_text( #添加文本+加入cats
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021) %>% 
      mutate(n_lab = if_else(cal_year %in% c(2009, 2020), paste0(n, "\nCats"), as.character(n))), 
    aes(label = n_lab), 
    color = "white", lineheight = .8, size = 4.3, 
    nudge_y = 12, vjust = 0, fontface = "bold"
  ) +
  geom_text( # 手动添加年份标签
    data = df_animals_agg %>% filter(animal_group_aggregated == "Cats" & cal_year < 2021),
    aes(y = -15, label = cal_year, color = factor(cal_year)), 
    size = 6, hjust = .5, vjust = 1
  ) +
  coord_cartesian(clip = "off") +
  scale_y_continuous(limits = c(-15, NA)) +
  scale_color_manual(values = c(rep("grey30", 11), "#b40059"), guide = "none") +
  scale_fill_manual(values = c(rep("grey30", 11), "#b40059"), guide = "none") +
  scale_alpha_manual(values = c(.25, .4), guide = "none") +
  theme(
    # plot.title = element_markdown(size = 28, margin = margin(5, 35, 25, 35), color = "black"),
    # plot.subtitle = element_textbox_simple(margin = margin(5, 35, 15, 35)),
    panel.grid.major = element_blank(),
    axis.text.x = element_blank()
  )

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1071729.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AQS内部的体系架构

AQS本质上是一个双向队列&#xff0c;加一个状态位state。内部靠Node节点形成队列。 AQS由state和CLH变体的虚拟双端队列组成。 AQS的内部类Node类 属性说明&#xff1a; 内部结构&#xff1a;

继续改进 另外一种方法 还是可以用CourseExend类

优势&#xff1a;可以映射许多类上 很强大 用在名称不统一上 原理 1.先把查询结果包装 取新别名&#xff08;&#xff08; 就是结果集的映射&#xff08;&#xff09; 2.把中结果集映射相应的pojo类上 第一步基于类创建 第二步 注意字属性的写法 teacher 是属性 属性的属性 …

手机待办事项app哪个好?

手机是日常很多人随身携带的设备&#xff0c;手机除了拥有通讯功能外&#xff0c;还能帮助大家高效管理日常工作&#xff0c;借助手机上的待办事项提醒APP可以快速地帮助大家规划日常事务&#xff0c;提高工作的效率。 过去&#xff0c;我也曾经在寻找一款能够将工作任务清晰罗…

33 WEB漏洞-逻辑越权之水平垂直越权全解

目录 前言水平&#xff0c;垂直越权&#xff0c;未授权访问Pikachu-本地水平垂直越权演示(漏洞成因)墨者水平-身份认证失效漏洞实战(漏洞成因)原理越权检测-Burpsuite插件Authz安装测试(插件使用)修复防御方案 前言 越权漏洞文章分享&#xff1a;https://www.cnblogs.com/zhen…

LockSupport是做什么的?深入理解Java的三种线程等待通知机制

文章目录 一、LockSupport概述1、LockSupport是什么2、三种等待唤醒机制3、其他线程等待唤醒方式&#xff08;了解&#xff09; 二、代码实例分析1、使用wait()notify()&#xff08;1&#xff09;代码实例&#xff08;2&#xff09;分析总结 2、使用await()signal()&#xff08…

乌班图20.04简易部署k8s+kuboard第三方面板

1. 问题&#xff1a; 使用官方只能说步骤挺全。 &#x1f604;出错&#xff1f;出错不管&#xff0c;无论是系统问题&#xff0c;版本兼容问题&#xff0c;网络插件问题&#xff0c;还是防火墙问题&#xff0c;我只能说特异性问题分析检索起来很难很难。 新人很难搞懂&#x…

基于指数趋近律的机器人滑模轨迹跟踪控制算法及MATLAB仿真

机械手是工业制造领域中应用最广泛的自动化机械设备&#xff0c;广泛应用于工业制造、医疗、军工、半导体制造、太空探索等领域。它们虽然形式不同&#xff0c;但都有一个共同的特点&#xff0c;即能够接受指令&#xff0c;并能准确定位到三维(或二维)空间的某一点进行工作。由…

RabbitMQ之topic(主题)Exchange解读

目录 基本介绍 使用场景 演示架构 工程概述 RabbitConfig配置类&#xff1a;创建队列及交换机并进行绑定 MessageService业务类&#xff1a;发送消息及接收消息 主启动类RabbitMq01Application&#xff1a;实现ApplicationRunner接口 基本介绍 在rabbitmq中&#xff0c;…

【目标检测】大图包括标签切分,并转换成txt格式

前言 遥感图像比较大&#xff0c;通常需要切分成小块再进行训练&#xff0c;之前写过一篇关于大图裁切和拼接的文章【目标检测】图像裁剪/标签可视化/图像拼接处理脚本&#xff0c;不过当时的工作流是先将大图切分成小图&#xff0c;再在小图上进行标注&#xff0c;于是就不考…

[NewStarCTF 2023 公开赛道] week1 Crypto

brainfuck 题目描述&#xff1a; [>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<-]>>>>>>>.>----.<-----.>-----.>-----.<<<-.>>..…

深入了解归并排序:原理、性能分析与 Java 实现

归并排序&#xff08;Merge Sort&#xff09;是一种高效且稳定的排序算法&#xff0c;其优雅的分治策略使它成为排序领域的一颗明珠。它的核心思想是将一个未排序的数组分割成两个子数组&#xff0c;然后递归地对子数组进行排序&#xff0c;最后将这些排好序的子数组合并起来。…

在JavaScript中,什么是IIFE(Immediately Invoked Function Expression)?它的作用是什么?

聚沙成塔每天进步一点点 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 欢迎来到前端入门之旅&#xff01;感兴趣的可以订阅本专栏哦&#xff01;这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发…

现代化战机之路:美国空军U-2侦察机基于Jenkins和k8s的CI/CD架构演进

▲ 点击上方"DevOps和k8s全栈技术"关注公众 华为北京研究所Q27大楼 随着技术的不断进步&#xff0c;军事领域也在积极采纳现代化工具来提高战备水平和效率。美国空军的U-2侦察机项目是一个鲜明的例子&#xff0c;它成功地借助Jenkins和Kubernetes&#xff08;k8s&…

Oracle修改数据之后提交事务如何回滚?

在 MySQL 和 Oracle 数据库中&#xff0c;事务提交后都无法回滚。 在 MySQL 中&#xff0c;恢复机制是通过回滚日志&#xff08;undo log&#xff09;实现的&#xff0c;所有事务进行的修改都会先记录到这个回滚日志中&#xff0c;然后在对数据库中的对应行进行写入。当事务已经…

IDE环境要注意统一编码,否则出现中文乱码找不到头绪

最近遇到在IDEA开发项目时&#xff0c;保存中文为乱码的现象&#xff0c;如图&#xff1a; 看了项目配置文件的编码都是UTF-8&#xff0c;在别的开发机上运行都正常&#xff0c;就是这台机器上有问题。 同事一时也找不到方法&#xff0c;因为没遇到同样的事情。 一直怀疑是编…

Spring源码解析——IOC之循环依赖处理

什么是循环依赖 循环依赖其实就是循环引用&#xff0c;也就是两个或则两个以上的bean互相持有对方&#xff0c;最终形成闭环。比如A依赖于B&#xff0c;B依赖于C&#xff0c;C又依赖于A。如下图所示&#xff1a; 注意&#xff0c;这里不是函数的循环调用&#xff0c;是对象的相…

tcpdump(三)命令行参数讲解(二)

一 tcpdump实战详解 骏马金龙tcpdump详解 强调&#xff1a; 注意区分选项参数和过滤条件 本文继上篇 网卡没有开启混杂模式 tcpdump默认开启混杂模式 --no-promiscuous-mode --> 可以指定在非混杂模式抓包 ① -vv 控制详细内容的输出 ② -s -s 长度: 可以只…

基于Java的社区生鲜在线电商平台设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序&#xff08;小蔡coding&#xff09;有保障的售后福利 代码参考源码获取 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作…

【排序算法】选择排序

文章目录 一&#xff1a;基本介绍1.1 概念1.2 算法思想1.3 思路分析图1.4 思路分析1.5 总结1.5.1 选择排序一共有数组大小-1轮排序1.5.2 每一轮排序&#xff0c;又是一个循环&#xff0c;循环的规则如下&#xff08;在代码中实现&#xff09;&#xff1a; 二&#xff1a;代码实…

大数据——Spark Streaming

是什么 Spark Streaming是一个可扩展、高吞吐、具有容错性的流式计算框架。 之前我们接触的spark-core和spark-sql都是离线批处理任务&#xff0c;每天定时处理数据&#xff0c;对于数据的实时性要求不高&#xff0c;一般都是T1的。但在企业任务中存在很多的实时性的任务需求&…