Class 07 - 功能包的安装和 tidyverse 介绍
- tidyverse 简介
- 功能包(package)的安装
- tidyverse 的安装
- 功能包(package)的加载
- tidyverse 的加载
- 功能包(package)的更新
- tidyverse 核心功能
- browseVignettes 函数
tidyverse 简介
众多的功能包是使 R语言 在分析数据中表现出色的重要组成部分。
功能包提供了很有用的代码组合、可重复使用的 R 函数、说明文档 和示例数据集。 对于许多数据分析师来说,排在众多有用功能包列表顶部的是 tidyverse。 tidyverse 实际上是 R语言 中的功能包组(由多个功能包组合而成),集成具有用于数据操作、数据探索和数据可视化的全部功能。
tidyverse 的社区支持也很强大。 这也是为什么 tidyverse 被认为是大多数 R语言 用户编程的关键功能包的原因之一。 在网上也可以搜索到许多与 tidyverse 相关的教程和示例。
功能包(package)的安装
在R语言中,安装功能包(package),可以使用 install.packages()
函数,记得需要链接网络,然后在括号中输入需要安装的功能包名字,程序就会自动搜索匹配功能包的名字,找到后就会自动下载安装,如果输入的名字不正确,就会报错提示你说找不到这个名字的功能包。
tidyverse 的安装
那么首先就让我们来安装 tidyverse
。打开 RStudio。
我们首先输入 install.packages()
。 然后,在括号中输入tidyverse
, 可以加引号也可以不加不是是必需的,但最好是加上引号来确保我们的准确性。 运行代码然后等待 RStudio 安装 tidyverse。
install.packages("tidyverse")
等待 RStudio 安装 tidyverse 包(请耐心等待,这可能需要一点时间,根据网络的好坏)。 完成后会收到一条消息,说明安装已完成。
功能包(package)的加载
在R语言中,使用功能包(package)的时候,需要先让程序加载这个功能包(package),需要用到library()
函数,然后在括号中输入需要使用的功能包名字,程序就会加载这个包,这样在后续的代码中就能使用这个包的函数了。
tidyverse 的加载
安装 tidyverse 包后,需要让程序加载它们才能使用。 使用 library()
命令加载tidyverse
。 核心 tidyverse
包含几个主要包,它们能够协同工作,使你的数据分析高效便捷。
要加载 tidyverse,需要输入 library(tidyverse)
,然后运行程序。
library(tidyverse)
-
控制台中的输出表示已经加载了核心 tidyverse功能包。 每个核心功能包旁边都有一个绿色对勾。
-
同时,输出还列出了冲突问题。 冲突报告哪些函数在两个个或多个功能包中具有相同的名称。
-
由于我们最近加载了 tidyverse 包,因此它们将成为当前会话的默认包。
功能包(package)的更新
时代在发展,科技在进步,哈哈哈
R语言的社区很活跃,很多功能包都有人在维护和更新升级,使得R语言使用起来更方便功能更强大。我们也需要定期或不定期的去更新功能包。这时候可以使用update.packages()
函数,可以用来更新全部已经安装的功能包。
只需在程序中输入update.packages()
,然后运行代码就OK了,坐等程序下载安装。
update.packages()
tidyverse 核心功能
前面我们已经完成了 tidyverse 功能包的安装,加载还有更新等功能。下面我们来介绍下 tidyverse 中我们会经常用到的核心功能。
在我们加载 tidyverse 时,控制台中已经用对号表示了9个核心的功能包。如下:
- dplyr
- readr
- forcats
- stringr
- ggplot2
- tibble
- lubridate
- tidyr
- purrr
其中有四个包是数据分析师的工作流程中需要经常使用到的包。
- ggplot2
- dplyr
- tidyr
- readr
这四个包的作用如下:
ggplot2 : 用于数据可视化,特别是绘图。 使用 ggplot2,可以通过将不同的视觉属性应用于数据变量来创建各种各样的图表,并且效果十分美观。 这是 ggplot2 的一个例子。之后我们也会讲到将如何使用 ggplot2 绘图。
dplyr : 提供了一组一致的函数来帮助你完成一些常见的数据操作任务。 例如,select 函数根据名称选择变量,filter 函数查找满足特定条件的情况。
tidyr : 是一个用于数据清洗的包,可以让数据变得整洁。可以使用 tidyr处理宽数据和长数据。
readr :它用于导入数据。 readr 中最常见的函数是 read_csv
。 这会将 CSV 文件导入 R。CSV 加粗样式文件包含以表格格式以逗号分隔的数据。 要使用 readr 准确读取数据集,需要将该函数与列规范结合使用。
所以这就是 tidyverse 中的四个非常有用的工具包, 它们都会使你在 R 中的编程更加直接和高效。
browseVignettes 函数
browseVignettes 函数可以帮助你了解某个功能包(package)在解决的问题以及所包含的功能的详细信息(会直接打开对应的网页)。
例如,如果用 ggplot2 来执行 browseVignettes()
函数。
只需要输入browseVignettes('ggplot2')
,
browseVignettes('ggplot2')
程序会打开一个网页,显示以下结果:
如果你想要更深层的了解不同包的功能 ,那么这个函数可以帮到你。