1.R语言
R语言是一种数学编程语言,主要用于统计分析、绘图和数据挖掘。
2.R语言特点
- 免费、开源,兼容性好(Windows、MacOS或Linux)。
- 具有多种数据类型,如向量、矩阵、因子、数据集等常用数据结构。
- 多用于交互式数据分析,图形功能,更易于统计分析。
3.参考资料
3.1 参考书
- Hadley Wickham and Garrett Grolemund(2022). R for Data Science,R for Data Science (2e), 2nd ed. 讲基本的数据整理、汇总。
- Susan Holmes, Wolfgang Huber(2020). Modern Statistics for Modern Biology, Modern Statistics for Modern Biology.
- R的统计功能在生物学中的应用。
3.2 其它
- R网站上的初学者手册“An Introduction to R”和其它技术手册。
- 北京大学李东风在线课程讲义:R语言教程 (pku.edu.cn)
- 菜鸟教程:R 语言教程 | 菜鸟教程 (runoob.com)
4.安装R
官方网址:Download R-4.3.2 for Windows. The R-project for statistical computing.
根据向导下一步,注意安装路劲。
所有编程教程中的第一段代码打印“Hello,world”
5.RStudio安装
RStudio(Posit | The Open-Source Data Science Company)是功能更强的一个R图形界面, 在安装好R的官方版本后安装RStudio可以更方便地使用R。建议使用RStudio作为IDE,IDE即集成开发环境, 可以在RStudio内编辑、运行R的程序文件, 可以跟踪运行, 还可以构造文字、R结果图表融合在一起的研究报告、论文、图书、网站等。
6.扩展包使用
安装R时自带了一部分扩展包,如base,stats,graphics等,其它扩展包再安装完后,载入时需要使用library()函数调用。例如reader扩展包,需要使用read_csv()函数读取CSV文件,代码如下:
library(readr)
d <- read_csv("class.csv")
有些扩展包允许不下载直接调用,调用方式如下:
d <- readr::read_csv("class.csv")
注:有些扩展包中可能使用相同函数名,这种极少数情况发生时,使用“扩展名::函数名( )”可以解决,这个语法和C语言很相似。例如stats::filter和dplyr::filter()。