R语言入门笔记:第一节,快速了解R语言——文件与基础操作

news2025/7/15 10:44:32

关于 R 语言的简单介绍

上一期 R 语言入门笔记里面我简单介绍了 R 语言的安装和使用方法,以及各项避免踩坑的注意事项。我想把这个系列的笔记持续写下去。

这份笔记只是我的 R 语言入门学习笔记,而不是一套 R 语言教程。换句话说:这份笔记不会事无巨细地介绍 R 语言的逐项细节,毕竟现在网上有关R的教程已经非常多了。这份笔记主要是针对 R 语言学习过程中各个容易掉进去的坑进行规避,以及根据我自身的经验提供一些学习思路。

首先,R 语言是一门特殊的、专用于统计分析和建模的编程语言。一般情况下,我猜测大家学习R语言主要可能是因为出于以下的原因:

  1. 主要从事统计分析的工作,将R语言作为自己的主力编程语言

  2. 主力编程语言不足以应对复杂的统计分析问题,需要 R 的辅助

  3. 你不知道,因为你只是一个普通的苦逼医学生,而身边的医学生都在使用 R

我个人比较符合第二种情况。我通常使用 Python,R 则是刚刚开始学习。因此我也希望能和这份笔记的读者们共同进步。

到什么地方去找 R 语言的教程

考虑到 R 语言是专为统计分析设计的编程语言,所以 R 语言的许多机制也和统计分析本身有关。

首先需要掌握一些有关统计分析的基本概念。一旦熟悉了统计分析的基本概念,就能基本了解R语言能够帮助你完成哪些功能(统计分析需要的那些计算机功能,R 语言几乎都可以实现。)

R 语言的基本语法

略。

……别人的教程都写过了,我干嘛还要再写一遍?

哎,跳过。

文件与路径

为什么要注意路径问题?

初次体验 R Studio 的时候,一大印象就是没有非常轻便稳定的路径管理,因为 R Studio 中终端并不会默认在工作空间里开启。

相比较其他我常用的 IDE 而言,如果是在 Visual Studio Code 中移动工作空间,只需要直接关闭IDE然后直接在电脑上打开另一个文件夹,右键,选择“在 Visual Studio Code 中打开”就可以很容易地在相应的工作目录运行和调试程序。但是对于 R Studio,即使你把右下角的 Files 栏切换到了正确的工作区目录(以防止新人不了解:就是你堆放数据文件和代码脚本的文件夹),你的终端还是在原来的那个目录里面。你这个时候去敲R的实时交互命令读取某个路径下的数据,或者运行 R 的代码文件读取数据,就要报错。

遇到这种情况,如果你不想在 R 命令行里面通过敲命令再切换一次,可以考虑将所有 R 语言编程活动都变成一个个独立的项目去管理。尝试在 R Studio 右上角点击 Files,然后新建一个 R 项目,下次打开代码直接点击后缀名为 *.Rproj 的项目文件,就能正确打开 R Studio 并切换正确的工作目录。

关于文件格式

R Script 与 R Markdown

R语言的代码最常见的主要有两种文件格式:原生的R语言脚本文件(R Script),以及 R Markdown,一种R语言和Markdown相互交替书写、分段运行的奇特代码。R Script 和 R Markdown 相当于 Python 中的 *.py 脚本和 Jupyter Notebook 的关系。

R Script

R Script 是 R 语言的脚本,就是正常编写代码的方式。

主流的 R 语言的代码规范可以参照 Google的R语言编码风格指南(Google’s R Style Guide)。比如在 R Script 中 R 语言代码可以分节,用小节标题前后四个 # 加空格分割的形式:

#### hello world ####

# This is a hello world program in R
print("hello, world")

如果你有一个R脚本文件(比如 hello.R),你可以使用 source() 函数来加载它的内容到当前的工作空间中。这相当于在当前环境中运行这个文件的所有代码。

# 假设你有一个 hello.R 文件
# 定义了 Hello() 函数
source("hello.R")
Hello()

这样,definitions.R 中定义的所有函数和变量都会加载到当前的工作空间中,你可以在其他文件中使用它们。

有时你可能不希望加载所有定义到全局环境中,可以通过设置 source() 的 local 参数来控制代码加载到局部环境中。

local_env <- new.env()
source("hello.R", local = local_env)

# 使用定义在 local_env 环境中的对象
local_env$Hello()

如果你的定义文件非常复杂或包含多个功能模块,你可以考虑将其封装为一个 R 包。这样,你可以通过 library() 来引用包中的功能,并且包的组织结构可以帮助你更好地管理代码。同样地,对于下载的包也是使用 library() 导入。

还有一种方式是使用 sys.source(),这里刚刚入门,暂且不论。

R Markdown

为防止新人朋友们不知道——简单的来讲,Markdown 是用来给文章排版的,是一种极简主义的排版工具,只有标题、引用、有序列表、无序列表、斜体、加粗、超链接和图片这 8 个功能,Markdown 语法简单易学,非常适合快速编写和组织文档,足以允许我们把 R 语言代码和代码说明性文章/报告放在一起排版了。

熟悉Jupyter Notebook的朋友可能会知道:Jupyter Notebook 实际上是一种通过网页实时渲染的 JSON 文本,而R Markdown则是完完全全的纯文本,只是在 R Markdown 中 Markdown 和 R 语言的代码可以交替编写。这就意味着R Markdown不能保存代码运行的结果,但也不会因为巨大的图片文件而变得臃肿。

另一方面,尽管 Jupyter Notebook 本身就具备 R 编程的功能,但实际上很多情况下 R Markdown 比 Jupyter Notebook 的体验更好。如果你的计算机上正确配置过 \LaTeX 的话,理论上你可以通过 R Markdown 一键构建PDFL格式的报告或者论文;如果没有 \LaTeX ,Word 或者 HTML 都是没问题的。关于其详细操作方法,以后的笔记里面我们慢慢聊。

image

大家在新建 R Markdown 的时候生成的文件里面就会自带简单的说明信息,事实上,我在这里无需赘述。但是出于礼貌也方便大家理解,我简记一笔:

简单的来讲:一个标准的 R Markdown 文件包含三个部分:YAML 头部、Markdown 文档和可运行的代码片段。这里逐一介绍:

YAML 头部

YAML 头部位于文件的最上方,用前后三个短横线 --- 包裹。它主要用来设置文档的元信息,例如标题、作者、日期、输出格式等。

---
title: "R Markdown 入门示例"
author: "盒子online_1396529"
date: "2024-07-01"
output: pdf_document
---

R Markdown 可以被编译成多种格式的文件,包括 PDF、HTML、Word 等,从而快速生成论文或统计分析报告。这个功能被称为 knit。选择输出格式时,只需在 YAML 头部指定 output 选项即可。每种输出格式都可以进行进一步的定制,例如,选择 PDF 输出时,你可以使用 \LaTeX 语法来调整排版细节。

output:
  pdf_document:
    latex_engine: xelatex
    toc: true # 添加目录
    number_sections: true # 章节自动编号
Markdown 文档部分

Markdown 文档部分是 R Markdown 的主体内容。在这里,你可以使用 Markdown 语法编写文本、标题、列表、引用、表格、图片等。

## 标题示例

这是一个简单的段落,你可以使用 **加粗** 和 *斜体* 来突出重点。

### 列表示例

- 无序列表项1
- 无序列表项2
- 无序列表项3

1. 有序列表项1
2. 有序列表项2
3. 有序列表项3
可运行的代码块

R Markdown 的一个重要功能是可以在 Markdown 文档中嵌入 R 代码块,并在文档编译时自动运行这些代码。代码块可以生成图表、分析结果,并将这些内容直接嵌入到文档中(这个功能简直就是神了)!

代码块通常用上下两排三个反引号 ``` 包裹,并在第一排反引号后加上 {r} 指定这是一个 R 代码块(原生的 Markdown 语法在插入代码片段的时候指定编程语言的名称不加花括号)。

我在这里没有办法演示这个功能,因为这份笔记正是用 R Markdown 编写的。如果我另起一行写下 ```{r} 这段内容就会直接被识别成有待运行的 R 语言代码块,而代码块的格式也就被忽略掉不会插入笔记了。

R Markdown 结合了 Markdown 的简洁和 R 语言的强大功能,适合用来编写包含数据分析、报告、学术论文等内容的文档。它让编写文档的过程变得更加高效和灵活,无论是日常工作中的报告,还是学术研究中的论文,R Markdown 都是一个得力的工具。总的来讲: 当我们新开始一个 R 语言数据分析项目并处于数据探究阶段的时候,可以选择在一开始就直接新建 R Markdown 上手写,而不是一上来就编写 R 脚本文件。

关注灵活就业新业态,关注公账号:贤才宝(贤才宝https://www.51xcbw.com)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2269798.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

16、【ubuntu】【gitlab】【补充】服务器断电后,重启服务器,gitlab无法访问

背景 接wiki 【服务器断电后&#xff0c;重启服务器&#xff0c;gitlab无法访问】https://blog.csdn.net/nobigdeal00/article/details/144280761 最近不小心把服务器重启&#xff0c;每次重启后&#xff0c;都会出现gitlab无法访问 分析 查看系统正在运行的任务 adminpcad…

汇编环境搭建

学习视频 将MASM所在目录 指定为C盘

两种分类代码:独热编码与标签编码

目录 一、说明 二、理解分类数据 2.1 分类数据的类型&#xff1a;名义数据与序数数据 2.2 为什么需要编码 三、什么是独热编码&#xff1f; 3.1 工作原理&#xff1a;独热编码背后的机制 3.2 应用&#xff1a;独热编码的优势 四、什么是标签编码&#xff1f; 4.1 工作原理&…

二、SQL语言,《数据库系统概念》,原书第7版

文章目录 一、概览SQL语言1.1 SQL 语言概述1.1.1 SQL语言的提出和发展1.1.2 SQL 语言的功能概述 1.2 利用SQL语言建立数据库1.2.1 示例1.2.2 SQL-DDL1.2.2.1 CREATE DATABASE1.2.2.2 CREATE TABLE 1.2.3 SQL-DML1.2.3.1 INSERT INTO 1.3 用SQL 语言进行简单查询1.3.1 单表查询 …

异常与中断(下)

文章目录 一、中断的硬件框架1.1 中断路径上的3个部件1.2 STM32F103的GPIO中断1.2.1 GPIO控制器1.2.2 EXTI1.2.3 NVIC1.2.4 CPU1. PRIMASK2. FAULTMASK3. BASEPRI 1.3 STM32MP157的GPIO中断1.3.1 GPIO控制器1.3.2 EXTI1. 设置EXTImux2. 设置Event Trigger3. 设置Masking4. 查看…

「Mac畅玩鸿蒙与硬件48」UI互动应用篇25 - 简易购物车功能实现

本篇教程将带你实现一个简易购物车功能。通过使用接口定义商品结构&#xff0c;我们将创建一个动态购物车&#xff0c;支持商品的添加、移除以及实时总价计算。 关键词 UI互动应用接口定义购物车功能动态计算商品管理列表操作 一、功能说明 简易购物车功能包含以下交互&#…

STM32学习之EXTI外部中断(以对外式红外传感器 / 旋转编码器为例)

中断:在主程序运行过程中&#xff0c;出现了特定的中断触发条件(中断源)&#xff0c;使得CPU暂停当前正在运行的程序&#xff0c;转而去处理中断程序处理完成后又返回原来被暂停的位置继续运行 中断优先级:当有多个中断源同时申请中断时&#xff0c;CPU会根据中断源的轻重缓急…

如何使用 ChatGPT Prompts 写学术论文?

第 1 部分:学术写作之旅:使用 ChatGPT Prompts 进行学术写作的结构化指南 踏上学术写作过程的结构化旅程,每个 ChatGPT 提示都旨在解决特定方面,确保对您的主题进行全面探索。 制定研究问题: “制定一个关于量子计算的社会影响的研究问题,确保清晰并与您的研究目标保持一…

HuatuoGPT-o1:基于40K可验证医学问题的两阶段复杂推理增强框架,通过验证器引导和强化学习提升医学模型的推理能力

HuatuoGPT-o1&#xff1a;基于40K可验证医学问题的两阶段复杂推理增强框架&#xff0c;通过验证器引导和强化学习提升医学模型的推理能力 论文大纲理解1. 确认目标2. 分析过程3. 实现步骤4. 效果展示 解法拆解全流程提问俩阶段详细分析 论文&#xff1a;HuatuoGPT-o1, Towards …

07-计算机网络面试实战

07-计算机网络面试实战 计算机网络面试实战 为什么要学习网络相关知识&#xff1f; 对于好一些的公司&#xff0c;计算机基础的内容是肯定要面的&#xff0c;尤其是 30k 以内的工程师&#xff0c;因为目前处于的这个级别肯定是要去写项目的&#xff0c;还没上升到去设计架构的高…

Github - 如何提交一个带有“verified”标识的commit

Github - 如何提交一个带有“verified”标识的commit 前言(Why) 今天在Github上浏览某项目的commit记录的时候发现&#xff0c;有的commit记录带有verified绿色标识&#xff0c;有的带有橘色的Unverified标识&#xff0c;还有的什么都不显示。 既然我是根正苗红的作者(bushi)…

中式美学|中国红电商展台咒语分享

使用工具&#xff1a;千鹿AI 咒语&#xff1a;geometric shape podium,Red background, and rose gold elements on the right side, Chinese New Year atmosphere, simple and clean light luxury scene, minimalist style, minimalist stage design, studio lighting, minim…

中断系统 | 高优先级抢占原理

参考视频 入坑单片机 – [12_2]中断系统 [12_3]底层解析 51内核中断抢占性 如果我们把51单片机的5个中断都打开的话&#xff0c;CPU对与中断的响应是从上到下的。 如果INT0 和TIM0 的中断同时发生&#xff0c;CPU会有执行INT0的服务函数&#xff0c;然后再执行TIM0的函数。…

探寻AI Agent:开启知识图谱自动生成新篇章(17/30)

一、AI Agent 与知识图谱&#xff1a;智能时代的双雄 在当今科技飞速发展的时代&#xff0c;人工智能如同一股汹涌澎湃的浪潮&#xff0c;正以前所未有的力量重塑着我们的世界。而在这股浪潮中&#xff0c;AI Agent 与知识图谱无疑是两颗最为璀璨的明珠&#xff0c;它们各自发挥…

CA系统的设计(CA证书生成,吊销,数字签名生成)

CA系统概述 CA认证系统是一种基于公钥密码基础设施&#xff08;PKI&#xff09;的信息安全技术&#xff0c;它可以为网络通信双方提供身份认证、数据加密、数字签名等功能。CA认证系统的核心是证书授权机构&#xff08;CA&#xff09;&#xff0c;它负责为用户&#xff08;节点…

phpstudy2018问题(技巧)总结

目录 安装介绍注意操作 问题phpstudy待续、更新中...... 安装 软件下载&#xff08;新人推荐2018 版本phpstudy &#xff09; 官网下载 https://www.xp.cn/download.html 介绍 系统服务------开机自启 非服务模式------开机不自启 搭建好环境, 此时服务器与客户端同时存在 …

USB2.0之描述符(Descriptors)

文章目录 描述符(Descriptors)设备描述符(Device Descriptors)配置描述符(Configuration Descriptors)接口描述符(Interface Descriptors)端点描述符(Endpoint Descriptors)字符串描述符(String Descriptors) 参考资料 描述符(Descriptors) 描述符是设备本身各项信息的集合&…

从授权校验看SpringBoot自动装配

背景 最近需要实现一个对于系统的授权检测功能&#xff0c;即当SpringBoot应用被启动时&#xff0c;需要当前设备是否具有有效的的授权许可信息&#xff0c;若无则直接退出应用。具体的实现方案请继续看下文。 环境 Ruoyi-Vue SpringBoot3 RuoYi-Vue: &#x1f389; 基于Spr…

jmeter分布式启动

https://www.cnblogs.com/qtclm/p/11082081.html 1、代理机&#xff1a;输入“ipconfig”&#xff0c;找到IP地址&#xff0c;在Jmeter/bin/jmeter.properties设置remote host 启动jmeter server 1、控制机&#xff1a;输入“ipconfig”&#xff0c;找到IP地址&#xff0c;在J…

SpringCloud源码-Ribbon

一、Spring定制化RestTemplate&#xff0c;预留出RestTemplate定制化扩展点 org.springframework.cloud.client.loadbalancer.LoadBalancerAutoConfiguration 二、Ribbon定义RestTemplate Ribbon扩展点功能 org.springframework.cloud.netflix.ribbon.RibbonAutoConfiguratio…