R语言里的字符型向量和布尔型向量运用

news2026/3/14 3:41:05

下面内容摘录自《R 语言与数据科学的终极指南》专栏文章的部分内容，每篇文章都在 5000 字以上，质量平均分高达 94 分，看全文请点击下面链接：

3章1节：数据的基本概念以及 R 中的数据结构、向量与矩阵的创建及运算-CSDN博客文章浏览阅读48次。本文详细介绍了R语言中常见的数据结构的向量和矩阵。通过掌握这些数据结构的基本概念和操作技巧，可以更高效地处理和分析数据。https://blog.csdn.net/2301_79425796/article/details/140734026

欢迎订阅我们专栏

.......前面部分请点击上面链接看原文

字符型向量（String Vector）

字符型向量（String vector）是由字符或者字符串所组成的向量，其能够通过函数 c() 或者 cat() 来构建。下面以高血压的三个类型作为字符串的内容，生成一个具有 6 个元素、包含中文和英文的混杂字符型向量 x_string 。

x_string <- c("ISH", "单纯收缩型高血压", "IDH", "单纯舒张型高血压", "SDH", "混合型高血压")

print(x_string)

输出结果为：

[1] "ISH" "单纯收缩型高血压" "IDH" "单纯舒张型高血压" "SDH" "混合型高血压"

在编程语言中，如果需要在一个字符串内部包含双引号，就需要使用转义字符来避免语法错误。转义字符通常是反斜杠(\)，它告诉解释器接下来的字符是特殊字符，不是普通字符。

例如，在R语言中，如果你想在一个字符串内部包含双引号，你需要在双引号前加上反斜杠(\)来进行转义。假设你想要创建一个字符串，内容是：I "Love" China，你可以这样写：

str <- "I \"Love\" China"

print(str)

\"表示一个双引号，但它不会被解释为字符串的结束，而是字符串内容的一部分。

输出结果会是：

[1] "I \"Love\" China"

如果你需要显示完整的字符串，包括外部的双引号，你可以用单引号来定义字符串，或者用cat()函数：

cat('I "Love" you')

输出结果会是：

I "Love" you

布尔型向量（Logical Vector）

布尔型向量又被称作“逻辑向量”，简单来讲，就是由 TRUE 和 FALSE 构成的向量。布尔型向量基本上是以“是”或“否”来体现对一组逻辑问题的回答。

在第一行代码中，2 大于 1，其回答为 TRUE 。

print(2 > 1)

输出结果为：

[1] TRUE

接着在第二行代码中，R 会理解为在 c(2,1) 和 1 之间依次进行元素比较，这等价于 c(2>1,1>2) ，所以回复为 TRUE 和 FALSE 。

print(c(2, 1) > 1)

输出结果为：

[1] TRUE FALSE

因子型向量（Factor Vector）

因子型向量（Factor vector）是将数据存储为整数值向量的一种分类变量（Categorical variables）。它可分为无序分类变量（Unordered categorical variable）和有序分类变量（Categorical variable）两类。其中，在因子变量中所包含的非重复值被称作因子水平。函数 factor() 是以整数向量的形式来存储类别值，其取值范围是[1…k]（这里的 k 是名义型变量中唯一值的个数），同时一个由字符串（原始值）构成的内部向量会映射到这些整数上。

.......后面部分请看原文

欢迎订阅我们专栏，深度系统地学习R语言。

为帮助大家更出色地掌握临床统计、数据挖掘以及人工智能建模的入门知识和应用，由于众多同学在计算机编程上经验欠缺，特此开设《R 语言与数据科学的终极指南》专栏。该专栏每周至少会定期更新三篇，直到整个专栏更新完成。每篇文章都在 5000 字以上，质量平均分高达 94 分。要提醒大家的是，每结束一个章节，专栏的优惠力度就会减小，当下正是订阅的最佳优惠时段，诚邀各位积极订阅！

专栏《R 语言与数据科学的终极指南》链接：https://blog.csdn.net/2301_79425796/category_12729892.html?spm=1001.2014.3001.5482