下面内容摘录自《R 语言与数据科学的终极指南》专栏文章的部分内容,每篇文章都在 5000 字以上,质量平均分高达 94 分,看全文请点击下面链接:
3章1节:数据的基本概念以及 R 中的数据结构、向量与矩阵的创建及运算-CSDN博客文章浏览阅读48次。本文详细介绍了R语言中常见的数据结构的向量和矩阵。通过掌握这些数据结构的基本概念和操作技巧,可以更高效地处理和分析数据。https://blog.csdn.net/2301_79425796/article/details/140734026
欢迎订阅我们专栏
.......前面部分请点击上面链接看原文
字符型向量(String Vector)
字符型向量(String vector)是由字符或者字符串所组成的向量,其能够通过函数 c() 或者 cat() 来构建。下面以高血压的三个类型作为字符串的内容,生成一个具有 6 个元素、包含中文和英文的混杂字符型向量 x_string 。
x_string <- c("ISH", "单纯收缩型高血压", "IDH", "单纯舒张型高血压", "SDH", "混合型高血压")
print(x_string)
输出结果为:
[1] "ISH" "单纯收缩型高血压" "IDH" "单纯舒张型高血压" "SDH" "混合型高血压"
在编程语言中,如果需要在一个字符串内部包含双引号,就需要使用转义字符来避免语法错误。转义字符通常是反斜杠(\
),它告诉解释器接下来的字符是特殊字符,不是普通字符。
例如,在R语言中,如果你想在一个字符串内部包含双引号,你需要在双引号前加上反斜杠(\
)来进行转义。假设你想要创建一个字符串,内容是:I "Love" China
,你可以这样写:
str <- "I \"Love\" China"
print(str)
\"
表示一个双引号,但它不会被解释为字符串的结束,而是字符串内容的一部分。
输出结果会是:
[1] "I \"Love\" China"
如果你需要显示完整的字符串,包括外部的双引号,你可以用单引号来定义字符串,或者用cat()函数:
cat('I "Love" you')
输出结果会是:
I "Love" you
布尔型向量(Logical Vector)
布尔型向量又被称作“逻辑向量”,简单来讲,就是由 TRUE 和 FALSE 构成的向量。布尔型向量基本上是以“是”或“否”来体现对一组逻辑问题的回答。
在第一行代码中,2 大于 1,其回答为 TRUE 。
print(2 > 1)
输出结果为:
[1] TRUE
接着在第二行代码中,R 会理解为在 c(2,1) 和 1 之间依次进行元素比较,这等价于 c(2>1,1>2) ,所以回复为 TRUE 和 FALSE 。
print(c(2, 1) > 1)
输出结果为:
[1] TRUE FALSE
因子型向量(Factor Vector)
因子型向量(Factor vector)是将数据存储为整数值向量的一种分类变量(Categorical variables)。它可分为无序分类变量(Unordered categorical variable)和有序分类变量(Categorical variable)两类。其中,在因子变量中所包含的非重复值被称作因子水平。函数 factor() 是以整数向量的形式来存储类别值,其取值范围是[1…k](这里的 k 是名义型变量中唯一值的个数),同时一个由字符串(原始值)构成的内部向量会映射到这些整数上。
.......后面部分请看原文
欢迎订阅我们专栏,深度系统地学习R语言。
为帮助大家更出色地掌握临床统计、数据挖掘以及人工智能建模的入门知识和应用,由于众多同学在计算机编程上经验欠缺,特此开设《R 语言与数据科学的终极指南》专栏。该专栏每周至少会定期更新三篇,直到整个专栏更新完成。每篇文章都在 5000 字以上,质量平均分高达 94 分。要提醒大家的是,每结束一个章节,专栏的优惠力度就会减小,当下正是订阅的最佳优惠时段,诚邀各位积极订阅!
专栏《R 语言与数据科学的终极指南》链接:https://blog.csdn.net/2301_79425796/category_12729892.html?spm=1001.2014.3001.5482