一元随机变量
我们用协方差来刻画两个变量的相关关系,这里指的是线性相关关系。
对于一元随机变量的可视化最简单的就是散点图,大致可以看出X和Y之间的相关关系。如果想更好的看X、Y之间的相关关系,可以画二维的散点图。
总结:
均值描述随机变量的中心
方差描述随机变量的离散程度
协方差和相关系数来描述变量之间的线性关系
用散点图去描述两个变量的相关关系
多元数据的描述和展示
均值向量
代码
round(colMeans(iris[,1:4]),2)#求均值向量
#这里round函数是取有效数字,2代表保留两位有效数字
协方差矩阵
描述数据离散程度以及了解这个多元数据变量与变量之间的相关性。
代码
S<-round(cov(iris[,1:4]),2)#求协方差矩阵
S
总体相关系数矩阵
相关系数就是对协方差的标准化
代码
R<-round(cor(iris[,1:4]),2)#总体相关系数矩阵
R
可视化(R代码描述)
两两散点图
pairs(iris[1:4],main="Scatterplot Matrix for Fisher's Iris Data")
比较两两之间的线性关系
# 创建颜色向量
colors <- c("red", "green", "blue")
# 设置物种对应的颜色向量
species <- iris$Species
species_colors <- colors[as.numeric(species)]
# 绘制配对散点图
pairs(iris[, 1:4], main = "Scatterplot Matrix for Fisher's Iris Data", col = species_colors)
加上颜色方便比较。