典型相关分析
- 学习目标
- 学习内容
- 典型相关分析的原理
- 典型相关分析的理论内容
- 例子
- 具体实现方法
- 内容小结
- 注意
- 解决方法
学习目标
我们所采用的学习内容来自B站的Lizongzhang老师的R语言的学习分享
今天学习的主要内容是关于
典型相关分析
学习内容
首先声明,典型相关分析的内容理解起来还是有一定的难度的,就算是之前记得是什么意思,但是后面回看的话,还是会对内容不理解,所以我个人就在这里尽可能的介绍典型相关分析方面的内容,时间比较紧,就按照视频里面的内容去简单写一下,只能知道怎么进行相关的操作
典型相关分析的原理
典型相关分析的基本原理,主要是借助主成分分析的思想,在每一组变量当中找出变量的线性组合–新的综合变量
典型相关分析的理论内容
这里先挖个坑,典型相关分析的具体公式方面的内容就不在这里写了
例子
具体实现方法
首先是导入相应的数据
#Canonical Correlation Analysis
#典型相关分析第九章内容
##读取CSV文件
#data <- read.csv("drugbank.csv", header = FALSE)
library(readxl)
eg9_1 <- read_excel("D:/BaiduNetdiskDownload/多元统计分析——基于R(第2版) 费宇 PDF教材及数据/eg9_1.xls")
View(eg9_1)
library(tidyverse)
#去除第一行id,保存数据记为data
data<- eg9_1 %>% rename(
weight=x1,waist=x2,pulse=x3,
chiup=y1,situp=y2,jump=y3)%>%
dplyr::select(-1)
View(data)
#根据题目要求进行变量的定义
library(CCA)
#定义需要进行分析的两组变量
physical<-data[,1:3]
train<-data[,4:6]
res.cc<-cc(physical,train)
res.cc
#cor分别计算u1&v1,u2&v2,u3&v3之间的典型相关变量关系
res.cc$cor
res.cc$xcoef
res.cc$ycoef
以下的方法是另一种方法,是更新 的一种方式,具体表现在其可视化的操作上面更加完善
#yacca比较新
#最新的典型相关分析的内容
library(yacca)
res.cca<-cca(physical,train)
#典型相关性系数
F.test.cca(res.cca)
plot(res.cca)
res.cca$xstructcorrsq
res.cca$ystructcorr
#原始变量与典型变量之间的相关性可视化
helio.plot(res.cca,
x.name="Physical",
y.name="train")
内容小结
注意
如果你在运行代码,下载CCA完的包并且运行以下命令的时候
这个问题就在于,环境设置上面可能有问题
解决方法
找到tool
,打开相应的global option
选择packages
,然后更改路径