7. R语言【相关性分析函数】:cov、cor、cor.test 和 【相关性检验函数】:cor.test、corr.test、pcor.test

news2024/9/25 21:29:03

b站课程视频链接:
https://www.bilibili.com/video/BV19x411X7C6?p=1
腾讯课堂(最新,但是要花钱,我花99😢😢元买了,感觉讲的没问题,就是知识点结构有点乱,有点废话):
https://ke.qq.com/course/3707827#term_id=103855009
 
本笔记前面的笔记参照b站视频,【后面的画图】参考了付费视频
笔记顺序做了些调整【个人感觉逻辑顺畅】,并删掉一些不重要的内容,以及补充了个人理解
系列笔记目录【持续更新】:https://blog.csdn.net/weixin_42214698/category_11393896.html

文章目录

  • 相关性分析函数
    • 1. 计算协方差:cov()
    • 2. 计算相关性系数:cor()
    • 3. 计算偏相关系数:ggm包中的pcor()
  • 相关性检验函数
    • 1. 相关性的检验:cor.test()
    • 2. 递归相关性的检验:corr.test()
    • 3. 偏相关系数的检验:ggm包中的pcor.test()

协方差 ——英文: covariance
相关性系数 ——英文:Correlation coefficient
必须要看懂下面这个博客:
详细见:5. 统计学基础2:协方差、相关系数、协方差矩阵

相关性分析:是指对两个或者多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度
相关性元素之间,需要存在一定的联系才可以进行相关性分析,简单来说就是变量之间是否有关系(也就是说需要先进行独立检测之后才能进行相关分析)。

相关系数的大小表示相关性的大小,相关系数包括:
pearson相关系数、spearman相关系数、kendall相关系数、偏相关系数、多分格相关系数和多系列相关系数

相关性分析函数

1. 计算协方差:cov()

cov()函数可以用来计算协方差,可以用来衡量两个变量的整体误差

在这里插入图片描述



2. 计算相关性系数:cor()

与独立性检验不同,相关性分析中每种方法都没有独立的函数,这里计算相关性系数都使用同一个函数:cor()函数。

常用:cov(x, y = NULL, use = "", method = "")

x:数字矢量、矩阵或数据帧。
y:NULL(默认值)或具有与x兼容维度的向量、矩阵或数据帧。默认值相当于y=x(但更有效)。

na.rm:是否应删除缺失的值?
use:一个可选字符串,给出了在缺少值的情况下计算协方差的方法。
这必须是字符串“everything”、“all.obs”、“complete.obs”、“na.or.complete”或“pairwise.complete.ob”之一的缩写。

method:指示要计算哪个相关系数(或协方差)的字符串。“pearson”(默认)、“kendall”或“spearman”之一,可以缩写。

V:对称数字矩阵,通常是正定的,如协方差矩阵。

此处我们使用state.x77数据作为实例数据(这是一个矩阵数据):

在这里插入图片描述
设相关系数为η, η 的取值范围为 [ − 1 , 1 ]
当 η 为正值时,X、Y 正相关,值越大正相关性越强;
当 η 为负值时,X 、Y负相关,值越小负相关性越强
当 η 趋于 0 时,基本不相关。当 η = 0 时, X、Y 不相关

cor()函数只能计算三种相关系数,其他相关系数的计算可以通过R的拓展包



3. 计算偏相关系数:ggm包中的pcor()

偏相关系数:是指在控制一个或者多个变量时,剩余其他变量之间的相互关系

pcor()函数需要输入两个重要的参数:
1️⃣第一个参数是一个数值向量(前两个数值表示要计算相关系数的下标,其余的数值为条件变量的下标
2️⃣第二个参数是cov( )函数计算出来的协方差结果

比如此处我们想控制收入水平、文盲率和高中毕业率的影响,看人口(第一列)和谋杀率(第五列)之间的关系(先获取列名,不然容易混):
在这里插入图片描述



相关性检验函数

1. 相关性的检验:cor.test()

在进行相关性分析之后,对相关性进行检验,cor.test()函数可用于相关性的检验。该函数有四个比较重要的选项参数,

cor.test(x, y,
         alternative = c("two.sided", "less", "greater"),
         method = c("pearson", "kendall", "spearman"),
         exact = NULL, conf.level = 0.95, continuity = FALSE, ...)

1. 其中x和y是需要检测的相关性变量

2. alternative是用来指定进行双侧检验还是单侧检验
two.sided代表分别检测正负相关性,greater代表正相关,less代表负相关。

3.Method选项用于指定用哪种相关系数,可选的有pearson相关系数、spearman相关系数、kendall相关系数。

我们使用state.x77数据检测一下谋杀率与文盲率之间的关系
在这里插入图片描述

Cor.test()只能一次性检测一组变量的关系



2. 递归相关性的检验:corr.test()

psych包中的corr.test()函数,可以一次性进行多个变量的检验,这个函数还可以进行递归操作

> library(psych)

在这里插入图片描述
图片下面绿色的是cor.test()计算出来的p-value值



3. 偏相关系数的检验:ggm包中的pcor.test()

使用ggm包中的pcor.test()函数,要先用pcor( )计算偏相关系数

> pcor(c(1,5,2,3,6),cov(state.x77))
[1] 0.3462724

再用pcor.test() 对其进行检验
在这里插入图片描述

返回三个值,分别是t检验,自由度和p-value值



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/170594.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

二、TortoiseGit的安装

1、TortoiseGit的安装 1.1、TortoiseGit简介 (1)TortoiseGit是一个基于TortoiseSVN的Git的Windows Shell接口。它是开源的,可以免费使用。 (2)TortoiseGit是git的比较好用的一个图形化工具。 1.2、软件下载 (1)下载地址 Download – TortoiseGit – Windows S…

84. 双向循环神经网络

1. 未来很重要 取决于过去和未来的上下文,可以填很不一样的词目前为止RNN只看过去在填空的时候,我们也可以看未来城 2. 双向RNN 两个隐状态层,并行计算隐状态,但是隐状态传播方向相反。 公式如下: 3. 推理 双向RNN不…

day16集合

1.Collection集合 1.1数组和集合的区别【理解】 相同点 都是容器,可以存储多个数据 不同点 数组的长度是不可变的,集合的长度是可变的 数组可以存基本数据类型和引用数据类型 集合只能存引用数据类型,如果要存基本数据类型,需要存对应的包装类 1.2集合类体系结构【理解】…

web期末作业网页设计——APEX(网页源码)

大学生网页制作期末作业-HTMLCSSJavaScript(包含源码)-apex欢迎来到Apex英雄Apex-legends 充满各种机会的世界 边境远方 偏僻星球群 欢迎来到诸王峡谷 于2019年2月5日发行。玩家在游戏中将扮演外星战场上的星空战士。 《Apex英雄》是由《泰坦天降》制作组…

<栈>的概念结构实现【C语言版】

1.栈的概念及结构 栈存储数据的方式跟数组一样,都是将元素排成一行。只不过它还有以下 3 条约束。 ● 只能在末尾插入数据。 ● 只能读取末尾的数据。 ● 只能移除末尾的数据。 你可以将栈看成一叠碟子:你只能看到最顶端那只碟子的碟面&#xff0c…

微博图床挂了!

一直担心的事情还是发生了。作为hexo多年的使用者,微博图床一直是我的默认选项,hexotyporaiPic更是我这几年写文章的黄金组合。而图床中,新浪图床一直都是我的默认选项,速度快、稳定同时支持大图片批量上传更是让其成为了众多图床…

工具及方法 - 设计你的文件夹结构

电脑上资料总是很多,要如何管理,是每个人都需要处理的问题。 如果处理不好,时间一长,很多资料就可能不知所踪或者难以查找。 出现这种情况,让人头疼,还浪费了时间,降低了工作效率。 所以&…

springboot服务启动JMX监控

前言 java应用部署下在生产环境,肯定是少不了监控的,比如说我们想要监控JVM的线程使用情况,内存使用情况等等。这时候我们可以采用JMX来实现JVM监控,如果对JMX不熟悉,可以参见之前的 精通JVM监控,不知道J…

Java技能树-操作符(二)-练习篇

按位操作符 下面代码执行后的结果是: System.out.println(1 & 2); System.out.println(1 | 2);答案是:A 正确结果是: 0 3Process finished with exit code 0十进制:1 二进制:0000 0001 十进制:2 二进…

【SpringCloud】Erauke的基本原理与使用

【SpringCloud】Erauke的基本原理与使用 一、Eureka-提供者与消费者 【问】如果服务A调用了服务B,而服务B又调用了服务C,服务B的角色是什么? 二、Eureka的结构和作用 什么是Eureka? Eureka 解决服务调用的问题 order-servic…

计算机论文的参考文献,应该怎么引用? - 易智编译EaseEditing

参考文献的引用格式,要看期刊的要求,期刊会规定文章格式,这里面就包括参考文献的格式。 如果不是投稿到期刊,也会有相应的要求,按要求来就行。 不仅很参考文献的格式,还有很多细节也要注意: …

【Java多线程】创建多线程的方式二---实现Runnable接口(多窗口卖票)

题:创建三个窗口卖票,总票数为100张 1.继承Thread类的方式: 因为是三个窗口共卖100张所以我们在定义ticket时要用到static来修饰 private static int ticket 100; 代码如下: class Window extends Thread{private static in…

k8s在华为openeuler搭建

参考文献 Kubernetes1.26.0部署(Ubuntu/CentOS)未完待续https://blog.csdn.net/weixin_67405599/article/details/128466282 Kubeadm 快速搭建 k8s v1.24.1 集群(openEuler 22.03 LTS)https://huaweicloud.csdn.net/633119cbd3efff3090b52068.html op…

宽度优先搜索算法(BFS)详解(超级详细讲解,附有大图)

目录 一.宽度优先搜索(BFS)是什么? 二.图解宽搜(BFS) 三.对比与发现 四。工具——队列 五.模板 六.最后 一.宽度优先搜索(BFS)是什么? 百度百科这样说: 宽度优先搜索…

一文讲透:质量管理的历史

(本文摘自《软件质量保证与管理(第2版)》,清华大学出版社,2020)1875年泰勒制诞生,意味着科学管理的开始,最初的质量管理也就是将检验活动与其他职能分离,出现了专职的检验…

2022-2023年中国数字经济投融资及创新展望研究报告(附下载链接)

省时查报告-专业、及时、全面的行研报告库省时查方案-专业、及时、全面的营销策划方案库【免费下载】2022年12月份热门报告盘点罗振宇2023年跨年演讲PPT原稿吴晓波2022年年终秀演讲PPT原稿2023年,如何科学制定年度规划?《底层逻辑》高清配图清华大学256页…

AF647 DBCO荧光染料,AF647 DBCO,Alexa Fluor 647 DBCO,AF-647, 二苯并环辛

一、产品描述:Alexa Fluor 647是一种明亮且可感光的远红色染料,其激发非常适合633 nm激光线。Alexa Fluor 647染料用于在成像和流式细胞仪中产生稳定的信号,在pH 4到pH 10之间为水溶性且对pH不敏感。这种长波长Alexa Fluor 染料的荧光肉眼看不…

什么是元器件二筛,为何要二筛,如何二筛,二筛的要求与分级要点总结

🏡《电子元器件学习目录》 目录1,什么是二筛2,为何要二筛3,如何进行二筛4,二筛的要求5,二筛的分级6,总结1,什么是二筛 电子元器件测试筛选即元器件二次筛选,又被简称为二…

Spring @Autowired 用法

Spring Autowired 用法首先看下Component举例 1 :举例 2 :验证是否调用的是默认构造器如何,在启动的时候执行有参数的构造函数??,这就要看Autowired注解了!Autowired注解首先看下Component 在类级别上添加了Component…

Flask入门教程(视频教程笔记)

初始化flask项目 前面的python环境之类的就不说了。 该博客是看 Flask 入门 这个视频教程写的笔记,如果你想入门一下Flask,可以看看这个课,虽然简短,但是入门部分讲的很好,同时可以利用这篇博客复习复习。如果你想了解…