皮尔森相关系数(Pearson correlation coefficient)

news2025/1/18 20:05:31

最近在看脑机接口的网络,看到有使用通道的皮尔森相关系数作为特征的方法,这里记录一下皮尔森相关系数的学习内容,方便以后查阅。

皮尔森相关系数(Pearson correlation coefficient)

  • 相关系数
  • 简单相关系数
  • 复相关系数
  • 典型相关系数
  • 参考资料

相关系数

相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数

有关相关系数的内容在这篇文中也有介绍:【协方差】【相关系数】【协方差矩阵】【散度矩阵】

相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。由于研究对象的不同,相关系数有如下几种定义方式。

简单相关系数

也就是皮尔森相关系数,又叫相关系数或线性相关系数,一般用字母r表示,用来度量两个变量间的线性关系。

r ( X , Y ) = C o v ( X , Y ) V a r [ X ] V a r [ Y ] r(X, Y) = \frac{Cov(X, Y)}{\sqrt{Var[X]Var[Y]}} r(X,Y)=Var[X]Var[Y] Cov(X,Y)

其中, C o v ( X , Y ) Cov(X,Y) Cov(X,Y) X X X Y Y Y的协方差, V a r [ X ] Var[X] Var[X] X X X的方差, V a r [ Y ] Var[Y] Var[Y] Y Y Y的方差

numpy.corrcoef

在这里插入图片描述

import numpy as np
rng = np.random.default_rng(seed=42)
xarr = rng.random((3, 3))
xarr
array([[0.77395605, 0.43887844, 0.85859792],
       [0.69736803, 0.09417735, 0.97562235],
       [0.7611397 , 0.78606431, 0.12811363]])
R1 = np.corrcoef(xarr)
R1
array([[ 1.        ,  0.99256089, -0.68080986],
       [ 0.99256089,  1.        , -0.76492172],
       [-0.68080986, -0.76492172,  1.        ]])
yarr = rng.random((3, 3))
yarr
array([[0.45038594, 0.37079802, 0.92676499],
       [0.64386512, 0.82276161, 0.4434142 ],
       [0.22723872, 0.55458479, 0.06381726]])
R2 = np.corrcoef(xarr, yarr)
R2
array([[ 1.        ,  0.99256089, -0.68080986,  0.75008178, -0.934284  ,  -0.99004057],
       [ 0.99256089,  1.        , -0.76492172,  0.82502011, -0.97074098,  -0.99981569],
       [-0.68080986, -0.76492172,  1.        , -0.99507202,  0.89721355,  0.77714685],
       [ 0.75008178,  0.82502011, -0.99507202,  1.        , -0.93657855,  -0.83571711],
       [-0.934284  , -0.97074098,  0.89721355, -0.93657855,  1.        ,  0.97517215],
       [-0.99004057, -0.99981569,  0.77714685, -0.83571711,  0.97517215,  1.        ]])

复相关系数

定义: 复相关系数反映一个随机变量一组随机变量(两个或两个以上)之间相关程度的指标,是包含所有变量在内的综合测定指标
在这里插入图片描述

为了测定一个变量 y y y与其他多个变量 X 1 , X 2 , … , X k X_1, X_2, …, X_k X1,X2,Xk之间的相关系数,可以考虑构造一个关于 X 1 , X 2 , … , X k X_1, X_2, …, X_k X1,X2,Xk的线性组合 y ^ \hat{y} y^来拟合 y y y,通过计算该线性组合 y ^ \hat{y} y^ y y y之间的简单相关系数作为变量 y y y X 1 , X 2 , … , X k X_1, X_2, …, X_k X1,X2,Xk之间的复相关系数。具体的计算过程如下:

第一步,用 y y y X 1 , X 2 , … , X k X_1, X_2, …, X_k X1,X2,Xk做回归分析,得:

y ^ = β 0 ^ + β 1 ^ X 1 + β 2 ^ X 2 + … + β k ^ X k \hat{y} = \hat{\beta_0}+\hat{\beta_1}X_1+\hat{\beta_2}X_2+…+\hat{\beta_k}X_k y^=β0^+β1^X1+β2^X2++βk^Xk

第二步,计算 y y y y ^ \hat{y} y^之间的简单相关系数,此简单相关系数即为 y y y X 1 , X 2 , … , X k X_1, X_2, …, X_k X1,X2,Xk之间的复相关系数。复相关系数的计算公式为:

R = ∑ ( y − y ˉ ) ( y ^ − y ˉ ) ∑ ( y − y ˉ ) 2 ⋅ ∑ ( y ^ − y ˉ ) 2 R = \frac{\sum(y-\bar{y})(\hat{y}-\bar{y})}{\sqrt{\sum(y-\bar{y})^2·\sum(\hat{y}-\bar{y})^2}} R=(yyˉ)2(y^yˉ)2 (yyˉ)(y^yˉ)

:之所以用 R R R表示复相关系数,是因为 R 2 R^2 R2恰好是线性回归方程的决定系数(用于检验回归方程对观测的拟合程度)

典型相关系数

是先对原来各组变量进行主成分分析,得到新的线性关系的综合指标,再通过综合指标之间的线性相关系数来研究原各组变量间相关关系。

参考资料

相关系数

【中国地质大学北京】数学在地学中的应用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/197684.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【MySQL】MySQL中的数学函数有哪些?

数学函数MySQL函数简介数学函数1.绝对值函数ABS(x)和返回圆周率的函数PI()2.平方根函数SQRT(x)和求余函数MOD(x,y)3.获取整数的函数CEIL(x)、CEIL…

关于Json Web Token(token)在前后端的实践思考

1、前言 啥也不说了,直接进入正题,来学习一下Token在前端和后端的简单应用分析 Token是在客户端频繁向服务端请求数据,服务端频繁的去数据库查询用户名和密码进行对比,判断用户名和密码是否正确,并作出相应提示&…

华为机试题:HJ37 统计每个月兔子的总数(python)

文章目录博主精品专栏导航知识点详解1、input():获取控制台(任意形式)的输入。输出均为字符串类型。1.1、input()与list(input())的区别、及其相互转换方法2、print() :打印输出。3、整型int() :将字符串或数字转换为整…

C语言基础(二)—— 常量与变量、数据类型、进位制、关键字、原码反码补码、限定符、字符串格式化输入输出

1. 常量与变量1.1 关键字1.2 数据类型数据类型的作用:编译器预算对象(变量)分配的内存空间大小。1.3 常量在程序运行过程中,其值不能被改变的量常量一般出现在表达式或赋值语句中整型常量100,200,-100&…

MySQL事务篇

目录​​​​​​​ 一.事务有哪些特性? 二.并行事务会引发什么问题? 脏读 不可重复读 幻读 三.事务的隔离级别有哪些? 一.事务有哪些特性? 原子性(Atomicity):一个事务中的所有操作&…

4.数据库安全性

学习过程参考(后续章节同) 【公开课】数据库系统概论(王珊老师)(完结) 《数据库系统概论》思维导图 【专栏必读】数据库系统概论第五版(王珊)专栏学习笔记目录导航及课后习题答案详…

2023年02月IDE流行度最新排名

点击查看最新IDE流行度最新排名(每月更新) 2023年02月IDE流行度最新排名 顶级IDE排名是通过分析在谷歌上搜索IDE下载页面的频率而创建的 一个IDE被搜索的次数越多,这个IDE就被认为越受欢迎。原始数据来自谷歌Trends 如果您相信集体智慧&am…

MySQL的函数

目录 一.分类 聚合函数 概述 格式 操作 数学函数 操作1 操作2 操作3 字符串函数 操作1 操作2 操作3 操作4 日期函数 操作1 操作2 操作3 控制流函数 if逻辑判断语句 case when 语句 窗口函数 介绍 分类 序号函数 开窗聚合函数- SUM,AVG,MIN,MAX 分布函数-…

Java 对象拷贝与转换-org.mapstruct:mapstruct 包(@Mapper、@Mapping)的使用

MapStruct的使用 最近在学习技术时候,发现一个特别好用的包,org.mapstruct:mapstruct,它是专门用来处理 domin 实体类与 model 类的属性映射的 它的优势: 很多项目大量映射的方式通过手动get、set,首先写法很low&…

并发编程 · 基础篇 · android线程那些事

小木箱成长营并发编程系列教程(排期中): 并发编程 基础篇(下) android线程池那些事 并发编程 提高篇(上) Java并发关键字那些事 并发编程 提高篇(下) Java锁安全性那些事 并发编程 高级篇(上) Java内存模型那些事 并发编程 高级篇(下) Java并发BATJ面试之谈 并发编程…

Jupyter notebook——在Anaconda中多个环境下,设置不同的默认打开路径

项目背景:anaconda中搭建了一个python3.6,一个python3.7版本,python3.6环境版本的jupyter notebook默认打开路径设置为:D:\DeepLearning\cv,修改jupyter notebook默认路径见:https://blog.csdn.net/qq_1881…

分享115个图片切换JS特效,总有一款适合您

分享115个图片切换JS特效,总有一款适合您 115个图片切换JS特效下载链接:https://pan.baidu.com/s/1QX7b5LDlY6lBqMVjgBKSwA?pwdk05d 提取码:k05d Python采集代码下载链接:https://wwgn.lanzoul.com/iKGwb0kye3wj jQuery多图…

Appium+Python+pytest自动化测试框架

先简单介绍一下目录,再贴一些代码,代码里有注释Basic目录下写的是一些公共的方法,Data目录下写的是测试数据,image存的是测试失败截图,Log日志文件,Page测试的定位元素,report测试报告&#xff…

Linux从入门到精通

Linux从入门到精通 1. Linux 简介 Linux 内核最初只是由芬兰人林纳斯托瓦兹(Linus Torvalds)在赫尔辛基大学上学时出于个人爱好而编写的。 Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX(可移植操作系统接…

Nacos 注册监听器

文章目录前言项目文件说明pom依赖bootstrap.ymlNacosConfig 配置类监听器实现类-默认实现监听器实现类-json配置处理注册监听器监听器的效果前言 本文主要讨论Nacos作为配置中心时,其中配置内容发生更改时,我们的应用程序能够做的事。 一般使用监听器来…

DeepLabV3+:Mobilenetv2的改进以及浅层特征和深层特征的融合

目录 Mobilenetv2的改进 浅层特征和深层特征的融合 完整代码 参考资料 Mobilenetv2的改进 在DeeplabV3当中,一般不会5次下采样,可选的有3次下采样和4次下采样。因为要进行五次下采样的话会损失较多的信息。 在这里mobilenetv2会从之前写好的模块中…

第四天链表

24. 两两交换链表中的节点力扣题目链接(opens new window)给定一个链表,两两交换其中相邻的节点,并返回交换后的链表。你不能只是单纯的改变节点内部的值,而是需要实际的进行节点交换。接下来就是交换相邻两个元素了,此时一定要画…

vite --- 为什么选Vite

目录 什么是Vite 为什么选Vite 现实问题 为什么生产环境仍需打包 Vite 与竞品 什么是Vite Vite(法语意为 "快速的",发音 /vit/,发音同 "veet")是一种新型前端构建工具,能够显著提升前端开发体…

SpringBoot+Vue图书馆管理系统1.0

简介:本项目采用了基本的SpringBootVue设计的图书馆管理系统。详情请看截图。经测试,本项目正常运行。本项目适用于Java毕业设计、课程设计学习参考等用途。 项目描述 项目名称SpringBootVue图书馆管理系统1.0源码作者LHL项目类型Java EE项目 &#xff…

Zebec 上线投票治理机制,全新流支付生态正在起航

随着加密货币的兴起,其除了成为一种备受关注的投资品外,它也正在成为一种新兴的支付手段。虽然在加密行业发展早期,以BTC、LTC等为代表的以支付为定位老牌加密资产,因支付效率低下、支付成本高、合规等问题而没能实现早期的愿景&a…