创作日志: Pearson或Spearson代表的是两个变量之间的相关性,因此一般输入是两个向量(vector),那么当我们有多个变量时,怎样计算他们两两之间的相关性系数呢?得到的correlation matrix各元素代表的又是什么意思呢?
举例:
矩阵A有两个样本:a1 与 a2,矩阵B有两个样本:b1 与 b2
我们可以利用相关性系数计算函数直接得到 a1 与 b1 、 a2 与 b2 的相关性
import numpy as np
# 创建两个示例矩阵
matrix1 = np.array([[1, 2, 3],
[4, 5, 6]])
matrix2 = np.array([[9, 2, 7],
[6, 5, 0]])
# 使用NumPy的corrcoef函数计算Pearson相关性系数
correlation_matrix = np.corrcoef(matrix1, matrix2)
print(correlation_matrix)
打印结果:
[[ 1. 1. -0.2773501 -0.93325653]
[ 1. 1. -0.2773501 -0.93325653]
[-0.2773501 -0.2773501 1. -0.0862796 ]
[-0.93325653 -0.93325653 -0.0862796 1. ]]
结果是一个4x4的矩阵,因为matrix1有两个变量/样本,matrix2有两个变量/样本,共四个样本,每两个样本之间一一对应,包括自身与自身,就形成了4x4,下面是对应关系:
想要哪两个变量/样本之间的相关性系数,直接取对应元素即可。