文章目录
- 一、前言🚀🚀🚀
- 二、皮尔逊person相关系数:☀️☀️☀️
- 1. 总体皮尔逊person相关系数
- ① 总体和样本
- ② 理解协方差(受量纲影响)
- ③ 剔除量纲影响
- 2. 样本皮尔逊person相关系数
- 3. 相关性可视化
- ① 皮尔逊person相关系数的一些误区
- ② 容易忽略和犯错的点
- ③ 对相关系数大小的解释
- 4. 例题
- ① 给出题目与Excel表
- ② 描述性统计
- ③ Execl描述性统计
- ③ SPSS描述性统计
- ④ 看完散点图(看出线性关系)再决定做相关系数计算
- ⑤ 用Excel表格美化相关系数表
- 三、补充:☀️☀️☀️
- 3.1、皮尔逊相关系数假设检验的条件:
- 四、如何检验数据是否是正态分布:☀️☀️☀️
- 4.1 偏度和风度
- 4.2 正态分布JB检验(大样本n>30) 推荐
- 4.3 Shapiro-wilk夏皮洛-威尔克检验(3 <= 小样本 <= 50) 推荐
- 4.4 Q-Q图 (不推荐)
一、前言🚀🚀🚀
☀️☀️☀️
外面的世界好大!
去外面……更外面的地方。
没关系的,跟Sakura在外面到处玩,很开心,所以我能坚持下来。
没关系这是我一生里最自由的时间,以前没有过,以后也不会有。
—— 上杉绘梨衣 《龙族》
本文简介:本讲我们将介绍两种最为常用的相关系数:皮尔逊person相关系数和斯皮尔曼spearman等级相关系数。它们可用来衡量两个变量之间的相关性的大小,根据数据满足的不同条件,我们要选择不同的相关系数进行计算和分析(建模论文中最容易用错的方法)。
二、皮尔逊person相关系数:☀️☀️☀️
1. 总体皮尔逊person相关系数
① 总体和样本
② 理解协方差(受量纲影响)
总体皮尔逊person相关系数就是在协方差消除量纲的基础上得到的。
③ 剔除量纲影响
Y = aX + b 可以看出总体皮尔逊person相关系数反映线性相关系数。
2. 样本皮尔逊person相关系数
3. 相关性可视化
① 皮尔逊person相关系数的一些误区
受异常值的影响很大。
这里虽然相关系数计算结果为0,但是x于y还是有明显的关系(二次函数)。
② 容易忽略和犯错的点
③ 对相关系数大小的解释
4. 例题
① 给出题目与Excel表
② 描述性统计
当拿到一些数据后,应该做一个描述性统计。
③ Execl描述性统计
③ SPSS描述性统计
④ 看完散点图(看出线性关系)再决定做相关系数计算
Matlab做法:
⑤ 用Excel表格美化相关系数表
颜色越深表示数据的绝对值越大。
三、补充:☀️☀️☀️
看到这里,小伙伴应该要先看完 相关性进行检验 那一讲。
3.1、皮尔逊相关系数假设检验的条件:
四、如何检验数据是否是正态分布:☀️☀️☀️
4.1 偏度和风度
代码块:
4.2 正态分布JB检验(大样本n>30) 推荐
4.3 Shapiro-wilk夏皮洛-威尔克检验(3 <= 小样本 <= 50) 推荐
4.4 Q-Q图 (不推荐)