相关分析与回归分析

news2024/11/24 5:37:24

相关与回归分析就是了解变量之间相关关系的统计方法

一.相关分析

具有相关关系的变量之间,如果不区分原因和结果,我们称之为相关分析

相关分析是看两个因素之间的相关性,不需要确定哪个是自变量,哪个是因变量,两个因素是平行关系

1.变量之间的关系

2.函数关系

定义:当一个变量取一个值的时候,另一个变量有确定值与之对应

特点:变量之间是一一对应的确定关系;Y随X一起变化,并完全依赖于X;各观测点落在一条线上

3.相关关系

定义:变量之间保持着不确定性的数量依存关系,即变量间的关系不能用函数关系精确的表达

特点:一个变量的取值不能由另一个变量唯一确定;当变量X取某个值时,变量Y的取值可能有好几个;各观测点分布在直线周围

两个变量之间存在相关关系,并不一定意味着一个变量会影响到另一个变量,也不意味着两者存在实际关系,即数学关系 ≠ 实际关系

4.类型

正线性相关:一个变量增长,另一个变量也相应的增长

负线性相关:一个变量增长,另一个变量也相应的减少

不相关:两个变量之间是随机模式,不存在相关性

正相关不一定是正线性相关,还要看变量之间具体的函数F(x)是一次函数,还是二次函数或者其它曲线

如果是一次函数叫正线性相关,如果不是一次函数,就只能说两者是正相关,不能说正线性相关

区别是线性还是非线性,主要看函数y = F(x)对自变量x的依赖关系

线性相关的函数是一次函数,是正比例关系或者反比例关系,函数一般为y = Ax + B,其图像表现为一条直线

非线性相关的函数关系不是一次函数,图像不是直线,一般情况是曲线或抛物线关系

二.回归分析

具有相关关系的变量之间,如果存在因果关系,我们用回归分析来确定它们之间的关系

因果关系的表现形式

一种原因引起一种结果

多种原因引起一种结果

变量之间互为因果

1.相关分析与回归分析的关系

相关分析强调的是现象之间是否相关,相关的方向和密切程度,而回归分析则要分析现象之间的具体形式,确定其因果关系,并用数学模型来表现其具体关系

在研究相关分析时,不需要区分自变量和因变量,但回归分析的首要问题就是确定哪个是自变量,哪个是因变量

现象之间相关分析的研究,只能计算一个相关系数;而回归分析时回归系数可能有两个,也就是两现象互为因果关系时,可以确定两个独立回归方程,从而就有两个不同的回归系数

总结:相关分析是回归分析的基础和前提,只有变量之间存在高度相关时,进行回归分析确定相关的具体形式才有意义;回归分析是相关分析的继续和深入,变量之间的相关程度需要回归分析来确认

2.求最佳拟合线步骤

求出直线公式

将误差最小化

求误差平方和

所以,求最佳拟合线就是求使得误差平方和最小的那条直线

3.相关系数

对于直线y = A +Bx,尽管名为“最佳拟合线”,但我们并不知道这条线的准确性如何,还有一件事需要考虑,回归线的相关性强度

尽管最佳拟合线是与数据拟合程度最高的直线,但它并不能与每个点都精确拟合

让我们查看一些相关关系,看看直线和数据的拟合情况 

精确线性相关

直线和每个点几乎精确拟合

可以这样说,依据这条线做出的任何预测可能都是准确的

非线性相关

这一组数据未体现出线性相关性

你可以用最小二乘回归法算出一条回归线,但据此做出的任何预测都不太可能准确

两组数据都有回归线,但数据的实际拟合程度却不大相同,第一组数据的相关性十分明显,但第二组数据十分分散,以致回归线丧失了应有的作用

有一种方法可用于衡量直线拟合的程度:计算相关系数

相关系数是介于-1和1之间的一个数,描述了各个数据点与直线的偏离程度,通过它可以量度回归线与数据的拟合度,通常用字母R来表示

通常情况下,R介于[-1,1]之间,R越接近1或-1,相关性越强,数据点距离直线越近,拟合准确度越高;R越接近0,相关性越弱,数据点距离直线越远,甚至不存在相关关系

回归分析又称为曲线拟合,其本质就是一个函数估计的问题,即找出因变量和自变量之间的函数关系(因果关系)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/91378.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RK3568 GT911触摸屏调试

屏幕规格书 需要主要硬件通信电压为:1.8V或者3.3V I2C通信的地址:0x5D 和0x40 系统上电时序:不同的地址,稍微有些差异 对应代码中如下: 与RK3568的硬件接口电路 DTS 配置 驱动:RK自带的驱动程序就可以正确工…

音视频学习 -- 弱网对抗技术相关实践

背景介绍 实时音视频通话在当前的生活中是无时不刻存在的,包括社交、安防、交通等等各个方面都需要。用户场景复杂多变、要求严苛、网络环境不一致等给实时音视频通话带来很大条件。我们在这方向稍微做了一些工作,虽然和其他大厂的优化工作相比&#xf…

Commons Collections3

省流 SerialKiller 可以通过⿊名单与⽩名单的⽅式来限制反序列化时允许通过的 类,其中限制了cc1和cc2中命令执行的类,InvokerTransformer cc3就是为了绕过对其的限制,这里使用的是com.sun.org.apache.xalan.internal.xsltc.trax.TrAXFilter来…

基于改进的DBN降水预测方法(Matlab代码实现)

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述 精确高效的降水预测模型可以更好地反映未来的气候,为管理决策提供重要参考,帮助人们为未来的恶劣天气做…

首个元宇宙国家?!# Tuvalu

当我们还在谈论如何设计和构建一个未来城市的时候,首个入驻元宇宙的国家也诞生了。太平洋岛国「图瓦卢」开始 在虚拟世界创建一个数字国家。这是个怎样的国家?图瓦卢是位于南太平洋的一个岛国,人口约为 1.2 万,由 9 个环形小珊瑚岛…

FKM规范静强度和疲劳强度计算分析

1. 概述 WB-FKM/WB-FKM-Weld工具包是德国CADFEM公司基于FKM规范(德国机械协会主持和通过的机械产品强度评估规范)的基础上,在ANSYS WB内开发的针对结构母材及焊缝进行静强度和疲劳强度评估的工具包。 该工具包的最大优势是:基于AN…

艾美捷CpG ODN系列——ODN 2006 (TLRGRADE)说明

艾美捷CpG ODN系列——ODN 2006 (TLRGRADE):具有硫代磷酸酯骨架的CpG寡脱氧核苷酸(B型)。人和小鼠TLR9(Toll样受体9)的特异性配体。 艾美捷CpG ODN 丨ODN 2006 (TLRGRADE)化学性质: 序列:5-tcg…

减少win11核显占用的内存怎么操作

减少win11核显占用的内存如何操作是很多小伙伴反应的问题,当我们的电脑新安装完win11的时候会发现系统的内存占用比较高,但是自己却没有开任何的占用高的软件,下面小编给大家分享一下减少win11核显占用的内存操作方法吧,以便解决大…

音视频编解码 -- 编码参数 CRF

之前多多少少接触过一些编解码参数,CRF 参数也用过,但是最近在和朋友们聊天时,说到使用 FFMPEG 过程中碰到 CRF 参数,以及具体作用流程,这个之前一直没有跟踪过,也没有详细记录过,所以吊起了自己…

【笔记】计算机组成原理复习重点——篇四

计算机组成原理复习重点笔记 第4章 存 储 器 4.1 概述 存储一个二进制位的物理器件叫存储元。地址码相同的多个存储元构成一个存储单元。若干个存储单元构成存储体。多个存储体构成存储器。多个存储器构成存储体系。存储元→存储单元→存储体→存储器→存储体系 4…

pytorch实现运动鞋分类

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍦 参考文章地址: 365天深度学习训练营-第P5周:运动鞋分类🍖 作者:K同学啊一、前期准备 1. 设置GPU import torch from torch import nn imp…

Spring Batch 批处理-作业监听器

引言 接着上篇:Spring Batch 批处理-作业增量参数,了解作业参数增量器后,本篇就来了解一下Spirng Batch 作业监听器,看能玩出啥花样。 作业监听器 Spring Batch 步骤/作业的设计延续Spring传统设计模式,加入生命周期…

「Electron|快速开始」来写个Hello World桌面应用吧

本文主要介绍如何快速使用Electron生成一个Hello World应用 文章目录主要步骤一、准备工作创建项目安装electron二、编写electron应用所需的基本内容首先,我们需要给electron应用一个入口创建窗口往窗口里面放一个HTML界面,写上"Hello World!"…

计算机网络技术-常见网络命令

文档下载:https://download.csdn.net/download/weixin_57836618/87294136 实验2 常见网络命令 1. 实验目的与意义 ① 通过实验熟悉与网络相关的组件的含义和用途。 ② 了解系统网络命令的含义、用途和操作方法。 ③ 能够查看网络的状态,对网络进行简…

DEiT实战:使用DEiT实现图像分类任务(一)

DEiT实战摘要安装包安装timm数据增强Cutout和MixupEMA项目结构计算mean和std生成数据集摘要 DEiT是FaceBook在2020年提出的一篇Transformer模型。该模型解决了Transformer难以训练的问题,三天内使用4块GPU,完成了ImageNet的训练,并且没有使用…

mPEG-N3;mPEG-Azide;甲氧基聚乙二醇叠氮CAS:89485-61-0

叠氮化物/叠氮基官能化的甲氧基聚乙二醇(mPEG-N3)是一种单官能PEG衍生物,可用于修饰蛋白质,肽和其他材料。 叠氮化物基团可以在铜催化的水溶液中与炔烃反应。 也可以容易地还原成胺基。 名称 甲氧基聚乙二醇叠氮 mPEG-N3 别称 甲…

周志华 《机器学习初步》模型评估与选择

周志华 《机器学习初步》模型评估与选择 Datawhale2022年12月组队学习 ✌ 文章目录周志华 《机器学习初步》模型评估与选择一.泛化能力二.过拟合和欠拟合泛化误差 VS 经验误差过拟合 VS 欠拟合三.模型选择的三大问题如何获得测试结果:评估方法如何评估性能优劣&…

工厂设备管理中经常会遇到哪些问题?

我调查过上百家企业的设备管理问题,发现大家认为所有设备管理问题中,最典型的问题主要包括以下五个方面: 1)领导不重视管理 “生产量是最重要的”、“销售额是最重要”、“重ERP,轻现场管理”……等管理理念是企业中的…

镜像法的理解——工程电磁场 P9

模型一:无限大导体平面 此处有几点理解需要格外谈一下 1. 只有在有电力线的地方,才会产生电场的作用 2.对于下平面的分析,下平面如果存在电荷的话,必然存在电力线,那么从无穷远处做功到此处,必然会存在电…

Java网络多线程——UDP编程

UDP编程通信 基本介绍 类DatagramSocket和DatagramPacket【数据包/数据报】实现了基于UDP协议网络程序。UDP数据报通过数据报套接字DatagramSocket发送和接收,系统不保证UDP数据报一定能安全送到目的地,也不确信什么时候可以抵达。DatagramPacket对象封…