学习笔记|构建一元线性回归模型|方差分析|方差齐性|检验残差正态性|规范表达|《小白爱上SPSS》课程:SPSS第二十讲: 一元线性回归分析怎么做?

news2024/12/30 18:20:18

目录

  • 学习目的
  • 软件版本
  • 原始文档
  • 一元线性回归分析
    • 一、实战案例
    • 二、统计策略
    • 三、SPSS操作
    • 四、结果解读
      • 第一个表格为模型摘要
      • 第二表格为方差分析表
      • 第三个表格为模型系数
      • 第四张散点图(主要检验方差齐性)
    • 第五张直方图和P-P图(检验残差正态性)
    • 五、规范表达
      • 1、规范表格
      • 2、规范文字
    • 六、划重点

学习目的

SPSS第二十讲: 一元线性回归分析怎么做?

软件版本

IBM SPSS Statistics 26。

原始文档

《小白爱上SPSS》课程
#统计原理

一元线性回归分析

一元线性回归是指分析两个变量间(自变量x和因变量y)数量依存关系和影响的统计分析方法。
对于只涉及一个自变量的一元线性回归模型可表示为:
y= b0+b1 X+ϵ
Y:回归模型中的因变量,即样本的预测值。
X:回归模型中的自变量,即样本的特征数值。
ε:回归模型中的误差项,即不能被x与y之间线性关系解释的变异性。
b0:是常量。
b1: 回归系数。

一、实战案例

小白想了解下大侠的人均月收入能否预测他们年体育消费额,试构建一元线性回归模型,并检验其显著性。
读数据:

GET 
  FILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第二十讲:一元线性回归分析.sav'.

在这里插入图片描述
该案例主要研究人均月收入与体育消费额的关系,从专业知识上可认为人均月收入是可以预测他们的年体育消费额。

二、统计策略

针对上述案例,扪心六问。
Q1:本案例研究目的是什么?
A:关联研究,在理论上认为变量之间存在因果关系,即月收入可预测体育消费额。
Q2:本案例属于什么研究设计?
A:调查性研究。
Q3:分析数据有多少组?
A:两组数据。
Q4:有几个变量?
A:有两个变量,两变量均为连续性变量
自变量为人均月收入
因变量为体育年消费额。
Q5:变量之间是否相关?
A:变量之间需要满足线性相关,呈现线性趋势。
Q6:残差是否具有独立性、方差齐性和正态分布?
A:需要检验残差是否满足独立性、方差齐性和正态性
概括而言,如果数据满足以下条件,则可适用一元线性回归分析。
在这里插入图片描述

三、SPSS操作

Step1:根据散点图初步判断数据的趋势:依次点击“图形——旧对话框——散点图/点图”。
Step2: 在弹出的对话框中选择“简单散点图”,点击“定义”。将“体育年消费额”放进Y轴中,并将“人均月收入”放进X轴中,并添加标题“人均月收入与体育年消费额的关系”。
命令行:

GRAPH 
  /SCATTERPLOT(BIVAR)=人均月收入 WITH 体育年消费额 	/*X轴 WITH Y轴*/
  /MISSING=LISTWISE 
  /TITLE='人均月收入与体育年消费额的关系'.

在这里插入图片描述
在这里插入图片描述
根据散点图可得出,人均月收入和他们的年体育消费额存在较为正相关关系,适合建立一元线性回归模型。
Step3:依次点击“分析——回归——线性”
Step4:在弹出“线性回归”对话框中,将“年体育消费额”放入因变量框中,将“人均月收入”变量放入自变量框中,方法默认选择“输入”。
Step5:然后单击线性回归右侧的“统计”,在弹出的选项对话框中勾选“估算值”、“模型拟合”、“描述”和“德宾-沃森,单击“继续”。
在这里插入图片描述
Step6:在弹出“线性回归:图”对话框中将 “*ZRESID”(标准化残差)放入Y轴中,将“*ZPRED”(标准化预测值)放入X轴中,勾选“直方图”和“正态概率图”,单击“继续”。点击“确定”。
在这里插入图片描述
命令行:

REGRESSION 
  /DESCRIPTIVES MEAN STDDEV CORR SIG N 
  /MISSING LISTWISE 
  /STATISTICS COEFF OUTS R ANOVA 
  /CRITERIA=PIN(.05) POUT(.10) 
  /NOORIGIN 
  /DEPENDENT 体育年消费额 
  /METHOD=ENTER 人均月收入 
  /SCATTERPLOT=(*ZRESID ,*ZPRED) 
  /RESIDUALS DURBIN HISTOGRAM(ZRESID) NORMPROB(ZRESID)	/*德宾残差(默认值),直方图、正态概率图*/.

四、结果解读

测量的结果有多个表格,在此讲解几个重点表格。

第一个表格为模型摘要

在这里插入图片描述
a. 预测变量:(常量), 人均月收入
b. 因变量:体育年消费额
①R是回归的多重相关系数。当简单线性回归中只有一个自变量时,R值与因变量和自变量的皮尔逊相关系数相同,代表两者之间的相关程度。如该研究中R=0.515,提示月收入与体育消费额存在中等相关。但实际上,简单线性回归并不关注R值。
②***R2(R Square)***代表回归模型中自变量对因变量变异的解释程度,是分析回归结果的开始。本研究中,R2=0.266,提示自变量(月收入)可以解释26.6%的因变量(体育消费额)变异。但是,R2是会夸大自变量对因变量变异的解释程度,如果模型中增加一个自变量,即使这个自变量在统计上并不显著,R2也会增大
③调整 R2,是指剔除了自变量个数的影响,这使得调整R2永远小于R2,且调整R2的值不会由于自变量个数的增加而越来越接近1。本研究中,调整 R2=0.209,小于R2=0.266,校正了R2对于总体自变量对因变量变异解释程度的夸大作用。所以,当多个自变量,一般报告调整R2
④德宾-沃森(D-W)检验,一般检验值分布在0-4之间,越接近2,观测值相互独立的可能性越大。本例子中D-W=2.327,可以认为符合线性回归独立性的条件。

第二表格为方差分析表

在这里插入图片描述
a. 因变量:体育年消费额
b.预测变量:(常量), 人均月收入
由表中可知,F=4.704,P=0.049<0.05,具有统计意义,不支持原假设,即回归方程的线性关系显著。表明人均月收入是影响体育年消费额的显著性因素。

第三个表格为模型系数

在这里插入图片描述
a. 因变量:体育年消费额
①是回归系数b值,本例中常数和人均月收入的系数分别为-7567.916和2.002。可得出一元线性回归模型:y ̌=-7567.916+2.002×人均月收入
②是回归系数的抽样误差,即标准误。
③Beta值(β值),是标准化b值,标准化回归系数。可以用来比较各个自变量x对y的影响程度的。本例的标准化回归方程:y=0.515×人均月收入。
④t值,是各个回归系数进行假设检验的检验统计量,线性回归检验统计量为t值。
⑤显著性:即P值。P<0.05说明自变量与因变量回归关系成立,有关系,有影响。本例中回归系数达到显著水平(P<0.05),t=2.169, p=0.049。
上面一行是常量的t和p值,一般不用关注。

第四张散点图(主要检验方差齐性)

在这里插入图片描述
如果方差齐,不同预测值对应的残差应大致相同。即图中各点均匀分布,无特殊的分布形状。如果残差点分布不均匀,形成漏斗或者扇形,那么就方差不齐(如下图)。
在这里插入图片描述
本研究结果显示,标准化残差与标准化预测值的散点图中各点均匀分布,虽然在头部相对集中,但不是十分严重,因此认为满足方差齐。
当然,如果不满足方差齐性假设,我们也可以通过一些统计手段进行矫正。比如,采用加权最小二乘法回归方程,改用更加稳健的分析方法以及转换数据等。

第五张直方图和P-P图(检验残差正态性)

(1)标准化残差的直方图
在这里插入图片描述
从图中可以看出,标准化残差近似正态分布。
(2)残差的P-P图
在这里插入图片描述
P-P图各点分布离对角线越近,提示数据越接近于正态分布;如果各点刚好落在对角线上,那么数据就是正态分布。简单线性回归仅要求回归残差接近于正态分布,因此根据上图,我们认为该数据满足近似正态性。
综上检验可知,本案例的数据满足独立性、方差齐性和正态性三个条件。

五、规范表达

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范表格

在这里插入图片描述

2、规范文字

采用线性回归分析结果显示,人均月收入可显著预测体育消费额,β=0.515,t=2.169, p=0.049。人均月收入可解释体育消费额的26.6%的方差。

六、划重点

1、回归分析本质上是探讨变量之间相关关系,只有在理论上满足自变量与因变量之间存在因果关系,才可开展回归分析。此外,即使回归分析显著,在解释因果关系也需谨慎。
2、一元线性回归分析需要满足变量之间存在线性关系,如果不是,则不能采用线性回归分析,这可通过散点图来判断线性关系。
3、回归分析还需满足独立性、方差齐性和正态性。独立性采用德宾-沃森(D-W)残差相关性检验;方差齐性采用残差散点图来检验;正态性采用残差正态分布图和P-P图来判断。
4、如果回归分析只是建立自变量与因变量之间关系,无须根据自变量预测因变量的容许区间和可信度等,则方差齐性和正态性可以适当放宽。
5、回归分析一般要报告回归系数(b或β值)以及显著性(P值)、R2(或调整R2)和回归模型的方差分析结果(F值和P值)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1176233.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PHP语言、B/S手术麻醉临床信息管理系统源码

手术麻醉临床信息管理系统有着完善的临床业务功能&#xff0c;能够涵盖整个围术期的工作&#xff0c;能够采集、汇总、存储、处理、展现所有的临床诊疗资料。通过该系统的实施&#xff0c;能够规范麻醉科的工作流程&#xff0c;实现麻醉手术过程的信息数字化&#xff0c;自动生…

虚析构函数

1)类指针指向本身的对象 Son *xiaoming new Son; delete xiaoming; 构造及析构顺序&#xff1a; 父类构造 子类构造&#xff1b; 子类析构&#xff1b; 父类析构。 2)父类指针指向子类对象,&#xff0c;父类析构函数不是虚函数 Father *father new Son; delete f…

Redis-持久化

RDB快照&#xff08;snapshot&#xff09; &#xff08;1&#xff09;Redis将内存数据库快照保存dump.rdb的二进制文件中 &#xff08;2&#xff09;Redis将内存flush到磁盘文件的默认策略&#xff1a; N秒内数据集至少有M个改动 &#xff08;3&#xff09;Redis允许手动flush&…

Android Studio(RecyclerView)

前言 ListView的缺点&#xff0c;在RecyclerView得到了补充改善&#xff08;横纵向排列子元素、多列布局等等&#xff09; 代码 前面在适配器章节已经介绍了其对应的适配器&#xff0c;这里就简单展示一下多列布局的页面效果和相关代码 <androidx.recyclerview.widget.Recyc…

干货|AI辅助完成论文的正确打开方式!

论文写作中可能遇到问题 1. 选题问题&#xff1a;是否无法确定研究方向和选择合适的题目&#xff1f; 2. 文献综述问题&#xff1a;是否困惑如何进行文献调研和综述&#xff1f; 3. 方法论问题&#xff1a;是否不知道该选择何种研究方法&#xff1f; 4. 数据处理问题&#…

【Kubernetes部署】通过Kubeadm部署Kubernetes高可用集群

Kubeadm 一、kubeadm部署思路二、基本架构2.1 资源分配2.2 系统初始化操作&#xff08;所有节点&#xff09;2.2.1关闭防火墙、selinux和swap分区2.2.2 修改主机名&#xff0c;添加域名映射2.2.3 内核相关2.2.4 加载ip_vs模块2.2.5 时间同步 三、部署docker3.1 通过yum安装dock…

10个免费3D模型网站

作为一名独立游戏开发者,自己创建图形、配乐、动画和更多东西是相当具有挑战性的。 创建资产所需的成本和时间有时是许多游戏开发商无法承受的。 这就是他们选择在互联网上搜索免费内容的原因。现在,在浩瀚的内容海洋中获得如此免费的东西有点困难。 本文列出了 10 个免费 3D…

C语言34种运算符的用法解析

C 算术运算符 操作员运算符的含义加法或一元加法-减法或一元减法*乘法/分配%除法后的余数&#xff08;模除&#xff09; // 算数运算符的使用 #include <stdio.h> int main() {int a 9,b 4, c;c ab;printf("ab %d \n",c);c a-b;printf("a-b %d \n…

R语言环境下使用curl库做的爬虫代码示例

curl库是一个用于传输数据的工具和库&#xff0c;它支持多种协议&#xff0c;包括HTTP、FTP、SMTP等。在爬虫中&#xff0c;curl库可以用来获取网页内容&#xff0c;从而实现爬取网页的功能。通过设置curl的选项&#xff0c;可以实现对网页的请求、响应、重定向等操作。在使用c…

【前段基础入门之】=>CSS3新特性 @keyframes 动画

导语 在 CSS3 新特性中&#xff0c;新增了动画效果 的定义方式&#xff0c;这使得我们可以通过使用 CSS&#xff0c;从而开发出精美的动画效果&#xff0c;所以本章节&#xff0c;就来详细聊一聊如何通过 CSS 去创建一个动画效果案例 帧 **学习动画之前&#xff0c;我们得先了…

windows11 画图软件调整图片大小

win11自带的画图功能可以调整图片的大小和尺寸 搜索 画图&#xff0c;点击画图应用&#xff0c;打开图片 要把图片调整成800*1200。先打开文件菜单 选择图像属性 此处可以调整图片的尺寸和大小&#xff08;非等比例调整&#xff09; 选择图像下调整大小&#xff08;等比例调整…

什么叫SSH?原理详解,看这一篇就够了!

你们好&#xff0c;我的网工朋友。 SSH是一种加密的网络安全协议&#xff0c;用于安全地远程登录和执行命令。 目前SSH协议已经被全世界广泛使用&#xff0c;大多数设备都支持SSH功能。 但你真的会用吗&#xff1f; 今天就从SSH是什么、怎么用出发&#xff0c;给你详解一下之…

用AI魔法打败AI魔法

全文均为AI创作。 此为内容创作模板&#xff0c;在发布之前请将不必要的内容删除当前&#xff0c;AI技术的广泛应用为社会公众提供了个性化智能化的信息服务&#xff0c;也给网络诈骗带来可乘之机&#xff0c;如不法分子通过面部替换语音合成等方式制作虚假图像、音频、视频仿…

知识注入以对抗大型语言模型(LLM)的幻觉11.6

知识注入以对抗大型语言模型&#xff08;LLM&#xff09;的幻觉 摘要1 引言2 问题设置和实验2.1 幻觉2.2 生成响应质量 3 结果和讨论3.1 幻觉3.2 生成响应质量 4 结论和未来工作 摘要 大型语言模型&#xff08;LLM&#xff09;内容生成的一个缺点是产生幻觉&#xff0c;即在输…

el-select多选以tag展示时,超过显示长度以...省略号显示,且在一行展示

效果&#xff1a; 代码&#xff1a; <span>系统词典维度&#xff1a;</span><el-selectv-model"dNum"placeholder"请选择"multiplecollapse-tags //设置collapse-tags属性将它们合并为一段文字size"small"style"width:160p…

宏转录组分析揭示不同土壤生境中氮循环基因的表达

发表期刊&#xff1a;msystems 发表时间&#xff1a;2023 影响因子&#xff1a;6.4 DOI: 10.1128/msystems.00315-23 01、研究背景 与空白土壤相比&#xff0c;植物根系和根际细菌之间的相互作用调节了氮&#xff08;N&#xff09;的循环过程&#xff0c;并创造了富含低分…

维乐 Prevail Glide带你做破风王者,无阻前行!

对于自行车骑手来说&#xff0c;需要应对的问题有很多&#xff0c;其中最大的问题之一&#xff0c;就是「风阻」。风阻永远都是你越反抗越强&#xff0c;因此为了克服风阻的力量&#xff0c;时间久了&#xff0c;身体自然会造成一定程度的损伤。如何才能调整前行的步伐&#xf…

《006.Springboot+vue之旅游信息推荐系统》【有文档】

《006.Springbootvue之旅游信息推荐系统》【有文档】 项目简介 [1]本系统涉及到的技术主要如下&#xff1a; 推荐环境配置&#xff1a;DEA jdk1.8 Maven MySQL 前后端分离; 后台&#xff1a;SpringBootMybatis; 前台&#xff1a;vueElementUI; [2]功能模块展示&#xff1a; …

VSCode配置SonarLint/SonarLint连接SonarQube

本文介绍前端开发工具vscode安装sonarlint插件&#xff0c;配置本地代码扫描步骤 点击VSCode左侧工具栏的“扩展”&#xff0c;搜索“SonarLint”并安装插件 插件安装完成后&#xff0c;点击VSCode顶部工具栏的“查看”→“打开视图…”&#xff0c;并点击弹窗中的“SonarLint…

keil代码编辑区配色方案

第一步找到global.prop文件打开 ### 第二步复制下面的文本替换global.prop的内容&#xff0c;保存。 # properties for all file types indent.automatic1 virtual.space0 view.whitespace0 view.endofline0 code.page936 caretline.visible1 highlight.matchingbraces1 prin…