方差分析【单/双因素方差分析】

news2025/1/12 22:56:04

文章目录

  • 方差分析
      • 一、单因素方差分析(Analysis of Variance)
        • 1.方差分析在做什么?
        • 2.方差分析的思路:
        • 3.方差分析中的计算:
        • 4.构造F统计量:
      • 二、双因素方差分析(Two-way ANOVA)
        • 1.双因素方差分析在做什么?
        • 2.双因素方差探讨三个问题:
        • 3.双因素方差分析的检验思路
        • 4.双因素方差分析中的计算方法
        • 5.构造F统计量

方差分析

一、单因素方差分析(Analysis of Variance)

1.方差分析在做什么?
  • 比较不同分组(通常组别大于等于3)之间均值是否存在显著差异,如果组别是两组,直接使用t检验就可以;
  • n个分类,它们的某一些特征值的平均值,是否有显著区别;
    • 分类:因素(factor or independent variable)。是分类型变量,且类别大于3;
  • n个分类,它们的某一特征值的平均值,是否有显著区别;
    • 特征值(dependent variable):连续型变量;

在这里插入图片描述
在这里插入图片描述

2.方差分析的思路:
  • 数据整体波动(sum of squares total):组内波动与组间波动
  • 组内波动:
    • 某一分组内,个体特征值的离散程度
    • Sum of Squares Within,SSW
    • 例子:协和医学院学生考试成绩的离散程度
  • 组间波动:
    • 不同分组之间,分组特征值的平均值的离散程度
    • Sum of Squares Between,SSB
    • 例子:协和医学院、北大医学院、哈弗医学院,学生考试成绩均值的离散程度v

在这里插入图片描述
在这里插入图片描述

结论:

组间波动占整体越大,组内波动占整体越小,各组均值相等的可能性越小

组内波动占整体越大,组间波动占整体越小,各组均值相等的可能性越大

3.方差分析中的计算:
  • SST:

在这里插入图片描述

  • SSW:

在这里插入图片描述

  • SSB

在这里插入图片描述

  • 整体波动 = 组内波动 + 组间波动

在这里插入图片描述

4.构造F统计量:

在这里插入图片描述

  • 自由度

在这里插入图片描述

如果F统计量很大(例如:F统计量对应的P值小于0.05),意味着SSB显著的大于SSW,有理由认为各分组之间的平均值存在显著差异,拒绝原假设;

如果F统计量很小(例如:F统计量对应的P值大于0.05),意味着SSB不显著的大于SSW,有理由认为各分组之间的平均值不存在显著差别,接受原假设;

二、双因素方差分析(Two-way ANOVA)

1.双因素方差分析在做什么?

根据两个因素进行分组时,不同分组之间特征值的平均值是否相等。

  • 特征值:连续变量(例如:播放量、成绩)
  • 因素:分类型变量(例如:视频分区、学历、院校、性别)
  • 分类组别不一定大于3
2.双因素方差探讨三个问题:
  • 问题一:根据第一个因素进行分组时,不同分组之间的特征均值是否相等
    • 原假设:第一个因素对特征值没有显著影响
    • 备择假设:第一个因素对特征值均值存在显著影响
  • 问题二:根据第二个因素进行分组时,不同分组之间的特征均值是否相等
    • 原假设:第一个因素对特征值没有显著影响
    • 备择假设:第一个因素对特征值均值存在显著影响
  • 问题三:第一个因素和第二个因素的交互效应,是否对不同分组之间的特征值均值产生影响
    • 原假设:交换效应对特征值均值没有显著影响
    • 备择假设:交互效应对特征值均值存在显著影响
3.双因素方差分析的检验思路
  • 第一步:计算出因素一波动、因素波动、交互项波动、误差波动

  • 第二步:分别将因素一波动、因素二波动、交互项波动、与误差项波动进行比较

    • 因素一波动 v.s. 误差项波动进行比较
    • 因素二波动 v.s. 误差项波动进行比较
    • 交互项波动 v.s. 误差项波动进行比较

计算五个波动

  • 数据整体波动(sum of squares total)
  • 第一个因素所带来的波动(sum of squares first factor)
  • 第二个因素所带来的波动(sum of squares secon factor)
  • 两个因素交互项所带来的波动(sum of squares interaction)
  • 误差项所带来的波动(sum of squares error)

在这里插入图片描述

  • 例子:
  • 在这里插入图片描述
  • 在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
4.双因素方差分析中的计算方法
  • 数据整体波动:

    每个个体的数值减去总体的平均值的平方和
    在这里插入图片描述

  • 第一个因素所带来的波动

    认为的构造一组数据,使得它只有由性别引起的波动,而没有由其他因素引起的波动。
    在这里插入图片描述

  • 第二个因素所带来的波动

    人为的构造一组数据,使得它只有由医学院引起的波动而没有由其他因素引起的波动;

    在这里插入图片描述

  • 交互项所带来的波动

    交互项所带来的波动 = 模型波动 - 因素一波动 - 因素二波动

    • 模型波动

在这里插入图片描述

在这里插入图片描述

  • 误差项所带来的波动
    • 模型所不能解释的波动,个体取值减去模型所能解释的取值
    • 模型所能解释的取值:如果某个个体,只受性别和学校影响,不受其他因素的影响,个体取值应该为所在性别和学校的平均值

在这里插入图片描述

5.构造F统计量

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

根据F统计量,查找对应的p值,如果小于0.05,则表明因素显著的影响特征值,如果大于0.05或者大于提前设置的临界值,则表明因素对特征值取值没有显著的影响。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1854189.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HCIA 18 结束 企业总部-分支综合实验(上)

1.实验介绍及拓扑 (1)总部和分支机构都可以上互联网访问8.8.8.8; (2)总部和分支机构使用广域网专线互访作为主线,并且通过互联网建立GRE隧道互访作为备线; (3)总部内为…

【database3】oracle:数据交换/存储/收集

文章目录 1.oracle安装:swap,dd1.1 创建swap交换区:grep MemTotal /proc/meminfo (安装Oracle物理内存要求1024MB以上),grep SwapTotal /proc/meminfo1.2 安装依赖包及改系统核心参数:关闭一些系…

机器学习算法(二):1 逻辑回归的从零实现(普通实现+多项式特征实现非线性分类+正则化实现三个版本)

文章目录 前言一、普通实现1 数据集准备2 逻辑回归模型3 损失函数4 计算损失函数的梯度5 梯度下降算法6 训练模型二、多项式特征实现非线性分类1 数据准备与多项式特征构造2 逻辑回归模型三、逻辑回归 --- 正则化实现1 数据准备2 逻辑回归模型3 正则化损失函数4 计算损失函数的…

Cyber Weekly #12

赛博新闻 1、Anthropic发布Claude 3.5 Sonnet 本周五(6月21日)凌晨,Anthropic宣布推出其最新的语言模型Claude 3.5 Sonnet,距离上次发布Claude3才过去3个月。Claude3.5拥有20万token的长上下文窗口,目前已经在Claude…

企业中订单超时关闭是怎么做的?我说用延迟消息,面试官让我回去等消息?

文章目录 背景时序图方案对比方案一 被动关闭方案二 定时关闭方案三 Rocket MQ延迟消息 总结 背景 订单超时未支付是电商中的一个核心场景,当用户创建订单后,超过一定时间没有支付,平台需要及时将该订单关闭。需要关闭的主要原因有以下几个&…

初中英语优秀作文分析-005How to Plan Our Life Wisely-如何明智地规划我们的生活

PDF格式公众号回复关键字:SHCZYF005 记忆树 1 The “double reduction policy” reduces the burden on students and offers us more spare time than before, but how to plan our life wisely? 翻译 “双减政策”减轻了学生的负担,给了我们比以前更多的业余…

预备资金有5000-6000买什么电脑比较好?大学生电脑选购指南

小新pro14 2024 处理器:采用了英特尔酷睿Ultra5 125H或Ultra9 185H两种处理器可选,这是英特尔最新的高性能低功耗处理器,具有18个线程,最高可达4.5GHz的加速频率,支持PCIe 4.0接口,内置了强大的ARC核芯显卡…

Windows Update Blocker 完全禁用或启用Windows系统上的自动更新,一键阻止,无需额外操作!

你是否曾因为突如其来的系统更新而感到手忙脚乱?Windows Update Blocker v1.8让你只需一键,即可完全禁用或启用Windows系统上的自动更新,不需要任何的额外操作,只需要打开软件,点击应用即可关闭Windows系统上的自动更新…

DVWA-CSRF-samesite分析

拿DVWA的CSRF为例子 接DVWA的分析,发现其实Impossible的PHPSESSID是设置的samesite1. 参数的意思参考Set-Cookie SameSite:控制 cookie 是否随跨站请求一起发送,这样可以在一定程度上防范跨站请求伪造攻击(CSRF)。 下面用DVWA CS…

[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之五

“ 通过示范引领,激励多方主体积极参与,释放数据要素价值。” 本文为“数据要素”典型案例深度解析系列的第五篇,前四篇请见 [案例]国家数据局:首批“数据要素”典型案例深度解析系列之一 [案例]国家数据局:首批“数…

微信小程序入门2

微信开发者工具的安装方法 1.打开微信开发者工具下载页面 在微信小程序管理后台的左侧边栏中选择“开发工具”,然后选择“开发者工具”,即可找到微信开发者工具的下载页面。 2.打开微信开发者工具的下载链接页面 单击“下载” 按钮下载,即…

【网络安全的神秘世界】已解决burpsuite报错Failed to start proxy service on 127.0.0.1:8080

🌝博客主页:泥菩萨 💖专栏:Linux探索之旅 | 网络安全的神秘世界 | 专接本 | 每天学会一个渗透测试工具 解决burpsuite无法在 127.0.0.1:8080 上启动代理服务端口被占用以及抓不到本地包的问题 Burpsuite无法启动proxy…

深度学习 --- stanford cs231学习笔记五(训练神经网络的几个重要组成部分之二,数据的预处理)

数据的预处理(Data Preprocessing) 2 Data Preprocessing数据的预处理 数据预处理的几种方法 2,1 数据的零点中心化 数据的零点中心化的目的就是为了把数据的整体分布拉回到原点附近,也就是让数据的整体均值变为0。 ​ 2,2 数据的标准化 数据…

VS Code Arduino编程

①Arduino Arduino是一款便捷灵活、方便上手的开源电子原型平台。包含硬件(各种型号的Arduino板)和软件(Arduino IDE)。 ②VS Code(全称 Visual Studio Code) 是由微软开发的一款开源、轻量级的跨平台现代代码编辑器…

PADS学习笔记

1.PADS设计PCB流程 封装库(layout),原理图库(logic)的准备原件封装的匹配(logic)原理图的绘制(logic)导网表操作(logic)导入结构(lay…

一文掌握提升 Python 代码质量的最佳伴侣工具:black、isort、flake8 和 mypy

🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 在 Python 项目开发中,为了保持代码质量和提高开发效率,我们常需借助一些工具。今天,我将为大家介绍四个 Python 代码工程的得力助手:black、isort、flak…

风险评估概念

渗透服务只是风险评估的一种内容 风险评估的概念 是识别,控制,降低,或者消除可能影响到信息系统的安全风险过程。 风险评估的定义: 就是量化测评一种事情带来的影响,整个量化的过程是偏主观化(客户觉得) 风险的特…

AI 开发平台(Coze)搭建小游戏《挑战花光10亿》

前言 本文讲解如何从零开始,使用扣子平台去搭建一个小游戏 这是成品链接:挑战花光10亿 - 扣子 AI Bot (coze.cn) 欢迎大家去体验一下 效果 正文 什么是coze平台? 扣子(Coze)是字节跳动推出的一站式 AI 开发平台&am…

(4) cmake编译静态库和动态库

文章目录 静态库整体代码动态库编译整体代码执行结果(静态) 静态库整体代码 static.h #pragma onecevoid static_demo();static.cpp #include "static.h" #include <iostream>void static_demo(){std::cout<<"static demo"<<std::end…

动手学深度学习(Pytorch版)代码实践 -卷积神经网络-26网络中的网络NiN

26网络中的网络NiN import torch from torch import nn import liliPytorch as lp import matplotlib.pyplot as plt# 定义一个NiN块 def nin_block(in_channels, out_channels, kernel_size, strides, padding):return nn.Sequential(# 传统的卷积层nn.Conv2d(in_channels, ou…