【SAS应用统计分析】方差分析

news2025/1/10 23:29:20

声明:本文知识参考内容来自网络,如有侵权请联系删除。

目录

【anova过程】

1.anova过程的语句格式

2.语句说明

【glm过程】

1.glm过程的语句格式

2.语句说明

【实例分析】

【实验步骤】

总结


【anova过程】

        SAS系统的START软件提供了anova过程和glm过程等几个过程进行方差分析。

anova过程主要处理均衡数据,所谓均衡数据是指自变量的每种组合中的观察数是相等的,如果不相等则称为非均衡数据。对于均衡数据使用anova比使用glm计算快且占用内存少。如果实验设计不均衡,也不是上述的集中特定情况,那么应该使用glm过程。

1.anova过程的语句格式

anova过程的主要控制语句如下:

proc anova指定分析的数据集名<选项列表>;
        class变量列表;
        model因变量列表=自变量列表 </选项列表>;
        means效应列表 </选项列表>;
        test

<H=效应列表> E = 效应列表;

run;

        其中class语句、model语句是必需的,而且class语句必需出现在model语句之前。test语句必需放在model语句之后。 

2.语句说明

(1)proc means语句中的<列表选项>

  • manova ----  按多元方式删除哪些含有丢失值的观察,即在因变量中有丢失值就是从这次分析中删除这个观察
  • outstat   ----  输出数据集名  生成一个输出数据集,它包含模型中每个效应的平方和、F统计量和概率水平

(2)class语句

        在anova 过程中要使用的分类变量、区组变量必须首先在 clnss 语句的变量列表中说明class 语句是必需的,且必须放在 model 语前面。class 变量可以是数值型,也可以字符型。

(3)model语句

        该语句用来规定因变量和自变量效应。如果没有规定自变量的效应,则只拟合截距,假设检验为因变量的均值是否为 0。model 语句的主要形式有四种 :

  • 主效应模型

        model y=a b c;

  • 含有交叉因素的模型

        model y-a b c a*b a*c b*c a*b*c;

  • 嵌套模型

        model y=a b c(a b);

  • 包含嵌套、交叉和主效应的模型

        modely=a b(a) c(a) b*c(a);

        model 语句的选项列表有:int--打印与截距有关的假设检验结果。anova 过程总是把截距作为模型的一个效应进行处理,缺省时,不打印结果。

  • nouni   不打印单变量分析结果

(4)means语句

        该语句是用来计算在 means 语句后列出的每个效应所对应的因变量均值。anova 过程可以对出现在 model语句等号右边的任一效应计算因变量的均值。不过这些均值没有针对模型中的效应进行修正。如果需要修正的均值,应该调用glm 过程,使用其中的 Ismenas 语句。在anova过程里可以使用任意多个means 语句,它们放在model语句后面。

        Means 语句的选项列表主要有两个内容,一是选择多重比较的检验方法,二是规定这些检验的细节,注意这些细节选项只能用于主效应。        

        多重比较的检验方法

  • bon---对所有主效应均值之差进行 Bonferroni的t检验
  • duncan---对所有主效应均值进行 Duncan 的多重极差检验。
  • dunnett<('格式化对照值')>---进行 Dunnett 的双尾t检验。用以检验对所有主效应均值的某个水平作为对照,处理有无显著差异。为了规定这个对照效应的水平,在括号内用单引号把这个水平的格式化值括起来。缺省时,效应的第一个水平作为对照。
  • dunnetl<('格式化对照值')>---进行 Dunnett 的单尾t检验。检验是否任一个处理显
    著地小于这个对照。
  • dunnettu<('格式化对照值')>---进行 Dunnett 的单尾t检验。检验是否任一个处理显著地大于这个对照。
  • gabriel---对所有主效应均值进行 Gabriel的多重对比检验。
  • regwf---对所有主效应均值进行 Ryan-Einot-Gabriel-Welsch 的多重F检验
  • regwq---对所有主效应均值进行 Ryan-Einot-Gabriel-Welsch 的多重极差检验
  • scheffe---对所有主效应均值进行 Scheffe 的多重对比检验 
  • sidak---对所有主效应局值水平依期 Sidak 不等式进行调整后,对其均值之差两两进行t检验
  • Smm|gt2---当样本量不等时,基于学生化最大惯和 Sidak 不相关t不等式,使用Hochbeg 的 GT2方法,对主效应均值进行两两对比检验。
  • snk-对所有主效应均值进行 Studen-Newmnn-Keuls 的多重极差检验。进行·检股。
  • t|sd一对所有主效应均值进行两两 t 检验,它相当于在单元观察数相等时 Fishe的最小显著差 (Fisher's least-significant-dinerence)检验。
  • tukey---对所有主效应均值进行 Tukey 的学生化极差检验。对所有主效应均值进行
  • waller---对所有主效应均值进行 Waller-Duncan 的k 比率 (k-ratio) 检验。

        多重比较的检验细节

  • alpha=p--- 给出均值间对比检验的显著性水平。缺省值是 0.05。
  • cldiff--- 要求把两两均值之差的结果用置信区间的形式输出。
  •  clm--- 对变量的每个水平的均值按置信区间形式输出。
  • e=效应--- 指定在多重对比检验中所使用的误差均方.如果缺省,使用残差均方(MS)。指定的效应必须是在 model 语句中出现过的效应。
  • kratio=值--- 给出 Waller-Ducan 检验的类型 1/类型2的误差限制比例。Kratio 的合理值为 50、100、500,大约相当于两水平时 alpha 值为 0.1、0.05、0.01 的情况。缺省值为100。
  • lines--- 按下降次序列出所有检验方法产生的均值,并用一条线段在均值旁指出非显著的子集。
  •  hovtest---指定不同检验方法检验方差齐性,只适用于单因子方差分析,可供选择的方法有 hovtes=levenebartlett/bfjobrien。

(5)test语句

  • 在分析中,如果这个语句缺省,仍然使用残差均方(MS)作为误差项对所有平方和((SS)计算F值。但用户可以使用本语句要求使用其他效应作为误差项,得到另外的F检验。可以使用多个 test 语句,把它们放在 model 语句后面。Test 语句的选项为:
  • h=效应---规定模型里哪些效应用来作为假设的效应。
  • e=效应---规定一个且只能是一个效应用来作为误差项,这个说明项是必需的

【glm过程】

1.glm过程的语句格式

        Proc glm 是分析符合一般线性模型 (General Linear Models)的数据,因此取名 GLM。它能被用在许多不同的分析中,如简单回归、多元回归、方差分析、协方差分析、加权回归、多项式回归、偏相关分析、多元方差分析等。

        在glm过程中的大多数方差分析的语句和选项与anova过程中基本相同。用anova过程编写的程序几乎不用修改就可在 glm 过程中运行。gm 过程仅仅附加了三条语句:contrast、estimate 和lsmeans。contrast和estimate 语句允许你测试和估计均值的某种功能。Ismeans语句允许你计算调整后的均值。
        glm过程的主要控制语句如下:

proc glm指定分析的数据集名<选项列表>;
        class变量列表;
        model因变量列表=自变量列表 </选项列表>;
        contrast'标签'效应 值表 </选项列表>;
        estimate'标签'效应 值表 </选项列表>;
        lsmeans效应列表 </选项列表>;
        means效应列表 </选项列表>;
        output<out = 输出数据集名><统计关键字=变量名列表>;
        test

<H=效应列表> E = 效应列表;

run;

其中,class语句、model语句是必须的,而且class语句必须出现在model语句之前,其他语句必须放在model语句之后,下面介绍anova过程相比不同的语句和新增加的语句。

2.语句说明

(1)model语句

(2)contrast语句

 (3)Estimate语句

(4)Lsmeans语句

【实例分析】

【实验步骤】

步骤一,单因素方差分析(例3.1)

data veneer;                                                                                                                            
        input brand $ wear @@;                                                                                                          
        cards;                                                                                                                          
        ACME 2.3 ACME 2.1  ACME 2.4  ACME 2.5                                                                                           
        CHAMP 2.2 CHAMP 2.3 CHAMP 2.4 CHAMP 2.6                                                                                         
        AJAX 2.2  AJAX 2.0  AJAX 1.9  AJAX 2.1                                                                                          
        TUFFY 2.4 TUFFY 2.7 TUFFY 2.6 TUFFY 2.7                                                                                         
        XTRX 2.3  XTRX 2.5  XTRX 2.3 XTRX 2.4                                                                                           
;                                                                                                                                       
ods html file = 'D:\SAS\sasdata\shiyan\new.html';                                                                                       
proc anova data = veneer;/*调用anova过程进行单因素方差分析*/                                                                            
        class brand;  /*class必须放在model与means之前,用于指明统计模型的自变量*/                                                       
        model wear = brand;      /*model语句是因变量=实验效果值,因变量为wear*/                                                         
        means brand /hovtest;/*选项hovtest计算不同品牌经济方财胄灶的假设检验*/                                                           
run;                                                                                                                                    
ods html close;

程序的运行结果如下:

 结果由五部分组成:

(1)给出类水平信息:分类变量为brand,该水平量有5个水平,变量取ACME,AJAX,CHAMP,TUFFY,XTRE,以及数据集中有20个观测值(此处忽略)

(2)方差部分分析:

 对模型的F检验与对分组变量的F检验结果时一致的,因为Model语句中唯一的变差来源就是这一个变量。

(3)Levene的方差齐性检验部分:检验结果表明,不能拒绝不同品牌组间观测值的方差是相等的 假设。

(4)输出了每种品牌的观测值、均值和标准差。

方差分析的结果表明,总体F检验是极显著的,说明模型是有意义的。品牌的F检验也是极显著的,说明至少有两种品种的树高生长量(平均值)有显著差异,但并没有指明具体哪些品种之间有差异,需要通过多重比较来实现。程序如下:

data veneer;                                                                                                                            
input brand $ wear @@;                                                                                                                  
cards;                                                                                                                                  
        ACME 2.3 ACME 2.1  ACME 2.4  ACME 2.5                                                                                           
        CHAMP 2.2 CHAMP 2.3 CHAMP 2.4 CHAMP 2.6                                                                                         
        AJAX 2.2  AJAX 2.0  AJAX 1.9  AJAX 2.1                                                                                          
        TUFFY 2.4 TUFFY 2.7 TUFFY 2.6 TUFFY 2.7                                                                                         
        XTRX 2.3  XTRX 2.5  XTRX 2.3 XTRX 2.4                                                                                           
;                                                                                                                                       
proc anova data = veneer;                                                                                                               
class brand;                                                                                                                            
model wear = brand;                                                                                                                     
means brand/duncan;/*使用means语句进行多重比较,选项duncan是要求计算输出组间均值比较多的多重极差检验*/                                  
means brand/lsd clm cldiff;    /*使用means语句进行多重比较,选项lsd clm cldiff分别要求对各组间均值之间采用最小显著差检验,输出组间的均值及均值置信区间、各组均值之差的置信区间*/                                                                                                         
run;

 

 

 (1)程序运行的主要结果

 (2)均值的两两t检验、各组均值的置信区间及采用最小显著差检验

 步骤二,双因素方差分析(考虑交互作用)(例3.2)

options linesize=76;                                                                                                                    
data shoushizhe;                                                                                                                        
do a=60 to 120 by 20;                                                                                                                   
        do b=1 to 4;                                                                                                                    
                do i = 1 to 2;                                                                                                          
                input energy @@ block; output;                                                                                                
                end;                                                                                                                    
        end;                                                                                                                            
end;                                                                                                                                    
drop i;                                                                                                                                 
cards;                                                                                                                                  
2.70 3.30 1.71 2.14 1.90 2.00 2.72 2.85                                                                                                 
1.38 1.35 1.74 1.56 3.14 2.29 3.51 3.15                                                                                                 
2.35 1.95 1.67 1.50 1.63 1.05 1.39 1.72                                                                                                 
2.26 2.13 3.14 2.56 3.17 3.18 2.22 2.19                                                                                                 
;                                                                                                                                       
run;                                                                                                                                    
                                                                                                                               
proc anova data =shoushizhe;                                                                                                            
class a b;                                                                                                                              
model energy = a b a*b;                                                                                                                 
test h = a e=a*b;                                                                                                                       
means a/duncan e= a*b;                                                                                                                  
run;

 

步骤四,不等重复实验的方差分析

data turang;                                                                                                                            
do soil=1 to 3;                                                                                                                         
        input m @@;                                                                                                                     
        do repl =1 to m;                                                                                                                
        input height @@;output;                                                                                                         
        end;                                                                                                                            
end;                                                                                                                                    
drop repl;                                                                                                                              
cards;                                                                                                                                  
5 53 47 41 43 48                                                                                                                        
8 64 62 57 70 71 82 78                                                                                                                  
6 56 61 52 48 52 46                                                                                                                     
;                                                                                                                                       
proc glm;                                                                                                                               
class soil;                                                                                                                             
model height=soil;                                                                                                                      
quit ;                                                                                                                                  
run;

总结

  • 掌握用anova过程分别进行单因素方差分析和等重复的双因素方差分析
  • 掌握用glm过程进行不等重复的方差分析
  • 了解do语句的格式和用法 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/482699.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TensorRT:自定义插件学习与实践 001

文章简述 本文简单列出了编写Tensorrt插件所需要的关键方法,分为两个部分&#xff0c;一是插件类的具体实现方法&#xff0c;另外是插件工厂的调用方法,插件类最终将编译为.so文件,使用时在c或python中调用,所以插件类的方法调用在其他部分&#xff0c;在本文中难以直观的体现调…

PyQt5

最近在学习pyqt5&#xff0c; 使用pyqt5的时候出现了一些莫名奇妙的问题&#xff0c;解决之后决定把它记录下来&#xff0c;方面pyqt5的初学者使用。 每个问题会按照如下方式进行描述 1、问题描述&#xff1a; 2、解决方法&#xff1a; 问题1&#xff1a; 使用pyinstaller打…

计算机网络笔记:TCP三次握手和四次挥手过程

TCP是面向连接的协议&#xff0c;连接的建立和释放是每一次面向连接的通信中必不可少的过程。TCP连接的管理就是使连接的建立和释放都能正常地进行。 三次握手 TCP连接的建立—三次握手建立TCP连接 ① 若主机A中运行了一个客户进程&#xff0c;当它需要主机B的服务时&#xff0…

迁移学习

迁移学习 什么是迁移学习 迁移学习【斯坦福21秋季&#xff1a;实用机器学习中文版】 迁移学习&#xff08;Transfer Learning&#xff09;是一种机器学习方法&#xff0c;它通过将一个领域中的知识和经验迁移到另一个相关领域中&#xff0c;来加速和改进新领域的学习和解决问…

OS开源项目周报0105

由OpenDigg 出品的iOS开源项目周报第四期来啦。iOS开源周报集合了OpenDigg一周来新收录的优质的iOS开发方面的开源项目&#xff0c;方便iOS开发人员便捷的找到自己需要的项目工具等。 Hero 酷炫的iOS动画引擎 Traits 实时修改原生iOS 应用属性 JSDBanTangHomeDemo 仿半糖首页…

【Git】‘git‘ 不是内部或外部命令,也不是可运行的程序

一、问题 我想利用git clone命令从github上下载项目源代码&#xff0c;发现报错&#xff1a; git 不是内部或外部命令&#xff0c;也不是可运行的程序或批处理文件。我用cmd跑一下git命令&#xff0c;发现报错&#xff1a; 二、问题分析 这个错误提示表明您的系统中没有安装…

Illustrator如何使用基础功能?

文章目录 0.引言1.菜单栏2.工具箱 0.引言 因科研等多场景需要进行绘图处理&#xff0c;笔者对Illustrator进行了学习&#xff0c;本文通过《Illustrator CC2018基础与实战》及其配套素材结合网上相关资料进行学习笔记总结&#xff0c;本文对软件界面基本功能进行阐述。    1…

第四章 数据关联分析方法

基本概念和方法 关联规则和算法应用 基本概念和术语 关联规则算法应用&#xff1a; 一个关联规则分析的例子—————超市购物篮分析 不要看 后面数字看不懂 项集&#xff1a;是指项的集合。包含k个项的项集称为k-项集 支持度&#xff1a;若A是一个项集&#xff0c;则A的…

Vue3 +TypeScript 引入 BabylonJs(Vue3实现3D)【一篇文章精通系列】

本文主要介绍如何使用Vue3和TypeScript引入BabylonJs技术实现3D效果。结合实际案例&#xff0c;详细讲解了如何在Vue3项目中引入BabylonJs&#xff0c;并了解其相关知识。通过本文的学习&#xff0c;相信读者可以轻松掌握Vue3实现3D效果以及BabylonJs的相关知识。 Vue3 TypeS…

天梯赛L1-001 ~ 010

&#x1f442; White Lie - Jhameel - 单曲 - 网易云音乐 &#x1f442; 丁丁猫儿 - 施鑫文月 - 单曲 - 网易云音乐 今年蓝桥 / 天梯都陪跑&#xff0c;希望明年&#xff0c;蓝桥杯省一&#xff08;CA组60分&#xff09;&#xff0c;天梯赛国三&#xff08;180分&#xff09;…

详细的实用技巧,让你轻松成为WEB自动化测试大师

目录 一、什么是WEB自动化测试 二、WEB自动化测试工具 三、SeleniumPython环境搭建 1. 安装Python解释器 2. 安装Selenium库 3. 下载浏览器驱动程序 4. 配置环境变量 四、WEB自动化测试实战 1. 编写测试脚本 2. 使用Page Object模式 3. 使用数据驱动测试 五、总结 …

【PowerDesigner】一款超好用的E-R图工具,快速构建出高质量的数据库结构,提高开发效率和代码质量

博主简介&#xff1a;努力学习的大一在校计算机专业学生&#xff0c;热爱学习和创作。目前在学习和分享&#xff1a;数据结构、Go&#xff0c;Java等相关知识。博主主页&#xff1a; 是瑶瑶子啦所属专栏: Mysql从入门到精通 近期目标&#xff1a;写好专栏的每一篇文章 文章目录…

IPsec IKE第一阶段主模式和野蛮模式

国密标准GMT 0022-2014 IPSec VPN 技术规范&#xff0c;IPsec IKE过程中交换类型的定义将主模式Main mode分配值为2&#xff0c;快速模式-quick mode分配值为32。标准中并没有提现分配值为4的交换类型。在实际应用中&#xff0c;IKE第一阶段经常会出现交换类型为4的情况&#x…

留守儿童爱心网站

摘要 随着留守儿童爱心管理的不断发展&#xff0c;留守儿童爱心网站在现实生活中的使用和普及&#xff0c;留守儿童爱心管理成为近年内出现的一个热门话题&#xff0c;并且能够成为大众广为认可和接受的行为和选择。设计留守儿童爱心网站的目的就是借助计算机让复杂的管理操作…

【C++】-关于类和对象的默认成员函数(中)-拷贝构造函数和赋值运算符重载函数

&#x1f496;作者&#xff1a;小树苗渴望变成参天大树 ❤️‍&#x1fa79;作者宣言&#xff1a;认真写好每一篇博客 &#x1f4a8;作者gitee:gitee &#x1f49e;作者专栏&#xff1a;C语言,数据结构初阶,Linux,C 如 果 你 喜 欢 作 者 的 文 章 &#xff0c;就 给 作 者 点…

带你玩转单向链表(学习必备)

本文概要 本篇文章主要介绍数据结构中单向链表各种操作&#xff0c;适合有C语言基础的同学&#xff0c;文中描述和代码示例很详细&#xff0c;干货满满&#xff0c;感兴趣的小伙伴快来一起学习吧&#xff01; &#x1f31f;&#x1f31f;&#x1f31f;个人简介&#x1f31f;&…

Redis入门到实战(实战篇)

Redis基础篇 实战篇Redis 开篇导读 亲爱的小伙伴们大家好&#xff0c;马上咱们就开始实战篇的内容了&#xff0c;相信通过本章的学习&#xff0c;小伙伴们就能理解各种redis的使用啦&#xff0c;接下来咱们来一起看看实战篇我们要学习一些什么样的内容 短信登录 这一块我们会使…

携程:一个被严重低估了的在线旅游平台?

来源&#xff1a;猛兽财经 作者&#xff1a;猛兽财经 携程和旅游行业面临的不利因素依然存在 在疫情期间&#xff0c;由于全球范围内的旅行受到了限制&#xff0c;所以整个旅游行业都受到了巨大打击。休闲旅游和商务旅行也陷入了停顿&#xff0c;此后一直在缓慢恢复。 而当疫情…

Java8流式操作——最终操作

什么是最终操作&#xff1f; 当我们通过最终方法对流对象进行操作&#xff0c;说明stream流操作也完成&#xff0c;最后我们将对象汇总成一个结果&#xff08;总数、对象、集合……&#xff09; 方法 collect&#xff1a;将Stream中的元素汇总&#xff08;转化&#xff09;成…

探索三维世界【2】:Three.js 的 Texture 纹理

缤纷三维世界大揭秘&#xff1a;探索 Three.js 的 Texture 纹理 1、Texture纹理2、TextureLoader 纹理加载器2.1、创建纹理加载器2.2、纹理属性设置2.3、设置纹理渲染2.4、打光 3、完整代码与展示 1、Texture纹理 Texture 是 three.js 中的“纹理”概念。纹理是指将一张图像映…