R语言作业--第六章判别分析

news2025/2/24 12:12:24

目录

思考题4)原题目:贝叶斯判别的基本思想是什么?

练习题第3题:以舒张期血压和讯将胆固醇含量预测被检查者是否患冠心病,测得15名冠心病人和16名健康人的舒张压。X1及血浆胆固醇含量X2,结果如表6-4。

练习题第4题:对于A股市场2009年陷入财务困境的上市公司(ST公司),我们收集了8间ST公司陷入财务困境前的一年(2008年)的财务数据,同时对于财务良好的公司(非ST公司),收集了同一时期8家非ST公司对应的财务数据。如表6-5所示:


思考题4)原题目:贝叶斯判别的基本思想是什么?

 

答:贝叶斯判别是根据最小风险代价判决或最大似然比判决,是根据贝叶斯准则进行判别分析的一种多元统计分析法。因为贝叶斯思想具有一定的“主观性”,使得贝叶斯统计变的强大且便利,其优势在于:即使在数据很少的情况下也可以进行推测,随着数据量的增大推测也会越来越准确并对所做信息做出瞬时反应,自动升级推测。

其基本思想是:

设有两个总体,它们的先验概率分别为,各总体的密度函数为在观测到一个样本x的情况下,可用贝叶斯公式计算它来自第k个总体的后验概率为:

一种常用判别准则是:对于待判样本x,如果在所有的 是最大的,则判定属于第总体。通常会以样本的频率作为各总体的先验概率。

练习题第3题:以舒张期血压和讯将胆固醇含量预测被检查者是否患冠心病,测得15名冠心病人和16名健康人的舒张压。X1及血浆胆固醇含量X2,结果如表6-4。

答:

前期准备:首先读入数据:

> library(readxl)

> E6.03<- read_excel("D:/Desktop/6.4.xlsx",  sheet = "E6.03")

> View(X6_4)

> attach(E6.03) 

  

 

(1) 对每一组数据用不同的符号作两变量的散点图,观察它们在平面上的散布情况,并判断对该组数据做判别分析是否合适?

 >plot(x1,x2)  #绘散点图

 > text(x1,x2,Y,adj = -0.5)     #标记处途中原始点

    

 

1与2分割较为明显,适合做判别分析。

(2) 分别建立距离判别(等方差阵和不等方差阵)、Fisher判别和Bayes判别分析模型,计算各自的判别符合率,以此确定哪种判别方法最恰当。

  假设两类总体都服从正态分布。

<1>距离判别,与Fisher判别、先验概率为频率的Bayes判别等价。

 > library(MASS)   #距离判别模型,注意,若想要运行下面命令,要先导包才可

 > ld=lda(y~x1+x2, data=E6.03);ld

 

> lp = predict(ld) # 在原训练集上 预测

> G1 = lp$class      # 判别结果

> tab1 = table(y, G1)# 判别矩阵

> tab1

 

>sum(diag(prop.table(tab1))) # 判对率

 

<2>Fisher判别分析

> lda_1 = lda(y ~ x1 + x2)

> lda_1

 

    

> pre2 = predict(lda_1)

> Y6 = pre2$class

> tab2 = table(y,Y6)

> tab2    # 判别矩阵

>sum(diag(tab2))/sum(tab2) # 判对率

 

<3>先验概率相同的Bayes判别

> lda_2 = lda(y ~ x1 + x2,prior = c(1,2)/3)

> lda_2  

  

 

> pre3 = predict(lda_2)

> Y7 = pre3$class

> tab3 = table(y,Y7)

> tab3

>sum(diag(tab2))/sum(tab3) # 判对率

 

综上所述,由以上结果,根据各自的判别符合率大小可知,距离判别最恰当。

(3)绘制线性判别函数图

> plot(lda_1)

 

练习题第4题:对于A股市场2009年陷入财务困境的上市公司(ST公司),我们收集了8间ST公司陷入财务困境前的一年(2008年)的财务数据,同时对于财务良好的公司(非ST公司),收集了同一时期8家非ST公司对应的财务数据。如表6-5所示:

 

数据涉及四个变量:资产负债率x1 、流动资产周转率x2 、总资产报酬率x3 和营业收入增长率x4。类别变量G中2代表ST公司,1代表非ST公司。

导入数据:

 

数据查看:

> dim(l6_5)#用于获取l6_5数据的维度

> duplicated(l6_5)#用于去重,标记TRUE的位置则表明数据重复

> l4<-unique(l6_5) #去除相同的行

 

  1. 分别建立线性判别,非线性判别和Bayes判别分析模型,计算各自的判别符合率,确定哪种方法最适合;

线性判别:

> library(MASS)  #导入MASS包

> ld=lda(G~x1+x2+x3+x4,data = l6_5) # 建立线性判别模型

> lp=predict(ld) # 根据线性判别模型预测所属类别

> G1=lp$class  # 预测的所属类别结果

> t1=table(G,G1) # 生成判别矩阵

> t1 # 查看判别矩阵

> r1=sum(diag(t1)/sum(t1)) # 计算判对率

> r1  # 查看判对率

 

非线性判别:

> qd=qda(G~x1+x2+x3+x4) # 建立非线性判别模型(二次判别)

> qd

> qp=predict(qd) # 根据非线性判别模型预测所属类别

> G2=qp$class # 预测的所属类别结果

> t2=table(G,G2) # 生成判别矩阵

> t2

> r2=sum(diag(t2))/sum(t2) # 计算判对率

> r2

 

Bayes判别:

假设两类总体均服从正态分布。则先验概率为频率的Bayes与线性判别的判别结果相同,下面建立先验概率相同的Bayes判别分析模型。

> ld2=lda(G~x1+x2+x3+x4,prior=c(1,1)/2,data = l6_5)# 建立 Bayes判别模型 (先验概率相等的情况)

> lp2=predict(ld2) # 根据Bayes判别模型预测所属类别

> ld2

> G3=lp2$class  # 预测的所属类别结果

> t3=table(G,G3) # 生成判别矩阵

> t3

> r3=sum(diag(t3))/sum(t3);r3  # 计算判对率

 

总结:由上述建立线性判别,非线性判别和Bayes判别分析模型,计算各自的判别符合率r1=0.875,r2=1,r3=0.875可知非线性判别分析模型最恰当。

  1. 某公司2008年财务数据为:x1:78.3563,x2:0.8895,x3:1.8001,x4:14.1022。试判定2009年该公司是否会陷入财务困境。

> predict(ld,data.frame(x1=78.3563,x2=0.8895,x3=1.8001,x4=14.1022))

 

总结:由上述预测结果判定为2可知->(陷入危机)的概率为87%,可信,2009年该公司会陷入财务困境。

> detach(l6_5) # 使用完毕,解绑

 

结束!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/10314.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Day03 leecode#有效的括号#合并两个有序链表

题目描述&#xff1a; 有效的括号 给定一个只包括 ‘(’&#xff0c;’)’&#xff0c;’{’&#xff0c;’}’&#xff0c;’[’&#xff0c;’]’ 的字符串 s &#xff0c;判断字符串是否有效。 有效字符串需满足&#xff1a; 左括号必须用相同类型的右括号闭合。 左括号必…

大模型相关资料整理

1. 大模型的挑战 GPT-3 175B模型的参数如下&#xff1a; 网络层&#xff08;Number of layers&#xff09;: 96 句子长度&#xff08;Sequence length&#xff09;: 2048 隐藏层大小&#xff08;Hidden layer size&#xff09;: 12288 词汇表&#xff08;Vocabulary size&#…

java高级--SpringBoot篇

目录 一、什么是SpringBoot 二、SpringBoot的特点 三、springboot快速入门 四、介绍配置文件的种类 五、开发环境配置文件的切换 六、读取springboot配置文件中的内容 七、Springboot注册web三大组件 八、SpringBoot的底层原理 8.1 包扫描的原理 8.2 springboot自动装配原理…

如何备考高级软考的系统架构设计师?

架构设计师是软考高级科目&#xff0c;比较难&#xff0c;每一年的通过率在15%左右。 不过软考它的特点是考察的深度不深&#xff0c;但是范围比较广&#xff0c;特别是高级&#xff0c;对项目经验比较看重&#xff0c;如果没有项目经验的朋友&#xff0c;一定要多准备项目素材…

springboot10:web开发常用功能(拦截器,文件上传,异常处理)

一.拦截器 1.使用 访问任何请求&#xff0c;都只有登录才能访问&#xff0c;挨个写入请求太困难&#xff0c;使用拦截器机制handlerIntercepter&#xff08;prehandle方法&#xff0c;posthandle方法,afterCompletion方法&#xff09;编写一个拦截器实现handlerInterceptor接…

算法与数据结构 - 字节跳动笔试题

😄这里将持续更新接下来做过的字节跳动公司相关的笔试题,包括网上收集的秋春招笔试题、以及自己参加的字节举办的编程赛的题目。 🚀导航: ID题目描述NO.1小红走迷宫简单、按逻辑写即可ACNO.2铺水管dfs回溯、注意剪枝才能ACNO.3喵汪故事借助二分才能ACNO.4小超的游戏pytho…

学术论文写作以及discussions/results与conclusion的区别

经验帖 | 如何写SCI论文&#xff1f; Result、Discussion和Conclusion区别解析 如何写学术论文 一篇论文只能有一个主题&#xff0c;不能出现过多的研究问题&#xff0c;这样只会让文章读起来很乱。就像大牛经常讲的&#xff0c;“one paper, one story”&#xff0c;一篇论文…

unix/linux make

GNU:make 参考文档 程序的编译和链接 一般来说&#xff0c;无论是C还是C&#xff0c;首先要把源文件编译成中间代码文件&#xff0c;在Windows下也就是 .obj 文件&#xff0c;UNIX下是 .o 文件&#xff0c;即Object File&#xff0c;这个动作叫做编译&#xff08;compile&…

HummerRisk V0.5.1 发布:新增对象存储、优化K8s 资源态势和资源拓扑等

HummerRisk V0.5.1 发布&#xff1a;新增对象存储对接查看功能&#xff0c;增加 K8s 资源的部署信息查看&#xff0c;深度优化K8s 资源拓扑&#xff0c;并优化了镜像检测、云检测及资源态势同步等多个内容。 感谢社区中小伙伴们的反馈&#xff0c;你们的认可是我们前进的动力。…

java中的函数式接口是什么?

问题现象&#xff1a; 最近在复习java基础知识&#xff0c;发现了一个面试题&#xff1a; java中的函数式接口是什么&#xff1f; 问题分析&#xff1a; 老实说&#xff0c;我一开始看到“函数式接口”这个术语&#xff0c;愣了一下&#xff1a; java中的函数式接口是什么&…

移动WEB开发之流式布局--二倍图

物理像素&物理像素比 物理像素点指的是屏幕显示的最小颗粒&#xff0c;是物理真实存在的。这是厂商在出厂时就设置好了,比如苹果6\7\8 是 750* 1334 物理像素比就是屏幕的分辨率&#xff0c;分辨率越高&#xff0c;显示越清楚&#xff0c;750* 1334就是横的有750的像素点…

运行mbedtls自带Demo ssl_client的记录

概述&#xff1a; 运行mbedtls自带 ssl demo的记录&#xff1b; 操作过程&#xff1a; 编译Demo&#xff0c;请看我专栏中的相关文章 先运行服务端程序&#xff0c;运行ssl_server.exe&#xff0c;运行结果如下&#xff1a; mbedtls-3.2.1\mbedtls-3.2.1\programs\ssl> .…

目标检测论文解读复现之九:基于改进YOLOv5的复杂场景下SAR图像船舶检测方法

前言 此前出了目标改进算法专栏&#xff0c;但是对于应用于什么场景&#xff0c;需要什么改进方法对应与自己的应用场景有效果&#xff0c;并且多少改进点能发什么水平的文章&#xff0c;为解决大家的困惑&#xff0c;此系列文章旨在给大家解读最新目标检测算法论文&#xff0…

Linux:shell编程(内含:1.shell简介+2.shell实操+3.shell的变量介绍+4.shell变量的定义)

1.shell简介&#xff1a; 解释&#xff1a;界面编写各种命令时&#xff0c;需要一个解释器&#xff0c;解释器先执行后给linux。执行完之后&#xff0c;结果返回给界面。经常使用的是bash。 注&#xff1a;若界面执行的命令比较复杂&#xff0c;可以写一个脚本&#xff0c;xxx…

医疗健康产品展:联影医疗

​ 国内医疗健康行业的独角兽公司&#xff08;估值超10亿&#xff09; 联影医疗 1 基本信息 联影医疗是一家医疗设备和医疗信息化解决方案提供商&#xff0c;为医疗机构提供涵盖影像诊断设备、放疗设备、服务培训、医疗IT的全方位医疗解决方案。 联影筹建于2010年10月&…

第七章 树与森林

树与森林 7.1树的概念与表示 7.1.1树的定义及相关术语 1&#xff0e;树的定义 ​ 树&#xff08;Tree&#xff09;是n&#xff08;n≥0&#xff09;个有限数据元素的集合。当n&#xff1d;0时&#xff0c;称这棵树为空树。在一棵非树T中&#xff1a; ​ ⑴有一个特殊的数据…

算法常见高数知识

文章目录1. 偏微分方程和常微分方程1.1 偏微分1.2 常微分2. 表示方法&#xff08;名词/notation&#xff09;2.1 莱布尼兹表示3. 空间直线及其方程4. 方向向量4.1 两点求方向向量高数课本(有目录)可以看这个链接&#xff1a;1. 高等数学第六版.同济大学数学系.扫描版.pdf 1. 偏…

《InnoDB引擎‍》 MySQL缓存池

‍MySQL缓存池 InnoDB存储引擎是基于磁盘存储的&#xff0c;并将其中记录按照页的方式进行管理。因此可以将其视为基于磁盘的数据库。 在数据库系统中&#xff0c;由于CPU速度和磁盘速度之间的鸿沟&#xff0c;基于磁盘的数据库系统通常使用缓冲池技术来提高数据库整体性能。 缓…

阿里P8MySQL,基础/索引/锁/日志/调优都不误,一锅深扒端给你

阿里P8MySQL&#xff0c;你知道都问些啥吗&#xff1f;昨天小编特意去搜集了一些MySQLP8问题&#xff0c;经过整理归纳分为基础、索引、锁、日志、调优、开放问题等等168道题目&#xff0c;拿出这些题来测试一下自己水平可否&#xff1f;&#xff1f;&#xff1f; 先上一张MySQ…

Tomcat 源码解析一请求处理的整体过程-黄泉天怒(上)

本博客的很多的理论知识都来源于 《Tomcat内核设计剖析》这本书&#xff0c;大家的兴趣去读这本书&#xff0c;对于想了解Tomcat源码的小伙伴&#xff0c;肯定对你有所帮助 &#xff0c;但是想自己有亲身体会的话&#xff0c;还是要深入源码。 不然知道这些理论的知识&#xff…