分类问题(二元,多元逻辑回归,费歇尔判别分析)spss实操

news2025/1/25 20:43:00

分类模型:

二分类和多分类:

对于二分类模型

,我们将介绍逻辑回归Fisher线性判别分析两种分类算法;

对于多分类模型,我们将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步骤

二分类:

基于广义线性模型,假设因变量(类别)服从伯努利分布(二分类情况)。它通过构建逻辑函数,将自变量的线性组合映射到[0,1]区间,得到属于某一类别的概率

其中Y是类别变量,X是自变量,β是待估计的参数

引例:

根据水果的一些属性来判断水果的类别

ID

mass

width

height

color_score

fruit_name

1

192

8.4

7.3

0.55

apple

2

180

8

6.8

0.59

apple

3

176

7.4

7.2

0.6

apple

4

178

7.1

7.8

0.92

apple

5

172

7.4

7

0.89

apple

6

166

6.9

7.3

0.93

apple

7

172

7.1

7.6

0.92

apple

8

154

7

7.1

0.88

apple

9

164

7.3

7.7

0.7

apple

10

152

7.6

7.3

0.69

apple

11

156

7.7

7.1

0.69

apple

12

156

7.6

7.5

0.67

apple

13

168

7.5

7.6

0.73

apple

14

162

7.5

7.1

0.83

apple

15

162

7.4

7.2

0.85

apple

16

160

7.5

7.5

0.86

apple

17

156

7.4

7.4

0.84

apple

18

140

7.3

7.1

0.87

apple

19

170

7.6

7.9

0.88

apple

20

342

9

9.4

0.75

orange

21

356

9.2

9.2

0.75

orange

22

362

9.6

9.2

0.74

orange

23

204

7.5

9.2

0.77

orange

24

140

6.7

7.1

0.72

orange

25

160

7

7.4

0.81

orange

26

158

7.1

7.5

0.79

orange

27

210

7.8

8

0.82

orange

28

164

7.2

7

0.8

orange

29

190

7.5

8.1

0.74

orange

30

142

7.6

7.8

0.75

orange

31

150

7.1

7.9

0.75

orange

32

160

7.1

7.6

0.76

orange

33

154

7.3

7.3

0.79

orange

34

158

7.2

7.8

0.77

orange

35

144

6.8

7.4

0.75

orange

36

154

7.1

7.5

0.78

orange

37

180

7.6

8.2

0.79

orange

38

154

7.2

7.2

0.82

orange

二元逻辑回归

这里的y就是水果的类别,这里是Apple和orange,x就是mass,weight等等

接下来使用spss来进行逻辑回归

spss操作

1,生成虚拟变量:

如果apple就是1

不是apple就是0

2,使用spss进行二元逻辑回归

这里的原理就是极大似然估计

(分析->回归->二元logic回归)

紧接着对协变量进行分类;

如果有一些变量是定性变量,那么就要在这里面进行设置

选中那些定性变量,让他们表示为指示符

上面的如果是向前回归,就是0.05,向后的就是除去的概率就是0.1,基本不用调整什么

自助抽样运用于少量数据的时候

直接进行回归

这里告诉我们预测总体的预测正确率有76.3%

这里显著的只有width和height

针对新的数据进行预测,用到的是下面的公式

也就是

如何提高预测的准确率:

加入平方项和交互项目,

这样提高了预测的准确性,但是导致了每一个变量都不再显著了

(过拟合),只是对样本预测的好,但是不能代表对样本外的数据也有这样的预测准确性

所以可以80%作为训练组,20%为测试组,这样根据训练后的对测试组进行预测(手动扣掉已经知道的值)

 假设条件

二元逻辑回归:

1对自变量的分布没有严格要求,可以是连续变量、离散变量或二者混合。

2假设观测值之间相互独立,即每个样本的取值不受其他样本的影响。

3要求自变量与对数几率(logit)之间存在线性关系,即

Fisher线性判别分析

是一种经典的有监督的线性降维与分类方法,由罗纳德・费希尔(Ronald A. Fisher)提出。它的主要思想是找到一个最优的投影方向,将高维数据投影到低维空间,使得不同类别的数据在投影后能够尽可能地分开,同时同一类别的数据尽可能紧凑。

让他们在投影点上尽可能集中,不同的类的投影点中心尽可能的远离

它通过最大化类间散度与类内散度的比值(即 Fisher 准则函数)来确定投影方向w,其中SB是类间三度矩阵,Sw是类内散度矩阵.新的数据点通过投影到该方向上,并根据投影值与各类别投影中心的距离等规则进行分类。

Spss软件的操作

分析里面的分类的判别式

然后定义范围,在这里是 0-1

统计需要统计我们的费希尔判别系数和未标准化

分类

保存

下面是未标准化的w系数

最后会给出两列尺度,第一列表示属于0的概率,第二列表示属于1的概率

最后的结果

假设条件:

Fisher 判别分析:

1通常假设各类数据服从正态分布,且各类数据的协方差矩阵相等。在这些假设下,Fisher 判别分析能达到较好的效果。

2数据的特征之间具有线性关系,因为它是基于线性投影进行分类的。v

多分类问题:

ID

mass

width

height

color_score

fruit_name

kind

1

192

8.4

7.3

0.55

apple

1

2

180

8

6.8

0.59

apple

1

3

176

7.4

7.2

0.6

apple

1

4

178

7.1

7.8

0.92

apple

1

5

172

7.4

7

0.89

apple

1

6

166

6.9

7.3

0.93

apple

1

7

172

7.1

7.6

0.92

apple

1

8

154

7

7.1

0.88

apple

1

9

164

7.3

7.7

0.7

apple

1

10

152

7.6

7.3

0.69

apple

1

11

156

7.7

7.1

0.69

apple

1

12

156

7.6

7.5

0.67

apple

1

13

168

7.5

7.6

0.73

apple

1

14

162

7.5

7.1

0.83

apple

1

15

162

7.4

7.2

0.85

apple

1

16

160

7.5

7.5

0.86

apple

1

17

156

7.4

7.4

0.84

apple

1

18

140

7.3

7.1

0.87

apple

1

19

170

7.6

7.9

0.88

apple

1

20

194

7.2

10.3

0.7

lemon

2

21

200

7.3

10.5

0.72

lemon

2

22

186

7.2

9.2

0.72

lemon

2

23

216

7.3

10.2

0.71

lemon

2

24

196

7.3

9.7

0.72

lemon

2

25

174

7.3

10.1

0.72

lemon

2

26

132

5.8

8.7

0.73

lemon

2

27

130

6

8.2

0.71

lemon

2

28

116

6

7.5

0.72

lemon

2

29

118

5.9

8

0.72

lemon

2

30

120

6

8.4

0.74

lemon

2

31

116

6.1

8.5

0.71

lemon

2

32

116

6.3

7.7

0.72

lemon

2

33

116

5.9

8.1

0.73

lemon

2

34

152

6.5

8.5

0.72

lemon

2

35

118

6.1

8.1

0.7

lemon

2

36

342

9

9.4

0.75

orange

3

37

356

9.2

9.2

0.75

orange

3

38

362

9.6

9.2

0.74

orange

3

39

204

7.5

9.2

0.77

orange

3

40

140

6.7

7.1

0.72

orange

3

41

160

7

7.4

0.81

orange

3

42

158

7.1

7.5

0.79

orange

3

43

210

7.8

8

0.82

orange

3

44

164

7.2

7

0.8

orange

3

45

190

7.5

8.1

0.74

orange

3

46

142

7.6

7.8

0.75

orange

3

47

150

7.1

7.9

0.75

orange

3

48

160

7.1

7.6

0.76

orange

3

49

154

7.3

7.3

0.79

orange

3

50

158

7.2

7.8

0.77

orange

3

51

144

6.8

7.4

0.75

orange

3

52

154

7.1

7.5

0.78

orange

3

53

180

7.6

8.2

0.79

orange

3

54

154

7.2

7.2

0.82

orange

3

55

86

6.2

4.7

0.8

mandarin

4

56

84

6

4.6

0.79

mandarin

4

57

80

5.8

4.3

0.77

mandarin

4

58

80

5.9

4.3

0.81

mandarin

4

59

76

5.8

4

0.81

mandarin

4

Fisher判别分析

spss处理:

分析->分类->判别式

其他的统计,分类和保存的选择和之前的一样

下面是结果:

多元逻辑回归

spss操作:
分析->回归->多元逻辑回归

检测出来100%正确率

感觉有过拟合的问题,挑10%作为测试组,发现模型的预测准确率是100%,但是测试组的准确率是5/11,不到一半

所以有明显的过拟合的现象

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2281572.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

k8s使用nfs持久卷

开启持久化卷后可以实现服务开启在不同节点也能读取到和拿到服务节点的文件。 基本流程为将集群中一个节点作为服务节点安装共享储存应用的服务端选择目录和开启端口,其他节点根据端口挂载目录。然后使用kubesphere选择相应的镜像并将端口信息和挂载目录信息作为参…

kalman滤波器C++设计仿真案例

很多同学看了我之前的文章,都对kalman滤波器的原理有了理解,但我发现,在具体工程设计过程中,还是很多人都感觉到无从下手,一些参数也不知道如何选取。 这样吧。我这里举一些简单的例子,并用C来一步一步的进…

2025.1.21——六、BUU XSS COURSE 1 XSS漏洞|XSS平台搭建

题目来源:buuctf BUU XSS COURSE 1 目录 一、打开靶机,整理信息 二、解题思路 step 1:输入框尝试一下 step 2:开始xss注入 step 3:搭建平台 step 4:利用管理员cookie访问地址 三、小结 二编&#…

微信小程序使用上拉加载onReachBottom。页面拖不动。一直无法触发上拉的事件。

1,可能是原因是你使用了scroll-view的标签,用onReachBottom触发加载事件。这两个是有冲突的。没办法一起使用。如果页面的样式是滚动的是无法去触发页面的onReachBottom的函数的。因此,你使用overflow:auto.来使用页面的某些元素滚动&#xf…

Linux-arm(1)ATF启动流程

Linux-arm(1)ATF启动流量 Author:Once Day Date:2025年1月22日 漫漫长路有人对你微笑过嘛… 全系列文章可查看专栏: Linux实践记录_Once_day的博客-CSDN博客 参考文档: ARM Trusted Firmware分析——启动、PSCI、OP-TEE接口 Arnold Lu 博…

docker 部署 java 项目详解

在平常的开发工作中,我们经常需要部署项目,开发测试完成后,最关键的一步就是部署。今天我们以若依项目为例,总结下部署项目的整体流程。简单来说,第一步:安装项目所需的中间件;第二步&#xff1…

ARM64平台Flutter环境搭建

ARM64平台Flutter环境搭建 Flutter简介问题背景搭建步骤1. 安装ARM64 Android Studio2. 安装Oracle的JDK3. 安装 Dart和 Flutter 开发插件4. 安装 Android SDK5. 安装 Flutter SDK6. 同意 Android 条款7. 运行 Flutter 示例项目8. 修正 aapt2 报错9. 修正 CMake 报错10. 修正 N…

MySQL5.7安装超详细步骤(图文教程)

一.下载MySQL 1.在浏览器搜索MySQL,进入MySQL官网,点击下载,选下面的社区版本。 官网地址:MySQL :: Download MySQL Installer (Archived Versions) 二.安装MySQL 1.双击下载好的文件,选择自定义安装,然…

Tomcat下载配置

目录 Win下载安装 Mac下载安装配置 Win 下载 直接从官网下载https://tomcat.apache.org/download-10.cgi 在圈住的位置点击下载自己想要的版本 根据自己电脑下载64位或32位zip版本 安装 Tomcat是绿色版,直接解压到自己想放的位置即可 Mac 下载 官网 https://tomcat.ap…

语音转文字的先驱-认识Buzz的前世今生

Buzz 是一款基于 OpenAI Whisper 模型开发的开源语音转文字工具,其历史可以追溯到 Whisper 模型的推出,并在之后逐渐发展为一个功能强大且广泛使用的工具。以下是关于 Buzz 的详细历史介绍: 1. Whisper 模型的背景 Buzz 的核心是 OpenAI 开…

WPF5-x名称空间

1. x名称空间2. x名称空间内容3. x名称空间内容分类 3.1. x:Name3.2. x:Key3.3. x:Class3.4. x:TypeArguments 4. 总结 1. x名称空间 “x名称空间”的x是映射XAML名称空间时给它取的名字(取XAML的首字母),里面的成员(如x:Class、…

JavaWeb开发学习笔记——MySQL

跟着黑马程序员学习MySQLDay06-04. MySQL-DDL-数据库操作_哔哩哔哩_bilibili 注意,以下笔记中[ ]中都是可省略内容,如果不省略,那么直接写即可,不带[ ] MySQL-DDL 数据库操作 连接MySQL服务器:mysql -uroot -p密码…

CSS实现实现票据效果 mask与切图方式

一、“切图”的局限性 传统的“切图”简单暴力,但往往缺少适应性。 适应性一般有两种,一是尺寸自适应,二是颜色可以自定义。 举个例子,有这样一个优惠券样式 关于这类样式实现技巧,之前在这篇文章中有详细介绍: CSS 实现优惠券的技巧 不过这里略微不一样的地方是,两个…

【二叉树的深搜】二叉树剪枝

文章目录 814. 二叉树剪枝解题思路:深度优先遍历 后序遍历另一种写法 814. 二叉树剪枝 814. 二叉树剪枝 ​ 给你二叉树的根结点 root ,此外树的每个结点的值要么是 0 ,要么是 1 。 ​ 返回移除了所有不包含 1 的子树的原二叉树。 ​ 节点…

Codeforces Round 1000 (Div. 2) A-C

链接:Codeforces Round 1000 (Div. 2) A:Minimal Coprime 大意: 给定一个区间,定义最小互质区间是边界互质,边界内无互质区间。求这个区间最小互质区间个数 思路: gcd(l, l 1) gcd(1, l) 1,即相邻数组成的区间互…

基于Redis实现短信验证码登录

目录 1 基于Session实现短信验证码登录 2 配置登录拦截器 3 配置完拦截器还需将自定义拦截器添加到SpringMVC的拦截器列表中 才能生效 4 Session集群共享问题 5 基于Redis实现短信验证码登录 6 Hash 结构与 String 结构类型的比较 7 Redis替代Session需要考虑的问题 8 …

校验收货地址是否超出配送范围实战3(day09)

优化用户下单功能,加入校验逻辑,如果用户的收货地址距离商家门店超出配送范围(配送范围为5公里内),则下单失败。 提示: ​ 1. 基于百度地图开放平台实现(https://lbsyun.baidu.com/&#xff09…

Vue2.0+ElementUI实现查询条件展开和收起功能组件

一、需求 el-form如果查询条件过多,影响页面的展示效果。查询条件表单是我们系统中非常常见的功能,我们需要把它封装成一个通用的组件,方便在系统开发中提升开发效率。除了在实现基本查询条件的功能上,还需要实现多条件的折叠和展…

UE求职Demo开发日志#8 强化前置条件完善,给物品加图标

1 强化前置条件完善 StrengthManager里实现一个Check前置的函数 bool CheckPreAllIsActive(int index),所有的前置都已经激活就返回true,否则返回false 之后在强化的时候加入条件检查: 1.所有前置技能全部激活 2.本身没有强化过 最后测…

pinctrl子系统

目录 一、PinCtrl子系统的定义 二、明确PinCtrl子系统和我们编写驱动的关系 三、pinctrl_desc结构体引入 四、PinCtrl子系统驱动实现分析 1.芯片厂家是如何实现PinCtrl子系统的 2.linux在什么位置设置的引脚复用和电气属性 2.1 really_probe的主要功能 2.2 really_prob…