26版SPSS操作教程(高级教程第十七章)

news2025/1/4 17:46:37

目录

前言

粉丝及官方意见说明

第十七章一些学习笔记 

第十七章一些操作方法

聚类分析

均值聚类法(快速聚类法)

假设数据

预分析(描述统计)

先将除了ID变量的每个变量除以其最大值进行标准化操作

具体操作

结果解释

聚类结果的验证与自动优化

利用ANOVA复选框比较类别间的结果

结果解释

聚类结果的自动优化

层次聚类法

假设数据

具体操作

结果解释

改进聚类结果

结果分析

两步聚类法

数据假设

具体操作

结束语 


前言

#心静方能学习

#本期内容:聚类分析

#由于导师最近布置了学习SPSS这款软件的任务,因此想来平台和大家一起交流下学习经验,这期推送内容接上一次高级教程第十六章的学习笔记,希望能得到一些指正和帮助~

粉丝及官方意见说明

#针对官方爸爸的意见说的推送缺乏操作过程的数据案例文件澄清如下:1、操作演示的数据全部由我本人随意假设输进去的,重在演示操作;2、本人也只是在学习阶段,希望友友们能谅解哈,手里有数据的宝子当然更好啦,没有咱就自己假设数据练习一下也没多大关系的哈;3、我也会在后续教程中尽量增加一些数据的必要性说明;4、大家有什么好的意见也可以在评论区一起交流吖~

第十七章一些学习笔记 

  1. SPSS中聚类分析的核心在于让类别内的数据“差异”尽可能小,类别间“差异”尽可能大。--统计分析高级教程(第三版)P317
  2. 聚类的分类方式上有人将对变量的分类称为R型聚类,对案例的分类称为Q型聚类;若按照原理来划分的话,可以分为三种:1、非层次聚类法【non-hierarchical clustering,重新定位法目的是将案例快速分成K个类别,以K-均值聚类法最常用】;2、层次聚类法【hierarchical clustering,这种聚类方法结果间存在这嵌套或者层次关系,常用“谱系图”表示分析结果】;3、智能聚类法【最常见的是两步聚类法、最近邻元素法和神经网络中的自组织图(self-organization map,SOM)】。--统计分析高级教程(第三版)P318-319
  3. SPSS中若聚类的方法不是很满意,则可以考虑:1、对变量进行标准化;2、聚类用的变量的增删;3、变量变换、合并;4、离群值、缺失值的处理;5、距离测量方法的修改;6、聚类分算法的修改。--统计分析高级教程(第三版)P325
  4. SPSS中层次聚类法在面对样本量比较大的时候,存在计算速度比较慢的问题,随着计算机技术的发展,当样本量在5000例以下,且用于聚类在10个以内时,其计算速度还是可以接受的。--统计分析高级教程(第三版)P329
  5. SPSS中各种层次聚类法常用的方法有:1、最短距离法、中位数法和最长距离法;2、重心法【又称为质心聚类法(centroid clustering)】;3、组间连接法和组内连接法;4、瓦尔德法【也称为离差平方和法】。--统计分析高级教程(第三版)P333
  6. SPSS聚类分析的一些进阶操作:1、利用标准化来调整聚类模式【可以依据位置,也可以依据形状的相似性,即在“方法”的转换值中选择“按个案”或者“按变量”进行聚类】;2、如何选择聚类分析方法【聚类类型(若对个案进行聚类,各种方法都有可以考虑,对变量的话,一般只考虑层次聚类法),数据量(若数据量小于3000,各个方法都可以考虑,优先考虑层次聚类法,若数据量大于5000,且变量数目超过10个,则考虑快速聚类法或智能聚类法),变量类型(若都为连续变量,三种方法都可以考虑使用,若都包含,应使用智能聚类法),是否指定类别数量(快速聚类法需要给出聚类的类别数)】。对案例间距的定义也有分连续变量和二分类变量两组【1、连续变量距离有欧几里得距离(Euclidean distance)、欧几里得平方距离(squared Euclidean distance)、切比雪夫距离(Chebychev)、块(block)、明可夫斯基距离(Minkowski)、定制(customized);2、二分类变量距离欧几里得距离与欧几里得平方距离、大小差(size difference)、模式差(pattern difference)、方差(variance)、方差(variance)、兰斯-威廉姆斯(Lance and Williams)】。--统计分析高级教程(第三版)P340-341

第十七章一些操作方法

聚类分析

连续变量一般使用欧几里得平方距离作为测量指标,分类变量则一般使用卡方作为距离的测量指标。

数据标准化可以让部分极端数据与普通数据在聚类时所产生的贡献相同,但不建议部分场合一律对原始数据进行标准化,应视具体情况而定。

均值聚类法(快速聚类法)

这里的K表示所聚类的类别数,即聚类数

假设数据

预分析(描述统计)

先将除了ID变量的每个变量除以其最大值进行标准化操作

具体操作

结果解释

聚类结果的验证与自动优化

利用ANOVA复选框比较类别间的结果

结果解释

聚类结果的自动优化

后续可以考虑使用Python编程来实现

层次聚类法

考虑普通人与裁判的打分差异

假设数据

具体操作

结果解释

改进聚类结果

这里不采用冰柱图,是因为案例相对较少,当案例较多时,谱系图过大而难于观察,此时可以考虑冰柱图。

结果分析

两步聚类法

数据假设

具体操作

基于密度的聚类分析方法,也是需要R插件来实现的,故后续考虑编程来实现。

结束语 

#好啦~,以上就是我SPSS第三十五期学习笔记——高级教程第十七章的学习情况啦~,希望能与大家交流学习经验,共同进步吖~

#考虑高级教程的难度与深度,主要是内容太多辣,后续依然会尽力更新内容~争取日更!

#也非常感谢大家对我的一路陪伴,宝子们的关注、支持和打赏就是up儿不断更新滴动力,我近期也会坚持学习SPSS,更新相应的学习内容及笔记到平台上,咱们下期高级教程不见不散~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1633980.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OpenCV如何在图像中寻找轮廓

返回:OpenCV系列文章目录(持续更新中......) 上一篇:OpenCV如何模板匹配 下一篇 :OpenCV系列文章目录(持续更新中......) 目标 在本教程中,您将学习如何: 使用 OpenCV 函数 cv::findContour…

【Web】D^3CTF之浅聊d3pythonhttp——TE-CL请求走私

目录 step0 题目信息 step1 jwt空密钥伪造 step1.5 有关TE&CL的lab step2 TE-CL请求走私 payload1 payload2 step0 题目信息 注意到题目源码前端是flask写的,后端是web.py写的 frontend from flask import Flask, request, redirect, render_templat…

KMP算法与next数组【超详细】

一、朴素匹配法 S "abgabcd" T "abcd" 假设有两个字符串,要判断字符串T是否在字符串S中出现过&#xff0c;你会怎么做&#xff1f;一般来说我们都是这样&#xff0c;一个一个对比&#xff1a; #include<iostream> using namespace std; int mai…

机器学习:逻辑回归

概念 首先&#xff0c;逻辑回归属于分类算法&#xff0c;是线性分类器。我们可以认为逻辑回归是在多元线性回归的基础上把结果给映射到0-1的区间内&#xff0c;hθ&#xff08;x&#xff09;越接近1越有可能是正例&#xff0c;反之&#xff0c;越接近0越有可能是负例。那么&am…

C++中list的使用

文章目录 一、 list简介二、 构造函数1. 默认构造函数2. 拷贝构造3. 迭代器区间初始化4. 插入n个值为x的数据5. 代码示例 三、 容量和元素访问1. empty()2. size()3. max_size()3. back()4. front()5. 代码示例 四、 增删查改1. push_back()2. push_front()3. emplace_back()4.…

stm32f103zet6_串口实现-DHT11-tim1(定时)

1思路 1打开时钟 1.1使用定时器实现us级的计时 1.2在打开串口 1,3在DHT11驱动中修改引脚 stm32cudeMX 配置 1打开时钟 2打开串口 3打开tim1(定时器) 4生成代码 代码设置 1导入DHT11库(tim.h是定时器的文件系统自动生成的) DHT11.c #include "dht11.h" #inc…

机器学习:基于Sklearn、XGBoost框架,使用逻辑回归、支持向量机和XGBClassifier来诊断并预测一个人是否患有自闭症

前言 系列专栏&#xff1a;机器学习&#xff1a;高级应用与实践【项目实战100】【2024】✨︎ 在本专栏中不仅包含一些适合初学者的最新机器学习项目&#xff0c;每个项目都处理一组不同的问题&#xff0c;包括监督和无监督学习、分类、回归和聚类&#xff0c;而且涉及创建深度学…

nuxt3使用记录五:禁用莫名其妙的Tailwind CSS(html文件大大减小)

发现这个问题是因为&#xff0c;今天我突然很好奇&#xff0c;我发现之前构建的自动产生的200.html和404.html足足290k&#xff0c;怎么这么大呢&#xff1f;不是很占用我带宽&#xff1f; 一个啥东西都没有的静态页面&#xff0c;凭啥这么大&#xff01;所以我就想着手动把他…

爬虫实战-房天下(bengbu.zu.fang.com/)数据爬取

详细代码链接https://flowus.cn/hbzx/3c42674d-8e6f-42e3-a3f6-bc1258034676 import requests from lxml import etree #xpath解析库 def 源代码(url): cookies { global_cookie: xeqnmumh38dvpj96uzseftwdr20lvkwkfb9, otherid: b44a1837638234f1a0a15e…

Android Studio的笔记--布局文件

关于Layout布局文件的使用 LinearLayoutRelativeLayout之前文章的内容一些常见性质在android.graphics.Color中定义了12种常见的颜色常数线性布局LinearLayout 一些常见使用文本框TextView设置文本内容编辑框EditText获取文本内容按钮Button控件使用其他按钮修改图标及名称添加…

HEVC/H.265视频编解码学习笔记–框架及块划分关系

前言 由于本人在学习视频的过程中&#xff0c;觉得分块单元太多搞不清楚其关系&#xff0c;因此本文着重记录这些分块单元的概念以及关联。 一、框架 视频为一帧一帧的图像&#xff0c;其编码的主要核心是压缩空间以及时间上的冗余。因此&#xff0c;视频编码有帧内预测和帧间…

C语言函数指针的使用、函数指针数组及使用、指向函数指针数组的指针,指针进阶版的冒泡排序等介绍

文章目录 前言一、函数指针的使用1. 加减乘除计算器普通实现2. 加减乘除计算机函数指针实现 二、函数指针数组1. 函数指针数组的书写2. 两个有趣的代码3. 函数指针数组的使用 三、指向函数指针数组的指针四、指针进阶_冒泡排序1.整型冒泡排序2. C语言qsort函数3. 仿写C语言qsor…

第十二章 案例二:配置Trunk,实现相同VLAN的跨交换机通信

1、实验环境 公司的员工人数已达到 100 人&#xff0c;其网络设备如图12.13所示&#xff0c;现在的网络环境导致广播较多网速慢&#xff0c;并且也不安全&#xff0c;公司希望按照部门划分网络&#xff0c;并且能够保证一定的网络安全性 图12.13 实验案例二拓扑图 其网络规划…

【AIGC调研系列】来认识一下:WebLlama

WebLlama是一个基于Meta Llama 3构建的代理&#xff0c;专门为了网页导航和对话进行了微调。它是由McGill University的自然语言处理团队开发的研究项目&#xff0c;旨在通过对话进行网页浏览的智能代理[1][2]。WebLlama的目标是构建有效的人为中心的代理&#xff0c;帮助用户浏…

格雷希尔E10系列大电流测试连接器,在新能源汽车大电流接插件的电气测试方案

在新能源汽车的电驱动、电池包等设备的电测试处理中&#xff0c;格雷希尔E10系列电测试连接器具有显著的优势。E10系列的核心设计——插孔/插针&#xff0c;可以达到实验室10万次的插拔寿命&#xff0c;相比传统公母电接头500次左右的连接寿命&#xff0c;E10系列无疑大大减少测…

PCL 梯度滤波

文章目录 一、简介一、简介二、实现代码三、实现效果参考资料一、简介 一、简介 点云梯度滤波是指基于每个点与邻近点之间的倾斜程度进行滤波的算法,其原理也很简单,如下图所示: CloudCompare中的做法是: d i r = A B

网盘——删除常规文件

本文主要讲解网盘中文件操作部分的删除常规文件部分&#xff0c;具体实施步骤如下&#xff1a; 目录 1、具体步骤&#xff1a; 2、代码实现 2.1、添加删除常规文件的协议 2.2、添加删除常规文件槽函数 2.3、关联槽函数 2.4、添加槽函数定义 2.5、服务器回复 2.6、客户…

推荐一个wordpress免费模板下载

首页大背景图&#xff0c;首屏2张轮播图&#xff0c;轮换展示&#xff0c;效果非常的炫酷&#xff0c;非常的哇噻&#xff0c;使用这个主题搭建的wordpress网站&#xff0c;超过了200个&#xff0c;虽然是一个老主题了&#xff0c;不过是经得起时间考验的&#xff0c;现在用起来…

06|LangChain | 从入门到实战 -六大组件之Agent

点点赞~ 注意&#xff1a;langchain的版本迭代比较快&#xff0c;社区维护&#xff0c;代码当中或许部分方法在某个版本不再支持 01&#xff5c;LangChain | 从入门到实战-介绍 02&#xff5c;LangChain | 从入门到实战 -六大组件之Models IO 03&#xff5c;LangChain | 从入…

《R语言与农业数据统计分析及建模》——多重共线性和逐步回归

一、多重共线性 多重共线性&#xff1a;在多元线性回归时&#xff0c;多个自变量之间存在高度相关关系&#xff0c;时模型估计失真或难以估计准确的情况。 一般地&#xff0c;多元线性回归中自变量间应尽量相互独立。常规模型诊断方法难以检测多重共线性。 1、案例解释 作物产…