SPSSPRO数据分析之——CSI指纹数据分析(预处理、降维等)

news2024/9/28 7:28:43

目录

一、前言

二、数据准备

三、进行预处理 

四、进行降维任务

五、正态性检测 

六、描述性统计

七、频数分析

八、代码功能


一、前言

SPSSPRO是一款全新的在线数据分析平台,可以用于科研数据的分析、数学建模等,对于那些不会编程或者刚进入科研的新人来说,这款工具再合适不过了。当然本人只是很早之前建模用过,所以有点关公面前武大刀的嫌疑。

二、数据准备

1、首先准备一份数据,这份数据需要表头等信息,我以一份CSI幅值数据为例(300行*30列)。当然表头可以自己打上去,也可以使用MATLAB或者其它程序进行标签。MATLAB打上表头标签:

T = array2table(raw_amp);
writetable(T,'SpassTest.xlsx');

 2、将生成的表格导入spasspro里面,并查看数据:

三、进行预处理 

1、数据处理——>异常值处理

2、 选择三倍标准差进行预处理,对检测出的异常值可以直接剔除,也可以用中位数、平均数、众数等替代,具体根据你的任务来。只需要将m维定量拖进已选变量中就行。

 3、生成处理完成的数据,表头名字由上图第四项决定(我们选择的是默认):

四、进行降维任务

1、根据自己的任务选择合适的降维算法,这里选择PCA算法进行线性降维,如果你的数据是非线性的,可以采用KPCA降维算法。总方差解释率表示降维后保留多少信息,一般选择在90%-99%之间,可以根据自己的任务来。

2、 生成降维后的数据,这里我们是从30维降至15维

3、降维的相关性分析

数据分析——>选择分析项目——>选择相关性分析

 生成降维后的相关性热力图,从热力图也可以看出降维后的特征正交(即互不相关,相关性系数为0)

五、正态性检测 

1、选择算法——>描述性分析——>正态性检测,以第一维度的数据为例:

 上图展示了Dim3数据的正态性检验直方图,若正态图基本上呈现出钟形(中间高,两端低),则说明数据虽然不是绝对正态,但基本可接受为正态分布。从检测的结果来看,30个维度基本可接受为正态分布。

2、正态性检验P-P图

 上图是Dim1计算观测的累计概率(P)与正态累计概率(P)的拟合情况。拟合程度越高越服从正态分布。从检测的结果来看,30个维度基本可接受为正态分布。

六、描述性统计

首先,对总体的各项统计指标进行整体描述分析。其次,对异常或者表现得较为突出的指标进行分析,例如高方差、高平均值等等。

变量名样本量最大值最小值平均值标准差中位数方差峰度偏度变异系数(CV)
Dim1_异常值处理30016.3510.08313.5711.11613.6261.246-0.014-0.2910.08225067000693603
Dim2_异常值处理30029.4516.86223.9342.27124.2765.160.247-0.4570.09490615857836082
Dim3_异常值处理30033.72417.3226.1242.94926.3828.6960.259-0.250.11288086696067898
Dim4_异常值处理30031.03715.18823.4852.85523.6298.1520.272-0.1240.12157260045341392
...................................................................................................
Dim30_异常值处理3004.20301.8770.8521.8260.726-0.4070.3260.4538913156287607

上表展示了描述性统计的结果,包括样本量、最大值、最小值等统计量,用于研究定量数据的整体情况。下图为某个维度的散点图可视化。

七、频数分析

下图展示了频数分析的结果,包括变量、频数、百分比等:

八、代码功能

1、SPSSPRO可直接编译python语言

2、 除了提供常用的py库外,还可以自己安装一些开源库

 3、查看SPSSPRO已有的库,或者自己安装的库

4、利用代码进行导入数据的可视化,比如我们的数据是300*30的,进行可视化

(1)导入相应的库和数据

import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_excel('SpassTest.xlsx')

 (2)打印数据

(3)可视化原始数据及三倍标准差处理后的数据

(4)我们发现系统的预处理方法并不是很好,所以自己在notebook写一个预处理程序进行处理 

 是不是觉得效果好多了啊,赶快行动起来吧,开始你的数据分析之旅。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/695633.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

浅析数据中台

note 很多企业更倾向于数据集中采集、存储,分层建设,集中管理运营数据资产。阿里的中台是从管理的角度出发,以中台事业部集中数据搜索,技术及产品,数据共享等多个部门的功能。 文章目录 note一、数据中台1. 传统企业的…

数字孪生百科之海康威视安防系统

智能安防是指利用先进的技术手段和系统,以提升安全防护能力和监控效果的安全领域。数字化则是指将信息以数字形式进行处理和存储的过程。智能安防与数字化密切相关,通过数字化的手段和技术,可以实现对安全领域的全面监控、数据分析和智能决策…

Xcode 15 beta 2 - Apple Vision Pro安装下载

1. 更新OS系统 已更新的忽略这步 2. 下载Xcode 15 beta 2 Xcode 15 Xcode 15 让你能够开发、测试和分发适用于所有 Apple 平台的 App。借助增强的代码补齐功能、交互式预览和实时动画,更快地推进 App 的编码和设计。利用 Git 暂存功能直接改进下次要提交的文件&…

汽车通用LCD显示驱动电路芯片DP6524替代PT6524

DP6524是一款利用CMOS技术专门设计的通用LCD驱动IC,完全替代PT6524,采用单片机控制的电子调谐器。它的最大行驶速度可以达到204段输出,可控制多达12个通用输出端口。引脚分配和应用电路都进行了优化,易于PCB布局和节省成本的优势。 主要特性…

iPhone手机如何移除桌面便签软件小组件?

对于很多iPhone手机用户来说,app小组件是非常便捷实用的一个功能,它可以让用户在不打开软件的情况下查看里面的相关内容。如果在iPhone手机上添加了多个桌面便签小组件,想要移除一个的话应该怎么操作呢?以iPhone手机端敬业签便签软…

前端excel文件处理,vue2 、file-saver、xlsx, excel文件生成与excel文件链接数据导出

1、前端excel文件生成 安装插件 npm install file-saver --save如使用TS开发,可安装file-saver的TypeScript类型定义 npm install types/file-saver --save-dev下载文件流 import { saveAs } from file-saver /**** param {*} fileStream // 文件流* param {*} …

vue+leaflet地图实现根据省份区域划分颜色渐变图

效果图 实现代码如下 let separatedColors [rgb(255, 153, 209)];// 离散颜色&#xff0c;如效果图上的粉色 let maxVal 300000;// 定义一个最大值 data.forEach((item) > {for (let i 10; i > 0; i--) {if (item.us_year < maxVal * i) {item.opacity i / 10;}…

ThinkPHP-Shop2020版本的商城CMS前端SQL注入

0x01、漏洞名描述 ThinkPHP-Shop2020版本的商城CMS前端SQL注入 0x02、fofa "ThinkPHP-Shop"0x03、POC http://x.x.x.x//mobile/index/index2/id/1* 0x04、漏洞复现

数字孪生和 GIS 结合能够为智慧社区带来怎样的改变?

数字孪生和地理信息系统&#xff08;GIS&#xff09;是当今智慧社区发展中的两个重要技术&#xff0c;它们的结合将为智慧社区带来根本性的改变和巨大的发展机遇。这种结合将深刻影响社区的规划、建设、运营和管理&#xff0c;为居民创造更智能、便利、宜居的生活环境。 首先&…

Windows 10 使用Docker记录

1. 下载Docker Desktop Installer&#xff0c;按照步骤安装。 2. 安装位置只能在系统盘&#xff0c;镜像存储位置可更改&#xff0c;如下图&#xff0c;在设置中。 3. 启动桌面后会有提示&#xff0c;打开终端(cmd)&#xff0c;输入 wsl -upgrade可解决。 4. 拉取仓库中的镜像…

【C++学习】类和对象 | 拷贝构造 | 探索拷贝构造函数为什么需要引用传参 | 深拷贝 | 初识运算符重载

写在前面&#xff1a; 上一篇文章我们开始学习类内的默认成员函数&#xff0c; 这里是传送门&#xff0c;有兴趣可以去看看&#xff1a;http://t.csdn.cn/iXdpH 这篇文章我们继续来学习类和对象的知识。 目录 写在前面&#xff1a; 1. 拷贝构造 2. 拷贝构造函数为什么需…

线性回归算法实现

回归算法是一种有监督算法。 回归算法是一种比较常用的机器学习算法&#xff0c;用来建立“解释”变量(自变量X)和观 测值(因变量Y)之间的关系&#xff1b;从机器学习的角度来讲&#xff0c;用于构建一个算法模型(函 数)来做属性(X)与标签(Y)之间的映射关系&#xff0c;在算法的…

Search space set group switching(二)

R17规定UE可以根据DCI 0_2/0_1/1_1/1_2 的PDCCH monitoring adaptation field 结合具体的配置&#xff0c;对Type3-PDCCH CSS sets 或 USS sets 的acitve DL BWP进行skipping PDCCH monitoring或search space set group switch(包括2个SSSG或3个SSSG的switching)的操作。3个SSS…

腾讯云轻量应用服务器便宜是不是性能差?

腾讯云轻量应用服务器便宜&#xff1f;大揭秘&#xff01;为什么便宜&#xff1f;因为限制月流量&#xff0c;虽然公网带宽看似很大&#xff0c;有月流量限制&#xff0c;但是也不得不说&#xff0c;轻量应用服务器性价比确实高&#xff0c;大家估算下自身应用&#xff0c;如果…

打包apk时出现Execution failed for task ‘:app:lintVitalRelease

程序可以正常运行&#xff0c;但是打包apk的时候报Execution failed for task ‘:app:lintVitalRelease导致打包失败&#xff0c;原因是执行lintVitalRelease失败了&#xff0c;存在错误。解决办法&#xff1a;在app模块的build.gradle的Android里面添加如下代码&#xff1a; l…

如何在linux上查看显卡型号

使用命令lspci | grep VGA 在我的主机上得到如下信息: 08:00.0 VGA compatible controller: NVIDIA Corporation Device 2504 (rev a1)发现我的显卡型号是2504&#xff0c;这和我们印象中的显卡型号如1080Ti之类的不一样&#xff0c;看起来不像真正的型号。我们需在pci这个网…

火爆全网,Python自动化测试-openpyxl操作测试(详细)

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 当做自动化测试时…

{“errMsg“:“setTabBarBadge:fail not TabBar page“}

问题描述&#xff1a;想要在详情页添加商品到购物车后&#xff0c;同时更新tabBar页面的购物袋徽标。于是直接在goods-detail页面使用以下代码后&#xff0c;发现报错&#xff1a; uni.setTabBarBadge({index: 3,text: this.goodsCount}) 错误信息&#xff1a;{"errMsg&q…

python爬虫-逆向实例小记-3

注意&#xff01;&#xff01;&#xff01;&#xff01;某数据网站逆向实例仅作为学习案例&#xff0c;禁止其他个人以及团体做谋利用途&#xff01;&#xff01;&#xff01;&#xff01; 案例分析 第一步&#xff1a;分析页面。查看响应内容&#xff0c;内容加密 第二步&am…

案例研究|小牛电动通过DataEase进行业务数据可视化分析

小牛电动&#xff08;Niu Technologies&#xff09;创立于2014年&#xff0c;是全球智能城市出行解决方案提供商。小牛电动的产品线包括电动自行车、电动摩托车、电动滑板车等。小牛电动在销售渠道上采用了线上线下相结合的模式&#xff0c;通过线上电商平台和线下门店销售&…