每天五分钟机器学习：PCA算法如何确定数据压缩降维的最佳维度？

news2025/4/27 19:29:02

本文重点

上节课程中我们已经学习了pca算法，已经知道了如何将n维特征变量降到k维，k是PCA算法的一个参数，也被称为主成分的数量。那么现在就产生了一个问题，这个问题就是如何选择K，因为PCA要做的就是要尽量减少投射的平均均方误差，所以K的选择很关键。

平均均方误差

其中x(i)表示原始样本的特征向量，Xapprox(i)表示映射的样本

数据的总变差

数据的总变差就是数据集中每个训练样本长度的平均值，它表示平均来看我们训练集样本距离0向量有多远。

k值的经验得法则

k值的经验得法则就是，选择能够使得它们之间得比例小于0.01的最小的K值。

这个0.01用PCA语言就是说我们选择的参数K，原本数据的偏差有 99%都保留下来了，也就是说使得99%的差异性得以保留。大部分人选择k的时候，并不是直接的选择k值是多少，而是≤0.01还是0.05（95%的差异性被保留），0.10，0.15。然后选择符合这些要求的最小的k值。

<

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/97121.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

22.MongoDB删除操作效率及相关问题验证

22.MongoDB删除操作效率及相关问题验证

最近遇到一个了一个MongoDB数据删除的问题，需要一次性删除上线即1.5年前~1年前的数据且之后每天清空一年过期的数据。在数据量比较大的情况下何种方式的删除效率最高是一个值得研究的问题，本文通过实际测试找出其中规律。本文采用腾讯云mongodb集群进行…

阅读更多...

基于java的连连看游戏设计-计算机毕业设计

基于java的连连看游戏设计-计算机毕业设计

项目介绍基于java设计的连连看游戏规则是模仿网络上的最普通的连连看游戏，主要是鼠标点击两次的图片能否消去的问题。当前，前提是点击两张相同的图片，若是点击的是同一张图片或者两张不同的图片，则不予处理。在两张相同的图片所…

阅读更多...

这份pdf成功让我拿下了蚂蚁金服、字节跳动、小米等大厂的offer

这份pdf成功让我拿下了蚂蚁金服、字节跳动、小米等大厂的offer

关于程序员，除了做项目来提高自身的技术之外，还有一种提升自己的专业技能就是：多！看！书！ 小编整理出一篇Java进阶架构师之路的核心知识，同时也是面试时面试官必问的知识点，篇章也是…

阅读更多...

点云可视化工具

点云可视化工具

点云可视化工具平时查看点云文件主要是用CloudCompare，基本上也就是打开看看这个点云大概是个什么样子，很少会在CloudCompare对点云进行处理，它可以直接将点云拖进软件进行显示也还是挺方便的。但是还是有点点不是很方便的地方，…

阅读更多...

Linux从入门到进阶学习（Ⅲ）：Linux权限管控

Linux从入门到进阶学习（Ⅲ）：Linux权限管控

目录 1 root用户 1.1 su 1.2 sudo 2 用户和用户组 3 查看权限控制信息 4 修改权限控制 4.1 chmod命令 4.2 chown命令 1 root用户 1.1 su root用户即超级管理员 su [-] [用户名] 切换到root用户，exit退回普通用户从 -：可选&#xff0…

阅读更多...

社会网络分析工具—— Gephi 或 NetworkX的简单介绍和比较（源自GPTchat）

社会网络分析工具—— Gephi 或 NetworkX的简单介绍和比较（源自GPTchat）

文章目录我的原始需求两个工具介绍二者比较下载和使用后续使用教程我的原始需求如何对不同认知课堂的教师提问行为序列进行社会网络分析，计算不同认知层级提问行为的中间中心度和接近中心度， 在进行社会网络分析时，您首先需要收集数据并…

阅读更多...

ArcGIS基础：栅格转ASCII校正简单栅格坐标

ArcGIS基础：栅格转ASCII校正简单栅格坐标

【校正栅格坐标】有一些数据量比较小的栅格数据，位置发生了偏移，可以使用【转换工具】对其位置进行校正。先看一下原始数据： 有2个栅格数据，如下所示，两个数据本身是一个数据，只不过发生了偏移&#x…

阅读更多...

java+ssh+mysql银行收银管理系统

java+ssh+mysql银行收银管理系统

项目介绍： 本系统为基于jspmysql的银行管理系统，包含业务员、管理员登录权限，功能如下： 业务员：可以银行系统，可以查看所有客户账户信息、可以新开账户、销户、修改账户信息、存款、取款、转账等功能。 …

阅读更多...

C51——通过震动传感器模块让继电器的灯亮起来

C51——通过震动传感器模块让继电器的灯亮起来

继电器触发模块可以通过跳线设置高电平触发或者低电平触发（默认） 首先明确继电器的工作逻辑怎么控制“闭合”开关呢怎么控制“断开”开关呢 NO口是常开端 NC 常闭端 COM 公共端通过IO口向继电器发出低电平 ，使得COM口和NO口连接&…

阅读更多...

05. XSS漏洞利用

05. XSS漏洞利用

05. XSS漏洞利用 XSS漏洞利用（上） 获取cookie 什么是cookie？ **定义：**cookie是指某些网站为了辨别用户身份而储存在用户本地终端（Client Side）上的数据（通常经过加密） **作用&…

阅读更多...

jsp+ssm计算机毕业设计宠物医院信息管理系统【附源码】

jsp+ssm计算机毕业设计宠物医院信息管理系统【附源码】

项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： JSPSSM mybatis Maven等等组成，B/S模式 Mave…

阅读更多...

垃圾回收相关概念

垃圾回收相关概念

文章目录1. System.gc()的理解2.内存溢出与内存泄漏3. Stop The World4. 并发与并行5. 安全点与安全区域的说明6. 强引用、软引用、弱引用、虚引用1. System.gc()的理解 2.内存溢出与内存泄漏 3. Stop The World 4. 并发与并行 5. 安全点与安全区域的说明 6. 强引用、软引用、弱…

阅读更多...

jsp+ssm计算机毕业设计大学生家教服务推荐系统【附源码】

jsp+ssm计算机毕业设计大学生家教服务推荐系统【附源码】

项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： JSPSSM mybatis Maven等等组成，B/S模式 Mave…

阅读更多...

nuxt.js如何将访问的外部ip修改为本地ip? Do you want Code to open the external website?

nuxt.js如何将访问的外部ip修改为本地ip? Do you want Code to open the external website?

问题描述： 提示：Do you want Code to open the external website? 译文：是否希望代码打开外部网站？ 说明我们nuxt.js访问的是别人的ip地址，而并不是自己的ip 问题解决： 方法一： 查看packa…

阅读更多...

Python中GDAL批量绘制多时相栅格遥感影像的像元时间序列曲线图

Python中GDAL批量绘制多时相栅格遥感影像的像元时间序列曲线图

本文介绍基于Python中gdal模块，对大量多时相栅格图像，批量绘制像元时间序列折线图的方法。首先，明确一下本文需要实现的需求：现有三个文件夹，其中第一个文件夹存放了某一研究区域原始的多时相栅格遥感影像数据&#x…

阅读更多...

C/C++socket网络编程

C/C++socket网络编程

目录tcp和udp通信流程图socket函数bind函数listen函数accept函数connect函数recv、recvfrom、read函数send、write、sendto、sendmsg函数close、shutdown函数htonl、ntohl、htons、ntohs本地主机和网络字节序转换inet_addr、inet_aton、inet_ntop，IP地址转换函数set…

阅读更多...

Spark-概述+快速上手+运行环境

Spark-概述+快速上手+运行环境

文章目录概述Spark and HadoopSpark or Hadoop核心模块快速上手Spark运行环境Local(本地)Standalone模式搭建和使用提交参数说明配置历史服务配置高可用（HA）Yarn模式K8S & Mesos 模式部署模式对比端口号概述 Spark 是一种基于内存的快速、通用、可扩…

阅读更多...

红米Note7pro安装TWRP及安装PixelExperience系统

红米Note7pro安装TWRP及安装PixelExperience系统

参考：https://www.youtube.com/watch?vjB9ksQrxr20&ab_channelTechnologyVikram 所需文件： 一. youtube:Vikram--OTG优盘 (https://www.youtube.com/watch?vjB9ksQrxr20&ab_channelTechnologyVikram) 1.刷入TWRP a. 准备工作：打开…

阅读更多...

MR案例：学生排序

MR案例：学生排序

排序一、提出任务二、完成任务（一）准备数据1、在虚拟机上创建文本文件2、上传文件到HDFS指定目录（二）实现步骤1、创建学生实体类2、创建学生映射器类3、创建学生归并器类4、创建学生驱动器类5、启动学生驱动器类，查看结…

阅读更多...

JVM虚拟机简介

JVM虚拟机简介

、什么是JVM？ JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指…

阅读更多...

推荐文章

最新文章