数学建模学习（115）：主成分分析（PCA）与Python实践

数学建模学习（115）：主成分分析（PCA）与Python实践

news2026/2/13 16:28:48

文章目录

- 一.主成分分析简介
- - 1.1 数学背景与维度诅咒
  - 1.2 PCA的定义与应用
- 二.协方差矩阵——特征值和特征向量
- 三.如何为数据集选择主成分数量
- 四.特征提取方法
- 五.LDA——与PCA的区别
- 六.PCA的应用
- 七.PCA在异常检测中的应用
- 八.总结

一.主成分分析简介

1.1 数学背景与维度诅咒

主成成分分析（PCA）是一种广泛使用的算法，用于从高维数据中提取主要特征，以便更有效地用于机器学习（ML）模型。从数学上讲，维度是指在空间中指定一个向量所需的最少坐标数。在高维空间中计算两个向量之间的距离需要大量的计算资源，因此随着维度的增加，计算复杂性迅速提升，这就是所谓的“维度诅咒”（见图1.1）。这种现象使得许多机器学习算法的效率难以提高。随着数据维度的增加，数据的稀疏性增加，计算距离和密度的努力呈指数级增长。从理论上讲，维度的增加通常会增加大数据集中的噪声和冗余。因此，PCA被广泛应用于应对高维问题中的复杂性。

在这里插入图片描述

PCA起源于线性代数，基本上是一种数据预处理方法，通过将数据投影到较低维度的子空间中，保留数据的主要信息，同时减少数据集中的冗余特征。这种技术广泛应用于高维数据的可视化、降维和分类任务中。PCA遵循主轴定理，其主要目标是通过寻找正交基来优化数据表示，按重要性或方差对维度进行排序，丢弃次要的维度，并集中关注主要的无关成分。

1.2 PCA的定义与应用

PCA是一种无监督方法，用于减少高维数据集的特征数量。通过矩阵分解（或分解）来将未标记的数据集减少为其组成部分，然后根据方差对这些部分进行排序。代表原始数据的投影数据成为训练ML模型的输入。

PCA定义

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2063409.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【Python爬虫】教你追剧看电影不求人！python爬虫代码教你爬取各平台视频，小白也能学会！附源码

【Python爬虫】教你追剧看电影不求人！python爬虫代码教你爬取各平台视频，小白也能学会！附源码

看剧看一半不是VIP就是svip，正当我们看的津津有味的时候，让你冲米弹窗出来了！！！ 对于大家来说，想看续集，都是全凭实力刷续集。如果这时候你会Python的话，那就不会有这些烦恼了&…

阅读更多...

安卓开发中的Jetpack Compose

安卓开发中的Jetpack Compose

本文内容总结自郭神的jetpack compose专栏 ，整理自学，未完持续... 一、了解Jetpack Compose Compose是一个由Google Android团队官方推出的声明式UI框架，Compose也是属于AndroidX的一部分，它的本质就是用来编写界面以及处理与用户…

阅读更多...

【数据结构】二叉树的深度理解

【数据结构】二叉树的深度理解

🍬个人主页：Yanni.— 🌈数据结构：Data Structure. 🎂C语言笔记：C Language Notes 前言在之前学习了二叉树的基本概念，但二叉树有着更深入知识理解，这篇文章可以帮助大…

阅读更多...

Java语言程序设计——篇十六

Java语言程序设计——篇十六

🌿🌿🌿跟随博主脚步，从这里开始→博主主页🌿🌿🌿 欢迎大家：这里是我的学习笔记、总结知识的地方，喜欢的话请三连，有问题可以私信🌳🌳&…

阅读更多...

ROBOT--空心杯电机是什么

ROBOT--空心杯电机是什么

空心杯电机是什么 1. 简介2. 结构3. 主要特点4. 应用场合5. 优点6. 缺点 1. 简介空心杯电机是一种微型伺服直流电机，由定子和转子两大核心部分组成，通常来讲尺寸一般较小通常不超过40mm。在结构上突破了传统直流电机的结构形式，采用的是无铁…

阅读更多...

如何理解递归

如何理解递归

在二叉树的题目中，我们难免会用到递归方法，递归思想很简单，但运用起来却因为抽象而难以理解。理解递归的关键在于认识到它是一种解决问题的方法，允许函数直接或间接地调用自身。以下是对递归的概述以及如何理解它的几个要点&…

阅读更多...

【算法】一文带你搞懂完全背包！（附背包问题总结）

【算法】一文带你搞懂完全背包！（附背包问题总结）

理论基础有N件物品和一个最多能背重量为W的背包。第i件物品的重量是weight[i]，得到的价值是value[i] 。每件物品都有无限个（也就是可以放入背包多次），求解将哪些物品装入背包里物品价值总和最大。这就是完全背包问题。完全背包…

阅读更多...

【计算机组成原理】三、存储系统：1.存储器的分类、层次化结构、性能指标、基本组成（半导体、存储芯片基本原理）

【计算机组成原理】三、存储系统：1.存储器的分类、层次化结构、性能指标、基本组成（半导体、存储芯片基本原理）

三、存储系统（存储器层次结构） 文章目录三、存储系统（存储器层次结构）1.存储器的分类1.1按在计算机中的作用（层次）❗多级存储结构（层次化结构）1.2按存储介质1.3按存取方式1.4按信息…

阅读更多...

uniapp 小程序设置按钮固定到页面的最下方

uniapp 小程序设置按钮固定到页面的最下方

解决方案我们在做小程序的时候，特别是页面是以列表的形式进行展示，并且页面必须还要新增数据时，这是就会在页面的底部加一个固定的新增按钮，点击新增按钮，弹出一个弹窗…然后进行下一步的业务逻辑操作，那…

阅读更多...

Answer use of function tool by OpenAI assistant in Python

Answer use of function tool by OpenAI assistant in Python

题意：“在 Python 中使用 OpenAI 助手的函数工具的用途” 问题背景： I am trying to answer to OpenAI assistants function tool. “我正在尝试回答 OpenAI 助手的函数工具。” See my code below. The custom function is called "funnyfunc&qu…

阅读更多...

系统编程网络基于tcp协议

系统编程网络基于tcp协议

tcp的客户端： socket（）；用来开链接的端口 bind（）；绑定作用（在客户端可选可不选） connect（）；链接作用 tcp的服务端： s…

阅读更多...

性能测试全解

性能测试全解

世界上没有陌生人，只有还没认识的朋友一．性能测试的意义由于软件系统的性能问题而引起严重后果的事件比比皆是，下面列举几个案例 (1)2007年10月，北京奥组委实行2008年奥运会门票预售，一时间订票官网访问量激致系统…

阅读更多...

「知识篇」UWB精确测距与定位技术优势的详细探讨

「知识篇」UWB精确测距与定位技术优势的详细探讨

UWB650模块是思为无线新发布的一款双边双向测距，三点平面定位模块，WB650模块是在UWB3000F27基础上研发，并搭载单片机，用户无需配置可直接使用。遵循IEEE 802.15.4-2020标准的UWB技术及其通信协议，提供高精度、低功耗…

阅读更多...

第12章网络（1）

第12章网络（1）

目录 12.1 互联的计算机 12.2 ISO/OSI 和TCP/IP 参考模型 12.3 通过套接字通信 12.3.1 创建套接字 12.3.2 使用套接字 12.3.3 UDP套接字 12.4 网络实现的分层模型本专栏文章将有70篇左右，欢迎关注，查看后续文章。网络相关的头文件数目巨大&…

阅读更多...

两台电脑之间记事本内容如何转移？

两台电脑之间记事本内容如何转移？

记事本是我们日常生活中不可或缺的工具，它轻便、简单，方便我们随时记录生活中的点滴、工作中的灵感或重要的事务。比如，在会议中快速记下关键点，或者在阅读时捕捉一闪而过的想法。然而，随着数字化生活的推进&#xff0…

阅读更多...

重塑“我店”平台：绿色积分引领的数字消费新纪元

重塑“我店”平台：绿色积分引领的数字消费新纪元

在数字化转型的洪流中，“我店”平台凭借其创新的绿色积分体系异军突起，成为市场中的璀璨新星。本文将深度剖析“我店”的运营模式、市场效应及其如何通过绿色积分机制开创消费新潮流。一、崛起之路与市场震撼力自2021年盛夏在上海启航以来&#xff0c…

阅读更多...

研讨会邀请函-Parasoft TÜV Rheinland｜SOA架构下符合功能安全要求的软件自动化测试解决方案

研讨会邀请函-Parasoft TÜV Rheinland｜SOA架构下符合功能安全要求的软件自动化测试解决方案

尊敬的技术先锋， 在汽车行业的数字化转型浪潮中，软件安全已成为我们共同关注的焦点。Parasoft 联合 TV Rheinland，荣幸地邀请您参与我们即将举办的专业研讨会，与行业领袖一同探索SOA架构下的功能安全软件开发测试方案。会议议程…

阅读更多...

支付宝小程序websocket长连接(心跳版本)

支付宝小程序websocket长连接(心跳版本)

注意点： 关闭连接一定要把那些开下来的监听全部关闭掉 1.开启连接 /*长连接*/ connectWebSocket() {let that this;my.connectSocket({url: ws://192.xx.8.xx:7780/charger-service-netty/websocket/${uni.getStorageSync(chargePointId)},header: {AccessType: a…

阅读更多...

三种相机模型总结（针孔、鱼眼、全景）

三种相机模型总结（针孔、鱼眼、全景）

相机标定文章目录相机标定前言前言我们最常见的投影模型Perspective Projection Model描述的就是针孔相机的成像原理。从上面的图根据相似三角形可以得出参考链接 https://zhuanlan.zhihu.com/p/540969207 相机标定之张正友标定法数学原理详解（含python源码&a…

阅读更多...

楼宇智慧公厕系统实时卫生状况一目了然

楼宇智慧公厕系统实时卫生状况一目了然

在科技飞速发展的今日，楼宇智慧公厕系统如一颗璀璨的新星，悄然改变着我们的生活。它以先进的技术手段，让公厕的实时卫生状况一目了然，为人们带来了全新的如厕体验。当我们步入一栋现代化的楼宇，对公厕的期待不再仅仅是…

阅读更多...

推荐文章

最新文章