白话机器3:PCA与SVM详细数学原理

news2025/1/2 4:10:20

一、PCA数学原理

1.数据标准化

        首先,需要对原始数据进行标准化处理,使得每个特征的均值为0,方差为1。假设有一个的数据矩阵X,其中每一列是一个样本,每一行是一个特征。

标准化公式如下:

x_{ij}^{'} = \frac{x_{ij} - \mu_j}{\sigma_j}

其中,x_{ij}是原始数据矩阵X中的元素,\mu_j是第j个特征的均值,\sigma_j 是第j个特征的标准差,x_{ij}^{'}是标准化后的数据。

2.计算协方差矩阵

        接下来,我们需要计算标准化后数据矩阵的协方差矩阵。协方差矩阵是一个对称矩阵,它描述了数据中不同特征之间的线性关系。

协方差矩阵的计算公式如下:

复制

C = \frac{1}{n-1} X^{'} X^{'T}

        其中,n 是样本数量,X^{'} 是标准化后的数据矩阵,X^{'T}X^{'}的转置。

3.计算特征值和特征向量

        协方差矩阵的特征值和特征向量可以通过求解特征方程得到:

|C - \lambda I| = 0

其中,\lambda 是特征值,I是单位矩阵。

对于每个特征值\lambda_i,我们可以找到对应的特征向量v_i,满足:

(C - \lambda_i I) v_i = 0

4.选择主成分

特征值的大小代表了对应特征向量方向上的方差大小。我们通常选择最大的几个特征值对应的特征向量作为主成分,因为它们包含了数据中的大部分信息。

在这个例子中,我们想要将数据降维到3x1,所以我们只需要选择一个主成分,即选择最大的特征值对应的特征向量。

5.数据投影

最后,我们将原始数据矩阵X投影到选定的主成分上,得到降维后的数据矩阵。

投影公式如下:

Y = X^{'} v_1

其中,Y 是降维后的数据矩阵,v_1 是最大的特征值对应的特征向量。

二、SVM数学原理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1653262.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

加速数据要素流通,“隐语杯”全国高校隐私计算大赛正式启动报名!

当前,我国数字经济正处在一个快速增长的阶段,数据要素逐渐成为促进社会经济繁荣的关键驱动力。随着国家对数据治理及隐私保护政策的不断完善,隐私计算技术的创新和实践应用变得愈发重要。面对数据安全与隐私保护的双重挑战,如何实…

系统稳定性判定分析(二)----频域分析法相关辐角原理

文章目录 辐角原理(即Cauchy原理)引理分析辐角原理定义与证明 参考文献 为后续更好从频域层面分析控制系统的稳定性,本节首先介绍在后续分析中用到的辐角原理。 根据复变函数对数的定义,有 l n f ( s ) l n ∣ f ( z ) ∣ i ( a…

libcity笔记:libcity/evaluator/traj_loc_pred_evaluator.py

1 构造函数 2 _check_config 检查配置是否符合评估器的要求,确保评估过程能够顺利执行 3 collect 4 evaluate 5 save_result & clear

如何使用多协议视频汇聚/视频安防系统EasyCVR搭建智慧园区视频管理平台?

智慧园区作为现代化城市发展的重要组成部分,不仅承载着产业升级的使命,更是智慧城市建设的重要体现。随着产业园区竞争的逐渐白热化,将项目打造成完善的智慧园区是越来越多用户关注的内容。 然而我们往往在规划前期就开始面临众多难题&#…

三、Redis五种常用数据结构-Hash

Hash是redis中常用的一种无序数据结构。结构类似HashMap。 具体结构如下:key field value 1、优缺点 1.1、优点 同类数据归类整合储存,方便数据管理。相比于string操作消耗内存和CPU更小。分字段存储,节省网络流量。 1.2、缺点 过期时间…

基于边缘智能网关的工业燃气管网监测应用

随着城市化和工业化的飞速发展,燃气的使用量和应用范围持续增加,燃气管网作为承载燃气输送的设施,安全问题至关重要。一旦燃气管网发生泄漏事故,极易引发起火、爆炸等,从而酿成人员伤亡及财产损失的恶性事故。 得益于物…

VMware 虚拟机自定义规范 - 更优雅的虚拟机开局

介绍 虚拟机自定义规范可以在你克隆虚拟机的时候在vCenter 的Web界面设定虚拟机的主机名、单/多网卡IP的IP和网关、DNS服务器、唯一标识符重置(SID等)、硬盘分区自动扩容、设定密码、密钥、时区等信息。 让管理员不需要进入虚拟机系统内部进行配置&…

运用远期交易防范外汇风险

随着全球化的深入,跨境贸易和投资愈加频繁,外汇风险成为各类企业和投资者必须面对的现实问题。汇率的波动可能导致交易和投资的成本大幅增加,甚至引发利润损失。在这种情况下,远期交易作为一种有效的外汇风险对冲工具,…

Springboot整合飞书向群组/指定个人发送消息/飞书登录

Springboot整合飞书向群组发送消息 飞书开放平台创建企业自建应用 添加应用能力-机器人 创建完成后,进入应用详情页,可以在首页看到 App Id 和 App Secret 在飞书pc端创建一群机器人 此处可以拿到该机器人的webhook地址,通过https的方式,也可以调用发送…

人大金仓报The connection attempt failed.Reason:Connection reset解决办法

在连接人大京仓数据库 的时候报下面的错误 解决办法: 更换这里的IP地址就行,不要用127.0.0.1,然后就可以了

Android单行字符串末尾省略号加icon,图标可点击

如图 设置仅显示单行字符串,末尾用省略号,加跟一个icon,icon可点击 tvName.text "test"val drawable ResourcesCompat.getDrawable(resources, R.mipmap.icon_edit, null)tvName.setCompoundDrawablesWithIntrinsicBounds(null,…

华为认证HCIE考试过程的小细节|备考注意事项

大家好,我是来自武汉软件工程职业学院计算机网络专业的李同学,我在2024年1月3日通过了华为Datacom-HCIE认证,在此把我的一些考证心得分享给正在备考的同学们。 感谢讯方的老师们 我能通过HCIE考试,离不开各位讯方老师的教导。感…

碳课堂|如何开展碳排放核算? ISO 14064-2 项目层次要点解读

为提高企业组织碳排放报告信誉度,国际标准化组织(ISO)发布了ISO14064标准,其中《ISO 14064-2 项目层次上对温室气体减排和清除增加的量化、监测和报告的规范及指南》提供了项目策划阶段的原则要求,以及项目实施阶段的量…

Jmeter性能测试(五)

一、Jmeter参数化常用方式 1、CSV 数据文件设置 2、查询数据库(JDBC Connection Configuration) 二、CSV 数据文件设置 1、准备一个txt文件(不需要写表头,直接写你要用的数据就行了,多个字段用英文逗号隔开) 2、添加一个CSV 数据文件设置(放全局最上…

PyQt5批量生成Checkbox及批量检查Checkbox的勾选状态

批量生成Checkbox并添加到TableWidget中 for i in range(10):checkbox_i QCheckBox(fCheckbox_{i}) # 生成Checkbox并命名为Checkbox_iself.ui_1.tableWidget_1.setCellWidget(i,1,checkbox_i) 批量检查勾选状态 # 批量生成Checkbox并存入列表 list_Checkbox_1 [] for …

工程伦理课堂记录

文章目录 0. 导论0.1 工程伦理教育的意义0.2 工程伦理教育要实现的目标 1. 工程与伦理1.1 工程伦理学科的产生1.2 工程和技术1.3 工程概念的理解演进1.4 工程的过程1.5 工程的特点1.6 工程活动的七个维度总结 2. 伦理2.1 道德伦理的概念2.2 道德伦理的关系2.3 伦理规范2.4 伦理…

Vue3---router(安装、路由跳转、路由守卫、本地存储)

Vue3—router(安装、路由跳转、路由守卫、本地存储) 目录 Vue3---router(安装、路由跳转、路由守卫、本地存储)基础使用安装创建路由 路由跳转无参跳转js写法html写法 有参跳转queryparams 路由守卫额外:本地存储sessi…

旧衣回收小程序开发:线上回收模式成为行业发展趋势

当下人们生活水平在不断提高,对衣服的要求也在增加,更新速度越来越快,闲置下来的旧衣服也在增加,为了减少浪费,旧衣回收行业受到了大众的关注。旧衣回收对我国资源回收、环境保护具有非常大的意义。 在互联网时代下&a…

练英语口语的app哪个好?6个软件教你快速练习英语口语

练英语口语的app哪个好?6个软件教你快速练习英语口语 练习英语口语对于提高语言能力非常重要,而现代科技为我们提供了许多方便实用的应用来帮助我们快速有效地进行口语练习。以下是六款优质的英语口语练习应用,它们结合了各种学习方式和技术…

数据库系统理论——关系数据库

文章目录 一、关系(数据结构)1、概述2、名词解释3、关系模式、关系数据库、关系数据库模式4、基本关系的性质 二、关系操作(数据操作)三、关系的完整性1、实体完整性2 、参照完整性3、用户自定义的完整性 四、关系代数五、习题 前…