(done) 什么是 SVD 奇异值分解?什么是 TruncatedSVD 截断奇异值分解?

news2024/11/19 19:33:57

来源:https://www.bilibili.com/video/BV16A411T7zX/?spm_id_from=333.337.search-card.all.click&vd_source=7a1a0bc74158c6993c7355c5490fc600


奇异值分解其实就是如下图,把矩阵 M 分解成一个正交方阵 U,乘以一个不规则奇异值矩阵 sigma,再乘以一个正交方阵 VT
在这里插入图片描述

先复习一下线性变换,如下图,S矩阵是一个拉伸矩阵
在这里插入图片描述

如下,R矩阵是旋转矩阵,RSD 就是先拉伸再旋转
在这里插入图片描述

在 2x2 的矩阵上的 SVD 可以把 M 分解为 两个旋转矩阵和一个拉伸矩阵 (先旋转再拉伸再旋转)
在这里插入图片描述

2x2矩阵中的 SVD 可以定义成:原始域标准正交基 V 经过 M 线性变换后,得到 U sigma
在这里插入图片描述

如下,是推广到任意大小矩阵的 SVD
在这里插入图片描述

由于 sigma 矩阵的最后一行全是 0,没有意义;同时,U 矩阵的最后一列总是和 sigma 矩阵的最后一行相乘,也没有意义,所以我们可以去掉 U 矩阵的最后一列和 sigma 矩阵的最后一行,如下图
在这里插入图片描述

需要注意的是:sigma 矩阵的奇异值从上到下是从大到小排列的,每一个奇异值代表一个正交基。越是重要的正交基(轴方向)的奇异值越大,所以,sigma 矩阵从上到小的奇异值重要性是降低的。因此,我们可以去掉最下面的奇异值,来去掉没那么重要的正交基,从而降维、压缩,这也就叫做 TruncatedSVD 截断奇异值分解
在这里插入图片描述

如下图,计算 V 的方法是求 MTM 的特征向量,计算 U 的方法是求 MMT 的特征向量,求 sigma 是对它们的特征值开方
在这里插入图片描述

协方差矩阵的特征向量就是 PCA 主成分的方向,换句话说,SVD 的 V 就是 PCA 主成分的方向
在这里插入图片描述

非负矩阵分解的 S 和 B 两个矩阵都要求必须是正数,它跟 SVD 很相似。但在需要解释矩阵的物理意义时会更加容易
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1620681.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

校企联合,共谋发展 | 欢迎陕西科技大学一行来访Aigtek安泰电子交流洽谈!

为进一步深化校企合作共建,促进优秀人才引进。4月12日,陕西科技大学电智学院的院长马院长、副院长任院长、电子信息工程专业副主任张攀峰老师、郭拓老师,到访西安安泰电子科技有限公司,就开展校企合作展开了学习交流,安…

【认真白嫖】注册免费域名

一、eu.org官网 https://nic.eu.org/,始于1996年,对个人和组织是免费注册,页面还真有96年的风格,点进去注册就行。 二、注册 使用随机生成一个虚拟英国或者美国地址的网站,会提高通过的概率。 https://www.haoweic…

打造基于时间-技能-动能的人效飞轮,助推新质生产力发展

△ 章新波,盖雅工场董事长兼CEO 本文内容来自于2024年4月19日,章新波在第四届狮山人力资源论坛《以人为本,赋能发展:打造基于时间-技能-动能三要素的人效飞轮》的主题演讲。 1. 技术变革的影响:替代效应与补偿效应并存…

IPv6是什么

IPv6服务器是基于IPv6协议进行网络通信的服务器。IPv6,即“互联网协议第6版”,是互联网工程任务组(IETF)设计的用于替代IPv4的下一代IP协议,其地址数量号称可以为全世界的每一粒沙子编址。IPv6的主要功能和应用场景包括…

高效的数据采集如何促进企业发展?

大数据开启了一个大规模生产、分享和应用数据的时代,它给技术和商业带来了巨大的变化。麦肯锡研究表明,在医疗、零售和制造业领域,大数据每年可以提高劳动生产率0.5-1个百分点。大数据在核心领域的渗透速度有目共睹,然而调查显示&…

UTC和北京时间

influxdb 的时间为UTC和北京时间相差8小时,需要经常转化,所以有下面的2个常用时间 public static void main(String[] args) {//北京时间当天0点ZonedDateTime dateTime ZonedDateTime.now(ZoneId.of("Asia/Shanghai"));ZonedDateTime beijin…

【ARMv9 DSU-120 系列 4.1 -- Utility bus 详细介绍 2】

文章目录 ARM DSU-120DSU-120 Utiity BusCluster and core PPUPPU寄存器的访问性PPU寄存器的作用系统组件基地址ARM DSU-120 DSU-120 Utiity Bus 在ARMv9架构中,DSU-120(Dynamic Shared Unit 120)是一个关键组件,用于管理核心和系统组件之间的通信与协作。某些系统组件寄存…

C语言-联合体基本概念

联合体的外在形式跟结构体非常类似,但它们有一个本质的区别:结构体中的各个成员是各自独立的,而联合体中的各个成员却共用同一块内存,因此联合体也称为共用体。 联合体内部成员的这种特殊的“堆叠”效果,使得联合体有如…

说说你对归并排序的理解?如何实现?应用场景?

一、是什么 归并排序(Merge Sort)是建立归并操作上的一种有效,稳定的排序算法,该算法是采用分治法的一个非常典型的应用 将已有序的子序列合并,得到完全有序的序列,即先使每个子序列有序,再使…

C++项目在Linux下编译动态库

一、说明 最近在Windows下开发了一个C线程池项目,准备移植到Linux下,并且编译成动态库进行使用。现将具体过程在此记录。 二、准备 1、项目文件 我的项目文件如下,其中除main.cpp是测试文件之外,其他都是线程池项目相关的 将C…

为什么光电测径仪质量更稳定可靠?

光电测径仪与激光扫描式测径仪都是目前常用的外径自动化测量设备,他们能实现的功能相同,但为什么说光电测径仪更稳定可靠,下面一起来看一下。 光电测径仪测量原理 测头部件是测径仪的核心部件,它的作用是将被测物在CCD芯片上清晰…

基于SpringBoot的合家云社区物业管理平台 - 权限管理模块开发

合家云社区物业管理平台 4.权限管理模块开发 4.1 权限管理概述 4.1.1 权限管理的意义 后台管理系统中,通常需要控制不同的登录用户可以操作的内容。权限管理用于管理系统资源,分配用户菜单、资源权限,以及验证用户是否有访问资源权限。 …

【软件测试】采用等价类划分法设计测试用例

例题1 请采用等价类划分法设计测试用例。 考虑软件 app, 它有两个输入变量 , 分别是 name 和 age, 其中 ,name 是至多包含 20 个字母字符的非空字符串 ,age 是整数型变量 ,0 ≤ age ≤ 120 。当输入给 name 的字符串的长度超过 20时 ,name 取前 20 个字符作为 name 的值 ; 如果…

Hotcoin Academy 市场洞察-2024年4月15日-21日

加密货币市场表现 BTC ETF在本周出现净流出,大盘有较大跌幅,BTC一度跌破60000美金,ETH一度跌破2800美金,整体以横盘为主,行情在周末有略微回升趋势。BTC市占率创21年4月来新高,目前市值1.28万亿&#xff0c…

导出瑞芯微(Rockchip)芯片的设备树(Device Tree)

要导出瑞芯微(Rockchip)芯片的设备树(Device Tree),可以使用设备树编译器(DTC,Device Tree Compiler)。通常,会有一个设备树的源文件(.dts)&#…

网络编程-libuv介绍

官网 https://libuv.org/ 概要 libuv是一个强大的跨平台异步I/O库,主要用于构建高性能、可扩展的网络应用程序。它最初是为Node.js开发的,用于处理Node.js的异步I/O操作,但随着时间的推移,它也被广泛应用于其他系统&#xff0…

#1 Numpy Pandas

Numpy & Pandas 2.1 numpy属性2.2 numpy的创建array2.3 numpy的基础运算 调入头文件 import numpy as np2.1 numpy属性 #生成一个array数组 array np.array([[1, 2, 3],[2, 3, 4]])#也可以这样 dtype表示array的元素类型 np.array([1, 2, 3], dtype np.int64) #array维…

AQ6370C YOKOGAWA 横河 光谱分析仪 简述

YOKOGAWA AQ6370C是一款高性能的光谱分析仪,具有世界一流的光学性能。它的波长范围为600至1700nm,能够提供高波长精度0.01nm和高波长分辨率0.02nm。此外,AQ6370C具备大动态范围78dB(典型值)和宽功率量程20~-90dBm&…

安装VCenter 7 对硬件资源的需求

安装VMware vCenter Server 7.x 对硬件资源的需求主要包括以下方面: 服务器硬件: 处理器:64位 x86架构,推荐采用多核CPU以支持高并发管理和运行多个虚拟机。具体数量取决于vCenter Server将管理的虚拟机规模及复杂度。内存&#x…

excel 按照姓名日期年月分组求和

excel 需要按照 姓名 日期的年份进行金额求和统计,采用sumifs 进行统计 注意:sumifs 不支持 合并列拆分计算,合并列只会计算一个值 表格数据大概如下:(sheet) ABC姓名日期金额A2023/01/01500A2023/01/151500B2023/01/01200B202…