《机器学习》基于SVD的矩阵分解推导、案例实现

《机器学习》基于SVD的矩阵分解推导、案例实现

news2026/2/13 10:06:17

目录

一、SVD奇异值分解

1、什么是SVD

2、SVD的应用

1）数据降维

2）推荐算法

3）自然语言处理

3、核心

1）什么是酉矩阵

2）什么是对角矩阵

4、分解过程

二、推导

1、如何求解这三个矩阵

1）已知：

2）根据酉矩阵的特点即可得出：

3）隐含条件：

4）计算：

5）结论

2、实例

1）求U与V对应的协方差矩阵

2）求各自协方差矩阵对应的特征值和特征向量

• 求A^T A对应的特征值和特征向量

• 求 A A^T 对应的特征值和特征向量

三、代码实现

1、导包

2、代码演示

运行结果为：

代码调试状态：

一、SVD奇异值分解

1、什么是SVD

SVD就是奇异值分解。在机器学习中，SVD是一种常用的矩阵分解方法，用于将一个矩阵分解为三个矩阵的乘积。具体来说，对于一个m×n的实数矩阵A，SVD将其分解为以下形式：

A = UΣV^T

其中，U是一个m×m的正交矩阵，Σ是一个m×n的对角矩阵，V^T是一个n×n的正交矩阵。Σ的对角线上的元素称为奇异值，表示原始矩阵A在对应的奇异向量方向上的重要程度。

2、SVD的应用

1）数据降维

可以通过保留最重要的奇异值和对应的奇异向量，将原始数据降维到一个较低维度的表示，以减少数据的冗余和计算复杂度。

2）推荐算法

SVD可以分解用户-项目评分矩阵，从而得到用户和项目在一个低维的潜在空间中的表示，进而进行推荐。

3）自然语言处理

SVD可以用于词向量的降维和表示，从而实现语义分析任务，如文本分类、情感分析、语义相似度计算，也可以用于对大规模文本数据进行降维和压缩，从而提高文本处理和存储的效率。

3、核心

对于任意矩阵A，我们总能够将其分解位三个矩阵𝑈 、 𝛴 、 𝑉 𝑇 。

其中： $\bigcup$ 为酉矩阵， $\sum$ 为对角阵， $V^{T}$ 为酉矩阵

1）什么是酉矩阵

酉矩阵是线性代数中的一种特殊类型的矩阵。一个n×n的复矩阵U被称为酉矩阵，如果它满足以下条件：

1、U的共轭转置乘以U的结果等于单位矩阵I：U^H × U = I，其中U^H表示U的共轭转置。

2、U的逆矩阵等于它的共轭转置：U^(-1) = U^H。

2）什么是对角矩阵

对角矩阵(diagonal matrix)是一个主对角线之外的元素皆为0的矩阵

4、分解过程

二、推导

1、如何求解这三个矩阵

1）已知：

2）根据酉矩阵的特点即可得出：

3）隐含条件：

4）计算：

5）结论

𝑈：𝐴𝐴^𝑇 的特征向量.

𝛴^2：𝐴𝐴^ 𝑇 的特征值.

𝑉：𝐴^𝑇 𝐴 的特征向量

2、实例

1）求U与V对应的协方差矩阵

2）求各自协方差矩阵对应的特征值和特征向量

• 求A^T A对应的特征值和特征向量

• 求 A A^T 对应的特征值和特征向量

三、代码实现

1、导包

pip install pillow

2、代码演示

import numpy as np
from PIL import Image   # 导入PIL库中的Image模块，用于处理图像文件
import matplotlib.pyplot as plt  # 导入绘图库

def pic_compress(k,pic_array):   # k表示保留的奇异值数量，pic_array表示输入的图像数组
    global u,sigma,vt,sig,new_pic  # 定义全局变量

    u,sigma,vt = np.linalg.svd(pic_array)   # 使用np库中的linalg模块的svd方法，对图像的数值进行奇异值分解，得到三个矩阵U、Σ和V^T，其中U和V是正交矩阵，Σ是一个对角矩阵,对角线上的元素称为奇异值
    sig = np.eye(k) * sigma[:k]   # 使用np中的函数eye生成一个kxk的单位矩阵，上述生成的sigma为奇异值，现在取前k个值，将其转换成对角矩阵，即对角线上的值为奇异值，其余值为0
    new_pic = np.dot(np.dot(u[:,:k],sig),vt[:k,:]) # dot用于执行数组乘法
    size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1]  # 变换后的图像为u矩阵、sigma矩阵和vt矩阵，这里计算图像的大小
    return new_pic,size  # 返回压缩后的图像数值和尺寸大小

img = Image.open('timg.jpg')  # 打开图像
ori_img = np.array(img)   # 将图像转换成numpy数组
new_img ,size = pic_compress(100,ori_img)  # 调用pic_compress函数对图像进行压缩，导入图片数组，100表示保留的前100个奇异值
print('original size:'+ str(ori_img.shape[0]*ori_img.shape[1]))  # 原始图片的大小，shape[0]和[1]分别表示行数和列数
print('compress size:' + str(size))  # 打印压缩后的像素大小

fig,ax = plt.subplots(1,2)  # 设置画布有两张图，fig是整个图像的窗口对象，ax是两个图像的数组
ax[0].imshow(ori_img,cmap='gray')  # 展示第一个图形，为原始图像，cmp='gray'表示图像以灰度图展示
ax[0].set_title('before compress')   # 设置第一个图像的标题
ax[1].imshow(new_img,cmap='gray')   # 展示第二个图像，为压缩后的图像
ax[1].set_title("after compress")
plt.show()

运行结果为：

左侧为原始图像，右侧为压缩后图像，他们的大小为：

代码调试状态：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2111522.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

10款好用的电脑监控软件推荐丨2024年干货整理，赶紧码住!

10款好用的电脑监控软件推荐丨2024年干货整理，赶紧码住!

选择合适的电脑监控软件可以帮助企业和个人更好地管理和保护其计算机资源。以下是10款较为好用的电脑监控软件推荐。 1. 安企神 7天试用体验https://work.weixin.qq.com/ca/cawcde06a33907e60a 简介：安企神是一款专为企业设计的信息安全管理软件，提供…

阅读更多...

算法_队列+宽度优先搜索

算法_队列+宽度优先搜索

文章目录前言N叉树的层序遍历题目要求题目解析代码如下二叉树最大宽度题目要求题目解析代码如下在每个树中找最大值题目要求题目解析代码如下二叉树的锯齿形层序遍历题目要求题目解析代码如下前言本文将会向你介绍有关队列宽度优先搜索的题目：N叉树的层序遍历…

阅读更多...

目标检测-RT-DETR

目标检测-RT-DETR

RT-DETR (Real-Time Detection Transformer) 是一种结合了 Transformer 和实时目标检测的创新模型架构。它旨在解决现有目标检测模型在速度和精度之间的权衡问题，通过引入高效的 Transformer 模块和优化的检测头，提升了模型的实时性和准确性。RT-DETR 可…

阅读更多...

Linux-实用指令

Linux-实用指令

目录前言指定运行级别基本介绍切换运行级别指令类帮助指令 man 获得帮助信息 help指令文件目录类 pwd指令 ls指令 cd指令 mkdir命令 rmdir指令删除空目录 touch指令 cp指令 rm指令 mv指令 cat指令 more指令 less指令 echo指令 head指令 tail指令…

阅读更多...

2024.9.6 作业

2024.9.6 作业

手写unique_ptr指针指针代码： #include <iostream> #include <stdexcept>template <typename T> class unique_ptr { public:// 构造函数explicit unique_ptr(T* ptr nullptr) : m_ptr(ptr) {}// 析构函数~unique_ptr() {delete m_ptr;}// 禁…

阅读更多...

设置GB/T35114服务

设置GB/T35114服务

GB/T35114服务是下联模式，支持GB/T35114标准A级双向认证，支持国密系列硬件设备。操作步骤在配置-》设备-》级联配置-》GB服务配置进行编辑。 1、点击编辑 2、修改国标服务器地址 3、如果其他参数也需要修改，都可自定义，除了国…

阅读更多...

FME教程：通过更新读模块，解决FME读取shapefile数据，提示意外输入，“在转换中，某些读取的要素与工作空间的要素类不匹配……”的问题

FME教程：通过更新读模块，解决FME读取shapefile数据，提示意外输入，“在转换中，某些读取的要素与工作空间的要素类不匹配……”的问题

目录一、问题情况二、解决方法一、问题情况在使用制作好的FME模板读取shapefile数据时，有时候会遇到弹窗提示意外输入，模板无法运行，在日志信息中警示“在转换中，某些读取的要素与工作空间的要素类不匹配。可能由于读模块的…

阅读更多...

2024年全国大学生数学建模竞赛（E题）建模解析|交通流量管控|小鹿学长带队指引全代码文章与思路

2024年全国大学生数学建模竞赛（E题）建模解析|交通流量管控|小鹿学长带队指引全代码文章与思路

我是鹿鹿学长，就读于上海交通大学，截至目前已经帮200人完成了建模与思路的构建的处理了～ 本篇文章是鹿鹿学长经过深度思考，独辟蹊径，实现综合建模。独创复杂系统视角，帮助你解决国赛的难关呀。完整内容可以…

阅读更多...

【前端学习】AntV G6-06 使用图算法

【前端学习】AntV G6-06 使用图算法

课程链接图算法 Algorithm | G6 (antgroup.com) 【例子 pageRank】力导向图布局 | G6 (antgroup.com) 重点部分添加注释 import G6 from antv/g6;const { pageRank } G6.Algorithm; // 在此引入 pageRankconst container document.getElementById(containe…

阅读更多...

无人机之报警器的作用

无人机之报警器的作用

一、紧急救援与辅助搜救紧急救援：在事故或紧急情况下，无人机报警器可以迅速发出警报，指引救援人员前往事故地点，提高救援效率。辅助搜救：无人机搭载报警器可以辅助寻找失踪人员或其他需要搜救的场景，通…

阅读更多...

MySQL数据库的介绍

MySQL数据库的介绍

目录 1.什么是MySQL数据库 2.MySQL数据库的设计 MySQL的进一步认识 MySQL的客户端 —— mysql MySQL的服务端 —— mysqld 3.MySQL数据库的架构 MySQL架构图连接层服务层存储引擎层文件系统层 4.MySQL的存储引擎认识存储引擎 MySQL中的存储引擎存储引擎之…

阅读更多...

电工类，今日行业动态

电工类，今日行业动态

电工类今日行业动态一、技术发展趋势智能化、自动化推进：随着人工智能、物联网等技术的不断发展，电工行业正逐步向智能化、自动化转型。智能电网、智能家居等领域的快速发展，对电工技术提出了新的要求，电工人员需要不断学习和…

阅读更多...

使用matplotlib绘制散点图、柱状图和饼状图-学习篇

使用matplotlib绘制散点图、柱状图和饼状图-学习篇

一、散点图 Python代码如下： num_points 100 x np.random.rand(num_points) #x点位随机 y np.random.rand(num_points) #y点位随机 colors np.random.rand(num_points) #颜色随机 sizes 1000 * np.random.rand(num_points) # 大小随机 alphas np.random.ran…

阅读更多...

网络安全评测评技术与标准

网络安全评测评技术与标准

网络安全测评概况概念参照一定的标准规范要求，通过一系列技术和管理方法，获取评估对象网络安全状况信息，对其给出相应网络安全情况综合判定测评对象：信息系统的组成要素或信息系统自身 CC（Common Criteria&#…

阅读更多...

Versioned Staged Flow-Sensitive Pointer Analysis

Versioned Staged Flow-Sensitive Pointer Analysis

VSFS 1.Introduction2.Approach2.1.相关概念2.2.VSFS 3.Evaluation参考文献 1.Introduction 上一篇blog我介绍了目前flow-sensitive pointer analysis常用的SFS算法。相比IFDS-based方法，SFS显著通过稀疏分析提升了效率，但是其内部依旧有许多冗余计算&a…

阅读更多...

12道经典性能测试人员面试题

12道经典性能测试人员面试题

1.性能测试包含了哪些软件测试（至少举出3种）？ 参考答案：负载测试、压力测试、容量测试。负载测试（Load Testing）：负载测试是一种主要为了测试软件系统是否达到需求文档设计的目标&#xff0c…

阅读更多...

Linux系统编程实现ls -l | wc -l指令

Linux系统编程实现ls -l | wc -l指令

由于该指令是通过管道的形式实现的，所以我们要使用系统函数pipe。ls -l |wc -l的作用就是统计当前目录有多少文件。如果又父进程实现ls -l，子进程实现wc -l指令，代码如下： #include<unistd.h> #include<stdio.h> #in…

阅读更多...

帝可得智能售货机运营管理系统

帝可得智能售货机运营管理系统

1.项目介绍帝可得是一个基于物联网概念下的智能售货机运营管理系统应用场景：智能家居、共享充电中、智能售货机智能售货机的优势在于其自我管理能力。物联网技术：像是售货机的顺风耳和千里眼。智能分析与推荐人员设备绑定管理移动支付支持…

阅读更多...

下一代皮克斯：AI如何融合电影与游戏

下一代皮克斯：AI如何融合电影与游戏

故事是人类体验的核心，通过故事我们理解世界、寻找意义并与他人建立联系。技术的进步不断推动着故事叙述的形式，从迪士尼的多平面摄影机到皮克斯的3D图形技术，每一次技术革命都带来了故事叙述的新方式。游戏：现代叙事的前沿今天，有两个主要的趋势正在加速下一代叙事公…

阅读更多...

球球大作战

球球大作战

代码： #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<stdbool.h> #include<graphics.h> #include<stdlib.h> #include<conio.h> #include<time.h>//随机数库文件 #include<math.h> #include<tchar.h…

阅读更多...

推荐文章

最新文章