机器学习之 SVD降维:图像压缩示例

news2024/11/16 17:56:10

引言

在处理大规模数据集时,数据降维是一项非常重要的任务。通过降维,我们可以减少数据的存储需求、加快计算速度,并且在某些情况下还能提高模型的性能。SVD(Singular Value Decomposition,奇异值分解)是一种常用的矩阵分解技术,广泛应用于数据降维、图像压缩等领域。本文将介绍如何使用SVD进行图像压缩,并通过一个简单的Python示例来展示其效果。

什么是SVD?

SVD是一种矩阵分解方法,可以将一个矩阵分解为三个矩阵的乘积形式: A=UΣVTA=UΣVT 其中:

  • UU 是一个由左奇异向量组成的正交矩阵。
  • ΣΣ 是一个对角矩阵,对角线上是奇异值。
  • VTVT 是一个由右奇异向量组成的正交矩阵的转置。

在降维过程中,我们通常保留较大的奇异值对应的奇异向量,忽略较小的奇异值,从而达到降维的目的。

图像压缩示例

我们将使用一张图像作为示例,通过SVD将其压缩到较低的维度,并观察压缩前后图像的变化。

代码实现

首先,我们需要导入必要的库,并定义一个函数来执行图像压缩。

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

def pic_compress(k, pic_array):
    """
    使用SVD对图像进行压缩。
    
    参数:
    - k: 保留的奇异值数量。
    - pic_array: 输入的图像数组。
    
    返回:
    - new_pic: 压缩后的图像数组。
    - size: 压缩后的存储大小。
    """
    global u, sigma, vt, sig, new_pic
    u, sigma, vt = np.linalg.svd(pic_array)  # 进行奇异值分解
    sig = np.eye(k) * sigma[:k]
    new_pic = np.dot(np.dot(u[:, :k], sig), vt[:k, :])  # np.dot用于矩阵的乘法运算
    size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1]
    return new_pic, size

# 加载图像
img = Image.open("lufei.jpg")  # 彩色的图片
ori_img = np.array(img)

# 压缩图像
new_img, size = pic_compress(100, ori_img)  # 压缩的维度

# 打印原始大小和压缩后的大小
print("Original size: " + str(ori_img.shape[0] * ori_img.shape[1]))
print("Compressed size: " + str(size))

# 绘制图像
fig, ax = plt.subplots(1, 2)
ax[0].imshow(ori_img, cmap='gray')
ax[0].set_title("Before Compression")
ax[1].imshow(new_img, cmap='gray')
ax[1].set_title("After Compression")
plt.show()

代码解释

  1. 导入库:导入numpyPILmatplotlib库。
  2. 定义压缩函数:定义了一个pic_compress函数,该函数接受一个整数k作为参数,表示要保留的奇异值数量,以及一个图像数组pic_array
  3. SVD分解:使用np.linalg.svd函数对图像数组进行SVD分解。
  4. 构建新的矩阵:根据保留的奇异值数量构建新的矩阵,并计算压缩后的图像数组。
  5. 计算压缩后的存储大小:根据保留的奇异值数量计算压缩后的存储大小。
  6. 加载图像:使用Image.open函数加载图像,并将其转换为数组。
  7. 压缩图像:调用pic_compress函数压缩图像,并获取压缩后的图像数组和存储大小。
  8. 显示图像:使用matplotlib绘制原始图像和压缩后的图像,并显示它们。

输出结果

  

结论

通过SVD进行图像压缩,我们可以显著减小图像的存储需求,同时保持图像的基本特征。这对于处理大规模图像数据集尤其有用,可以提高数据处理的速度和效率。此外,SVD还可以用于其他类型的降维任务,如特征提取、数据可视化等。

希望这篇博客能够帮助你理解SVD降维的基本概念,并启发你在实际项目中的应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2120093.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《垃圾回收的算法与实现》-算法-摘抄

本文是书籍《垃圾回收的算法与实现》的摘抄,不涉及算法源码及步骤讲解模块。 预备 对象由头(header)和域(field)构成。 头:对象中保存对象本身信息的部分,主要含有以下信息:对象的大小和种类。 域:对象使用者在对象…

cocosCreator实现一个验证码弹窗验证功能

公开文章地址 在 Cocos Creator 中实现一个6位数的验证码输入弹窗功能。主要包含以下三点 1、 可以连续输入验证码 2、 可以粘贴验证码 3、 可以连续删除验证码 前言 引擎版本: Cocos Creator 2.7.2 开发语言: ts 效果图 实现思路 1、 在弹窗界面放置6个输入框的精灵,每个精…

各种无人机飞行服务技术详解

随着科技的飞速发展,无人机(Unmanned Aerial Vehicles, UAVs)技术已成为推动多个行业变革的重要力量。从军事侦察到商业应用,再到日常生活中的娱乐拍摄,无人机的身影无处不在。本文将详细解析无人机飞行服务所涉及的关…

【OpenCV-图像形态学操作】礼帽与黑帽、梯度运算、开运算与闭运算、形态学-膨胀操作、形态学-腐蚀操作

1 形态学-腐蚀操作 import cv2 img cv2.imread(./img/dige.png)cv2.imshow(img, img) cv2.waitKey(0) cv2.destroyAllWindows()# 创建一个 3x3 的结构元素(内核) # np.ones() 函数用于生成一个指定形状的数组,其中所有的元素都初始化为 1# …

服务器深度解析:五大关键问题一网打尽

在科技飞速发展的今天,服务器的重要性不言而喻。但对于服务器的一些关键问题,你真的清楚吗?今天,我们就来为大家深度解析服务器的五大关键问题,满满的干货知识,让你轻松了解服务器的奥秘。 一、“路” 与 …

NS3的3.36版本将Eclipse作IDE

1 配置Eclipse 1.1 安装JDK JDK的tar包下载传送门 下载之后,在当前目录解压(以jdk1.8.0_333为例)。 sudo mkdir /usr/lib/jvm # 在/usr/lib/jvm目录下新建目录 sudo mv jdk1.8.0_333 /usr/lib/jvm # 将解压的文件移动到我们的新建目录下…

Re-ReST: Reflection-Reinforced Self-Training for Language Agents论文学习

文章首先提到了一个推理-动作轨迹数据集的问题。这些数据集经常会包括一些需要多步推理的任务。但是,无论是让人去取得这些数据,还是让更高质量的模型代劳,成本都太高了。因此最好是自我监督,自己产生数据来学习(self-…

在Excel中通过Python运行公式和函数实现数据计算

目录 一、引言 1.1 背景介绍 1.2 Python in Excel 的意义 二、环境准备 2.1 安装必要的软件 2.2 配置 Excel 三、基础操作 3.1 输入 Python 代码 3.2 调用 Python 库 四、案例分析 4.1 数据读取与处理 4.1.1 读取 Excel 数据 4.1.2 数据处理 4.2 数据可视化 4.2…

SprinBoot+Vue学生信息管理系统的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平台Java领域优质…

【信息论与编码原理】自学成才还在学ing

绪论 多的咱不写,只写干干的 点对点通讯系统模型 干扰和噪声不可避免 消息是 信息的载体,消息包含信息,是具体的非物理的 信息是有效的data 信号是 适合信道传输的物理量,可携带消息,可以显示或者描述 香农信息定义…

Java重修笔记 第五十二天 Junit

Junit 的使用 1. 为了方便程序员测试某一个方法而使用 2. 在方法上面加上 Test 并引用 5.X 版本 3. 就能在方法前面看到可运行的按钮 public class Homework07 {public static void main(String[] args) {}Testpublic void testList() {DAO<User> dao new DAO<&g…

大数据与人工智能:脑科学与人工神经网络ANN

文章目录 大数据与人工智能&#xff1a;脑科学与人工神经网络ANN一、引言ANN简介研究背景与应用领域发展背景应用场景 二、ANN背后的人脑神经网络人脑神经网络的专业描述神经元的结构信号处理 思考和认知过程认知功能的实现 对机器学习算法的启示 三、ANN的研究进展初始阶段&am…

通过docker overlay2目录名查找容器名和容器ID

有时候经常会有个别容器占用磁盘空间特别大&#xff0c;这个时候就需要通过docker overlay2 日录名查找对应容器名. 1.首先进入到 /var/lib/docker/overlay2 目录下 # cd /var/lib/docker/overlay2 2.查看谁占用容间最大 # du -h -d 1 | grep G |sort -nr 3.再通过目录名查找…

存储课程学习笔记4_设计数据结构管理nvme磁盘(基于已经通过struct nvme_user_io和ioctl实现了对nvme设备的读写)

已经测试了直接操作nvme磁盘的方式&#xff0c;那么基于可以读写nvme磁盘的功能&#xff0c;如何扩展呢。 通过struct nvme_user_io结构体ioctl实现对nvme磁盘的读写访问&#xff0c;可以定义结构&#xff0c;对整个磁盘进行管理&#xff0c;以配合业务进行衍生功能。 0&…

使用Idea新建一个Demo项目基于WebApp目录下的服务器访问测试-作业篇

文章目录 前言一、Maven环境搭建二、创项目总结 前言 例如&#xff1a;第一堂JAVAweb 轻量级的项目搭建运行作业。 一、Maven环境搭建 环境变量配置 新建系统变量 MAVEN_HOMEC:\apache-maven-3.6.3path后边加上 %MAVEN_HOME%\bin然后控制台cmd 检查变量配置是否完全 mvn -v…

ABC 370 E - Avoid K Partition

原题链接&#xff1a;E - Avoid K Partition 题意&#xff1a;给长度为n的数组&#xff0c;将数组划分成任意份&#xff0c;但是每一份的总和都不能是k&#xff0c;问有多少种分割方法。 思路&#xff1a;dp&#xff0c;f[i]&#xff0c;代表前i个元素满足题意的划分的总和&a…

申请Shopify PayPal账号的时间和所需资料如下

申请流程 注册账户&#xff1a; 访问 PayPal官网。点击右上角的“注册”按钮&#xff0c;选择“企业账户”。输入电子邮箱地址和密码&#xff0c;点击“继续”。填写公司信息&#xff1a; 提供公司名称、营业执照地址、联系方式等信息。确保公司名称与营业执照上的名称一致。填…

1.2 半导体二极管笔记

文章目录 一、符号二、 伏安特性1、正向特性2、反向特性3、反向击穿特性 二、二极管的主要参数1、最大整流电流 I F I_F IF​2、反向击穿电压 U B R U_{BR} UBR​3、反向饱和电流 I S I_S IS​4、最高工作频率 f m f_m fm​5、极间电容 C d C_d Cd​ 四、二极管的测试1、二极管…

突破最强算法模型,Transformer !!

这几天&#xff0c;大家对于Transformer的问题&#xff0c;还是不少。 今儿再和大家聊聊~ 简单来说&#xff0c;Transformer 是一种神经网络模型&#xff0c;在机器翻译、语言理解等任务中表现特别好。它的核心思想是自注意力机制&#xff08;Self-Attention&#xff09;&…

el-image(vue 总)

一 加载静态资源 在第一次使用vue3开发项目时&#xff0c;使用require&#xff08;‘图片路径’&#xff09;&#xff0c;结果浏览器报错&#xff1a; Uncaught (in promise) ReferenceError: require is not defined 因为require是webpack提供的一种加载能力&#xff0c;但…