数据压缩算法PCA使用指南

news2025/1/9 1:41:01

来源:投稿 作者:小灰灰
编辑:学姐

PCA主成分分析算法

PCA的使用范围

PCA(principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据压缩算法。

在PCA中,数据从原来的坐标系转换到新的坐标系,由数据本身决定。

使用的用途很广,在人脸识别中(EigenFace,deepid),三维人脸重建中的(3DMM模型),想用数据降维时,通过PCA降维可以发现更便于人类理解的特征;同时也可以用于去燥等等。

问题

假设有一张图片是128*128 大小的图片,那我们就可以当成n=128*128, 也就是将矩阵拉成一维的,也就是X是一批数据组成的集合,那么PCA就是通过每一个点刻画这样一种分布,因为原本的X是复杂的。那么就需要找到一个主向量。

2.1 先计算协方差的特征值和特征向量

我们有40个人,每个人10张图片,也就是总共400张图片。图片大小为112*92。

现在我们要对这400张图片进行求特征值与特征向量。

img_list = []
for i in range(1,41):
    for j in range(1,11):
        file = "ORL/s%d/%d.bmp" % (i,j)
        img = cv2.imread(file,cv2.IMREAD_GRAYSCALE)
        img = img.astype(np.float32)/255.0
        img_list.append(img)
imgs = np.zeros([400,10304],dtype=np.float32)

这是从ORL中读取数据。

for i in range(0,400):
    imgs[i,:] = img_list[i].reshape(92*112)
plt.imshow(imgs)  # 显示图片
plt.show()
plt.savefig('lena_new_sz.png')

然后将这些数据保存到lena_new_sz.png文件中。

imgs = np.zeros([400,10304],dtype=np.float32)
for i in range(0,400):
    imgs[i,:] = img_list[i].reshape(-1)
# plt.imshow(imgs)  # 显示图片
# plt.show()
# plt.savefig('lena_new_sz.png')
imgs_mean = imgs.sum(axis=0)/400.0 #求平均值
np.savetxt('mean.txt',imgs_mean,fmt="%.5f")

imgs_mean就是平均脸

我们将这个平均脸显示出来是:

进行均值归一化。

imgs = imgs - imgs_mean
#conv = imgs.transpose(1,0).dot(imgs)计算协方差矩阵,就是conv
conv = imgs.dot(imgs.transpose(1,0))
print(conv.shape)#(10304, 10304)对协方差矩阵求特征值eig_value,特征向量eig_vector

eig_value,eig_vector = np.linalg.eig(conv)
print(eig_value.shape,eig_vector.shape)#(10304,) (10304, 10304)算完之后,转完32的浮点数,保存文本和二进数。
eig_value = eig_value.astype(np.float32)
eig_vector = eig_vector.astype(np.float32)
eig_vector = imgs.transpose(1,0).dot(eig_vector)
np.savetxt('eig_vetor400.txt',eig_vector,fmt="%.5f")
np.savetxt('eig_value400.txt',eig_value,fmt="%.5f")
eig_vector.tofile('eig_vector400.bin')

特征向量

特征值

2.2 重构出人脸

通过评价脸,特征值,和特征向量将图片显示出来

imgs_mean = np.loadtxt('mean.txt')
eig_vector = np.fromfile('eig_vector.bin',dtype = np.float32)
eig_vector = eig_vector.reshape(10304,-1)
u = eig_vector[:,:256]
for i in range(0,256):
    face = u[:,i] + imgs_mean
    face = face * 255
    face[face<0] = 0
    face[face>255]=255
    face = face.astype(np.uint8).reshape(112,-1)
    cv2.imwrite('eigface/%s.bmp'%i,face)

可得出,我们取出了前256个特征。显示出这些的特征脸。

我们将上面的特征脸重构出人脸。

for i in range(1,41):
    for j in range(1,11):
        file = "ORL/s%d/%d.bmp" % (i,j)
        img = cv2.imread(file,cv2.IMREAD_GRAYSCALE)
        img = img.astype(np.float32)/255.0
        img = img.reshape(-1)
        img = img - imgs_mean
        prj = img.dot(u)
        np.savetxt('features/%s_%s.txt'%(i,j),prj,fmt="%.5f")
        cons = u.dot(prj)
        cons = cons + imgs_mean
        cons = cons*255
        cons[cons<0]=0
        cons[cons>255]=255
        cons = cons.astype(np.uint8).reshape(112,-1)
        cv2.imwrite('construct/%s_%s.bmp'%(i,j),cons)

重构出来的图片

相对应于原始的人脸

因为我们取了256个特征值,如果是400,那么将会更接近于原始图片。

机器学习干货+论文资料👇点击卡片关注获取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/137032.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【2023.01.03】定时执行专家 V6.5 更新日志 - TimingExecutor V6.5 Change Log

目录 ◆ 最新版下载链接 ◆ 软件更新日志 – TimingExecutor Full Change Log ▼ 2023-01-03 V6.5 ▼ 2022-12-25 V6.4 ▼ 2022-11-15 V6.3 ▼ 2022-10-01 V6.2 ▼ 2022-07-30 V6.1&#xff08;Build 769.30072022&#xff09; ▼ 2022-06-30 V6.0 ▼ 2022-…

《学术规范与论文写作》总结

文章目录一、写作规范二、写作准备三、论文架构3.1 标题3.2 摘要3.3 关键词&#xff08;可省&#xff09;3.4 引言3.5 相关工作&#xff08;研究背景&#xff09;3.6 实现细节3.7 实验部分3.8 结论四、写作技巧五、其他技巧5.1 算法伪代码5.2 图片5.3 写作语言一、写作规范 写…

短视频剪辑素材在哪里找?

视频剪辑没素材&#xff0c;推荐5个网站帮你解决&#xff0c;免费可商用&#xff0c;建议收藏&#xff01; 1、菜鸟图库 https://www.sucai999.com/video.html?vNTYwNDUx 网站有超多视频素材&#xff0c;全部都是高清无水印&#xff0c;各种类型都有&#xff0c;像自然、城市…

【Linux】文件操作|文件描述符|重定向

文章目录1.文件操作系统调用的几个基本接口openwritereadlseekwrite read close lseek ,对比C文件相关接口2.如何理解文件操作&#xff1f;3.文件描述符fd文件描述符的分配规则重定向使用 dup2 系统调用进行重定向4.在自己的shell中添加重定向功能&#xff1a;1.文件操作系统调…

唯品会api_sign分析

本次分析的案例是唯品会app,版本号:7.45.6 抓个包,请求头中有个api_sign,该字段就是本次分析的对象。 1.jadx 静态分析 直接搜索关键词:api_sign= 跟进去,来到这里。 这里用到了VCSPSecurityBasicService.apiSign()方法,双击两下,找到函数的定义地方。 这里引用到的方…

【机器学习实战】四、实现线性回归模型案例

线性回归案例 一、初始化方法 1.对数据进行预处理模块&#xff0c;调用prepare_for_training方法&#xff0c;得到返回值data_processed, features_mean, features_deviation 2.得到所有的特征个数&#xff0c;即data的特征维数的列(行shape[0]&#xff0c;列shape[1]) 3.初始…

怎么获取level2行情接口数据?

怎么获取level2行情接口数据比较方便呢&#xff1f;其实level2行情接口可以实时计算沪深所有股票数据&#xff0c;主要是可以让交易者方便引用和计算公式再进入股票池&#xff0c;就比如说一个分笔数据含有10-20个分笔数据&#xff0c;用分笔数据计算的资金流入数据不准确&…

< Linux > 进程控制

目录 1、进程创建 fork函数 fork函数返回值 写时拷贝 fork常规用法 fork调用失败的原因 2、进程终止 2.1、进程退出常见场景 2.2、进程退出码 2.3、进程常见退出方法 _exit函数 exit函数 return退出 2.4、关于终止&#xff0c;内核做了什么 3、进程等待 3.1、进程等待必要性…

解决VS2019+Qt5+Vcpkg工程无法调试但Release正常运行的问题

前言——这个问题可能比较小众&#xff0c;但是因为解决了我自己的问题&#xff0c;所以特此把解决方法分享出来&#xff0c;以给特定的人提供必要的帮助。 项目原因&#xff0c;一直使用VS2019Qt5Vcpkg&#xff0c;无奈程序一直无法进行调试&#xff0c;Release模式倒是正常运…

计算机图形学 Ray Trace 学习笔记

屏幕上的一个像素&#xff0c;是通过各种反射、折射而共同组成的&#xff0c;每个反射折射的点&#xff0c;都会考虑光源是否有直接照射到反射折射的点上&#xff0c;反射与折射之间会存在能量衰减&#xff0c;最终汇总在屏幕的像素上。 计算是哪一个三角形被射线打中&#xff…

Hive SQL 每日SQL

1、查询订单明细表&#xff08;order_detail&#xff09;中销量&#xff08;下单件数&#xff09;排名第二的商品id&#xff0c;如果不存在返回null&#xff0c;如果存在多个排名第二的商品则需要全部返回。 需要用到的表&#xff1a; 订单明细表&#xff1a;order_detail 代码…

【谷粒商城基础篇】仓储服务:仓库维护

谷粒商城笔记合集 分布式基础篇分布式高级篇高可用集群篇简介&环境搭建项目简介与分布式概念&#xff08;第一、二章&#xff09;基础环境搭建&#xff08;第三章&#xff09;整合SpringCloud整合SpringCloud、SpringCloud alibaba&#xff08;第四、五章&#xff09;前端知…

android 创建aar包

1. 背景 由于新入职公司在做硬件接入的项目&#xff0c;需要接入多款硬件&#xff0c;而且&#xff0c;几个app的功能不太一样。于是&#xff0c;需要模块化开发&#xff0c;并且许多东西都是可以复用的&#xff08;像网络框架、log、shareprefrence、权限申请等&#xff09;。…

嵌入式HLS 案例开发步骤分享——Zynq-7010/20工业开发板(1)

目 录 前 言 3 1 HLS 开发流程说明 5 1.1 HLS 工程导入 5 1.2 编译与仿真 6 1.3 综合 8 1.4 IP 核封装 10 1.5 IP 核测试 14 前 言 本文主要介绍 HLS 案例的使用说明,适用开发环境: Windows 7/10 64bit、Xilinx Vivado 2017.4 、Xilinx Vivado HLS 2017.4 、Xilinx…

数据结构|排序算法详解

​​​​​​​目录 一.插入类 1.直接插入排序 2.希尔排序 二.选择类&#xff0c;排一次选出一个最值 1.选择排序 2.堆排序 三.交换类&#xff0c;通过一直交换一次确定数字的位置 1.冒泡排序 2.快速排序 2.1 hoare版本 2.2挖坑法 2.3前后指针法 四.归并类 1.归并…

Go第 5 章:程序流程控制

第五章程序流程控制 5.1程序流程控制介绍 在程序中&#xff0c;程序运行的流程控制决定程序是如何执行的&#xff0c;是我们必须掌握的&#xff0c;主要有三大流程控 制语句。 1)顺序控制 2)分支控制 3)循环控制 5.2 顺序控制 程序从上到下逐行地执行&#xff0c;中间没有任…

C++标准库的智能指针:shared_ptr、weak_ptr和unique_ptr

文章目录智能指针shared_ptr模版类week_ptr模版类unique_ptrC中是没有内存回收机制的&#xff0c;我在之前的一篇文章中提到使用指针的一些基本方法。C在std标准库中也提供了三种封装过的指针模版类&#xff0c;称作为智能指针&#xff1a;shared_ptrunique_ptrweek_ptr 我这里…

JVM性能调优详解

前面我们学习了整个JVM系列&#xff0c;最终目标的不仅仅是了解JVM的基础知识&#xff0c;也是为了进行JVM性能调优做准备。这篇文章带领大家学习JVM性能调优的知识。 性能调优 性能调优包含多个层次&#xff0c;比如&#xff1a;架构调优、代码调优、JVM调优、数据库调优、操…

最优二叉树(哈夫曼树)

一、最优二叉树 1、定义 官方定义&#xff1a;在权值为w1&#xff0c;w2&#xff0c;…&#xff0c;wn的 n个叶子所构成的所有二叉树中&#xff0c;带权路径长度最小(即代价最小)的二叉树称为最优二叉树或哈夫曼树。 通俗来讲&#xff0c;就是给定N个权值作为N个叶子结点&…

仿牛客论坛项目总结

一.数据库中每一张表有哪些字段 user表 用户表 &#xff08;1&#xff09;id 用户的id &#xff08;2&#xff09; username 用户名 &#xff08;3&#xff09;password 密码 &#xff08;4&#xff09;salt 盐 &#xff08;5&#xff09;emai邮箱 &#xff08;6&…