sklearn数据降维之字典学习

news2024/9/27 9:20:08

文章目录

    • 字典学习简介
    • 构造函数
    • 实战
      • Step1 制作实验数据
      • Step2 小批字典学习
      • Step 3 参数调整

字典学习简介

如果把降维理解成压缩的话,那么字典学习的本质是编码,其目的是找到少量的原子,用以描述或构建原始样本。举个一维的例子,以abcabcabc为例,很显然abc就是一个院子,这个字符串无非是abc重复了三次而已,用abc这个词条,或者说原子,就可以构建abcabcabc这样的字符串。

一般来说,字典学习所面对的并不是一个字符串,而是一个稀疏矩阵,基于此,需要对一些概念做下定义

  • 原始样本 Y Y Y,就是原始矩阵
  • 字典矩阵 D D D,内部含有的词条为列向量,被称为原子,记作 d k d_k dk
  • 稀疏矩阵 X X X,可以理解为查字典的方法

从而, Y = D X Y=DX Y=DX就是通过 X X X来查阅 D D D从而得到 Y Y Y的过程,在sklearn中,字典学习实际上是求解如下优化问题

( D , X ) = arg min ⁡ 0.5 ∥ Y − D X ∥ F 2 + α ∥ X ∥ 1 , 1 D , X w i t h ∥ X k ∥ 2 ⩽ 1 ∀ 0 ⩽ k < N (D, X) = \argmin 0.5 \Vert Y - DX \Vert_{F}^2 + \alpha\Vert X\Vert_{1,1}\\ D, X with \Vert X_k\Vert_2 \leqslant 1\quad\forall 0 \leqslant k < N (D,X)=argmin0.5∥YDXF2+αX1,1D,XwithXk21∀0k<N

其中 ∥ ∥ 1 , 1 \Vert\quad\Vert_{1,1} 1,1表示对矩阵中所有实数求和; ∥ ∥ F \Vert\quad\Vert_F F为佛罗贝尼乌斯范数,可定义为

∥ A ∥ F = ∑ i = 1 n ∑ j = 1 n ∣ a i j ∣ 2 = trace ⁡ ( A A ) \Vert A\Vert_F=\sqrt{\sum^n_{i=1}\sum^n_{j=1}\vert a_{ij}\vert^2}=\sqrt{\operatorname{trace}(AA)} AF=i=1nj=1naij2 =trace(AA)

构造函数

字典学习作为类被封装在sklearn中,其构造函数如下

class decomposition.DictionaryLearning(n_components=None, *, alpha=1, max_iter=1000, tol=1e-08, fit_algorithm='lars', transform_algorithm='omp', transform_n_nonzero_coefs=None, transform_alpha=None, n_jobs=None, code_init=None, dict_init=None, verbose=False, split_sign=False, random_state=None, positive_code=False, positive_dict=False, transform_max_iter=1000)

其中,n_components为要提取的元素个数,alpha即为前文公式中的 α \alpha α,表示稀疏控制参数。

由于构造函数参数太多,故只则取一些常用参数

fit_algorithm 为拟合算法,可选

  • 'lars': 最小角回归
  • 'cd':坐标下降

transform_algorithm 为数据转换方案:

  • 'lars':最小角回归
  • 'lasso_lars':lasso最小角回归
  • 'lasso_cd':lasso坐标下降
  • 'omp': 正交匹配追踪
  • 'threshold': 阈值法,将字典所有小于 α \alpha α的值置为0

transform_algorithmlarsomp时,可选参数transform_n_nonzero_coefsint,表示 D D D的每一列中非零系数的目标值。

此外,还有一些通用的参数:max_iter表示最大迭代次数;tol 表示最大误差;n_jobs表示并行进程数;random_state为随机数状态,便于成果复现。

考虑到在处理矩阵问题时往往比较耗时,所以提供了小批字典学习类MiniBatchDictionaryLearning,便于处理较大数据,其构造函数与字典学习基本相同。

实战

Step1 制作实验数据

sklearn官网提供了基于字典学习进行图像去噪的例子,首先向图像中添加噪声,得到类似下图这样的

在这里插入图片描述

代码为

import matplotlib.pyplot as plt
import numpy as np

img = plt.imread("lean_gray.jpg")/255.0
h, w = img.shape
imNoise = img*1
mid = w//2
imNoise[:, mid:] += 0.1 * np.random.randn(h, mid)

def showError(imNoise, img, title):
    plt.subplot(1, 2, 1)
    plt.imshow(imNoise, vmin=0, vmax=1, cmap=plt.cm.gray)
    plt.title("image")
    plt.axis('off')
    plt.subplot(1, 2, 2)
    err = imNoise - img
    msg = f"err std:{np.std(err):.2f}"
    plt.title(msg) 
    plt.imshow(err, vmin=-0.5, vmax=0.5, cmap=plt.cm.PuOr)
    plt.axis('off')
    plt.suptitle(title)

showError(imNoise, img, "Distorted image")
plt.show()

Step2 小批字典学习

接下来,创建MiniBatchDictionaryLearning对象,并fit,完成训练,然后查看一下字典学习中的"原子"components_

在这里插入图片描述

from sklearn.decomposition import MiniBatchDictionaryLearning as mbdl

from sklearn.feature_extraction.image import extract_patches_2d as ep2d

patch_size = (7, 7)
data = extract_patches_2d(imNoise[:, : mid], patch_size)
data = data.reshape(data.shape[0], -1)
# 按行归一化
data = (data-np.mean(data, axis=0))/ np.std(data, axis=0)

### !!!!!!!!!!!!!!!!!!!!
dico = mbdl(n_components=50, batch_size=200,alpha=1.0, max_iter=10)
dico.fit(data)
X = dico.components_
### !!!!!!!!!!!!!!!!!!!!

for i, comp in enumerate(X[:50]):
    plt.subplot(5, 10, i + 1)
    plt.imshow(comp.reshape(patch_size))
    plt.axis('off')

Step 3 参数调整

最后,调整参数,对比不同情况下字典学习的效果,如图所示

AB
在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述

代码如下

from sklearn.feature_extraction.image import reconstruct_from_patches_2d

data = extract_patches_2d(imNoise[:, mid:], patch_size)
data = data.reshape(data.shape[0], -1)
intercept = np.mean(data, axis=0)
data -= intercept

tf_algs = [
    ("omp @1 atom", "omp", 
        {"transform_n_nonzero_coefs": 1}),
    ("omp @2 atoms", "omp", 
        {"transform_n_nonzero_coefs": 2}),
    ("las @4 atoms", "lars", 
        {"transform_n_nonzero_coefs": 4}),
    ("Thresholding @ alpha=0.1", "threshold",
        {"transform_alpha": 0.1}),
]

recons = {}
for title, tf_alg, kwargs in tf_algs:
    print(title + "...")
    recons[title] = img.copy()
    dico.set_params(transform_algorithm=tf_alg, **kwargs)
    code = dico.transform(data)
    Ys = np.dot(code, X)
    Ys += intercept
    Ys = Ys.reshape(len(data), *patch_size)
    if tf_alg == "threshold":
        Ys = (Ys - Ys.min())/Ys.max()
    recons[title][:, mid:] = reconstruct_from_patches_2d(
        Ys, (h, mid))
    plt.figure(title)
    showError(recons[title], img, title)

plt.show()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/175481.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

程序员护眼指南

前言 前言&#xff1a;脱发和近视是当代年轻人的两大痛点&#xff0c;今天来聊聊如何护眼。 文章目录前言一、护眼的核心二、调节睫状肌的方法1. 眨眼2. 望远3. 睡觉4. 促进血液循环5. 吃补剂6. 好的屏幕一、护眼的核心 护眼的核心就是保护睫状肌。 睫状肌是眼内的一种平滑肌…

一起自学SLAM算法:7.7 典型SLAM算法

连载文章&#xff0c;长期更新&#xff0c;欢迎关注&#xff1a; 针对式&#xff08;7-38&#xff09;所述的在线SLAM系统&#xff0c;以扩展卡尔曼滤波&#xff08;EKF&#xff09;为代表的滤波方法&#xff0c;是求解该状态估计问题最典型的方法&#xff0c;在7.4节中已经详细…

GY-US42超声波传感器模块介绍

GY-US42超声波传感器模块简介GY-US42 是一款低成本高品质测距传感器模块。工作电压 3-5v&#xff0c;功耗小&#xff0c;体积小&#xff0c;安装方便。其工作原理是&#xff0c;探头发射超声波&#xff0c;照射到被测物体后&#xff0c;探头接收返回声波&#xff0c;利用时间差…

学人工智能电脑主机八大件配置选择指南

来源&#xff1a;深度之眼 作者&#xff1a;frank 编辑&#xff1a;学姐 本篇主要是帮助大家构建高性能、高性价比的AI开发的硬件平台。如何不把钱浪费到不必要的硬件上&#xff0c;并合理搭配硬件配置节省预算是本文想要去讨论的问题。如果预算充足&#xff0c;笔者建议购买一…

【JavaSE专栏1】Java的介绍、特点和历史

作者主页&#xff1a;Designer 小郑 作者简介&#xff1a;Java全栈软件工程师一枚&#xff0c;来自浙江宁波&#xff0c;负责开发管理公司OA项目&#xff0c;专注软件前后端开发&#xff08;Vue、SpringBoot和微信小程序&#xff09;、系统定制、远程技术指导。CSDN学院、蓝桥云…

Python ·保险理赔分析:数据分析

介绍 提示&#xff1a;这里可以添加系列文章的所有文章的目录&#xff0c;目录需要自己手动添加 在本笔记本中&#xff0c;我们将仔细研究保险索赔&#xff0c;并弄清一些有关血压、BMI、糖尿病、吸烟、年龄和性别等条件如何影响索赔价值的事实。 我们将使用散点图、饼图、直…

IDEA必装插件-Gyro

前言用SpringBootTest运行单测的时候&#xff0c;是不是每运行都需要重新启动Spring容器&#xff1f;大型应用启动一次会浪费大量的时间&#xff0c;导致效率比较低。Gyro插件可以解决你的问题。Gyro介绍它是一个IDEA插件&#xff0c;安装之后&#xff0c;用Gyro Debug运行你的…

一起自学SLAM算法:7.4 基于贝叶斯网络的状态估计

连载文章&#xff0c;长期更新&#xff0c;欢迎关注&#xff1a; 在7.2.4节中&#xff0c;讨论了表示机器人观测与运动之间依赖关系的概率图模型&#xff0c;主要是贝叶斯网络&#xff08;实际应用在机器人中的是动态贝叶斯网络&#xff09;和马尔可夫网络&#xff08;实际应用…

fpga实操训练(lcd字符显示)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】 用fpga编写屏幕显示,和c语言编写有很大的不同。用c语言开发,很大程度上是遵循soc ip提供的规范进行编写。而用fpga开发的话,则需要考虑不同信号的时序关系。但是,用fpga开发也有…

c++ 优先级队列priority_queue的使用

c priority_queue是对其他容器元素顺序的调整包装; 堆的原理 1.定义 priority_queue<Type, Container, Functional> q; 其中&#xff0c;Type是数据类型&#xff0c;Container是低层容器&#xff0c;如vector, stack, deque等. Functional是比较函数&#xff1b;默认可…

day25-类加载器反射

1.类加载器 1.1类加载器【理解】 作用 负责将.class文件&#xff08;存储的物理文件&#xff09;加载在到内存中 1.2类加载的过程【理解】 类加载时机 创建类的实例&#xff08;对象&#xff09;调用类的类方法访问类或者接口的类变量&#xff0c;或者为该类变量赋值使用反…

NodeJS 之 HTTP 模块(实现一个基本的 HTTP 服务器)

NodeJS 之 HTTP 模块&#xff08;实现一个基本的 HTTP 服务器&#xff09;参考描述HTTP 模块搭建 HTTP 服务器http.createServer()监听检测服务器端口是否被占用终端Error Code超时处理处理客户端的请求request 事件http.IncomingMessagehttp.ServerResponse中文乱码问题问题解…

Java EE之线程编(进阶版)

这些锁策略能适用于很多中语言&#xff0c;博主是学Java的&#xff0c;所以下面的代码会用Java去写&#xff0c;请大家见谅&#xff0c;但是处理的方法是大差不差的。 一、常见锁和锁策略&#xff1a; (一)、乐观锁和悲观锁 1、何为乐观锁和悲观锁呢&#xff1f; 答&#…

Linux服务器常见运维性能测试(3)CPU测试super_pi、sysbench

Linux服务器常见运维性能测试&#xff08;3&#xff09;CPU测试常见性能测试软件CPU测试&#xff1a;super_pi &#xff08;计算圆周率&#xff09;CPU测试&#xff1a;sysbench&#xff08;CPU功能测试部分&#xff09;下载安装sysbench综合测试功能执行CPU测试最近需要测试一…

Java面试题含答案,最新面试题(1)

Java 中 InvokeDynamic指令是干什么的&#xff1f; JVM字节码指令集一直比较稳定&#xff0c;一直到Java7中才增加了一个InvokeDynamic 指令&#xff0c;这是JAVA为了实现『动态类型语言』支持而做的一种改进&#xff1b;但是在Java7中并没有提供直接生成InvokeDynamic 指令的…

自定义类型:结构体,枚举,联合

目录一、结构体内存对齐二、位段2.1 什么是位段2.2 位段内存分配规则2.3 位段的跨平台问题三、枚举四、联合体4.1 联合类型的定义4.2联合的特点4.3 联合大小的计算4.4 练习一、结构体内存对齐 struct s {char c1;int i;char c2; }; int main() {printf("%d\n", size…

【Hadoop】HDFS体系结构分析

文章目录1. NameNode2. Secondary NameNode3. DataNodeHDFS主要包含NameNode、Secondary NameNode和DataNode三部分&#xff0c;且这三部分在分布式文件系统中分属不同的机器&#xff0c;其中Secondary NameNode不是必须的&#xff0c;在HA架构中Standby NameNode可以替代它。 …

【深度学习】详解 SimCLR

目录 摘要 一、引言 二、方法 2.1 The Contrastive Learning Framework 2.2. Training with Large Batch Size 2.3. Evaluation Protocol 三、用于对比表示学习的数据增广 3.1 Composition of data augmentation operations is crucial for learning good representa…

5-2中央处理器-指令周期的数据流

文章目录一.指令周期二.数据流向1.取指周期2.间址周期3.执行周期4.中断周期三.指令执行方案1.单指令周期2.多指令周期3.流水线方案一.指令周期 指令周期&#xff1a;CPU从主存中每取出并执行一条指令所需的全部时间。 此处&#xff1a;取指周期取指令指令译码 指令周期常用若…

SSM整合(Spring + SpringMVC + MyBatis)

SSM Spring SpringMVC MyBatis 准备数据库 SET FOREIGN_KEY_CHECKS0; DROP TABLE IF EXISTS user; CREATE TABLE user (id int(11) NOT NULL AUTO_INCREMENT,username varchar(20) NOT NULL COMMENT 用户名,password varchar(255) NOT NULL COMMENT 密码,real_name varchar(…