生成式多模态之AE DAE/MAE VAE VQ-VAE/VQ-VAE2

news2025/4/8 20:30:25

1. AE

自编码器(Autoencoder，AE)是一种无监督学习的神经网络，用于学习输入数据的压缩表示。是一种瓶颈架构（ bottleneck），它使用编码器将高维输入x 转换为潜在的低维Code h，然后使用解码器将潜在Code h进行重构，得到最终的输出x’。

在这里插入图片描述

class autoencoder(nn.Module):
    def __init__(
          self, 
          x_dim,
          hidden_dim=256,
          z_dim=50
        ):
        super(autoencoder, self).__init__()
        
        # Define autoencoding layers
        self.enc_layer1 = nn.Linear(x_dim, hidden_dim)
        self.enc_layer2 = nn.Linear(hidden_dim, z_dim) 

        # Define autoencoding layers
        self.dec_layer1 = nn.Linear(z_dim, hidden_dim)
        self.dec_layer2 = nn.Linear(hidden_dim, x_dim) 

    def encoder(self, x):
        # Define encoder network
        x = F.relu(self.enc_layer1(x))
        z = F.relu(self.enc_layer2(x))
        return z
        
    def decoder(self, z):
        # Define decoder network
        output = F.relu(self

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1938902.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

年份	1月	2月	3月	4月	5月	6月	8月	9月	10月
2020					DETR	DDPM			DDIM、VisionTransformer
2021	CLIP、DALL·E		Swin Transformer
2022	BLIP			DALL·E 2			StableDiffusion、BEiT-3、Midjourney V3
2023	BLIP2		VisualChatGPT、Midjourney V5、GPT4、Diffusion Transformers	SAM				DALL·E3
2024		Sora、StableDiffusion3

生成式多模态之AE DAE/MAE VAE VQ-VAE/VQ-VAE2

目录

1. AE

相关文章

linux内核中list的基本用法

AES算法概述

【科大讯飞笔试题汇总】2024-07-20-科大讯飞秋招提前批(算法岗)-三语言题解(Cpp/Java/Python)

基于java+springboot+vue实现的企业OA管理系统（文末源码+Lw）131

【nnUNet V2系列】nnUNet V2在Ubuntu下安装调试篇

某4G区域终端有时驻留弱信号小区分析

Visual Studio 2022美化

手机数据恢复技巧：适用于 Android 的恢复应用程序

git跨库合并

腾讯会议产品策划的成长之路：从万字文档到功能落地的实战经验

抽奖算法的设计与实现

【MySQL】：对库和表的基本操作方法

DEGAS：将临床属性转移到细胞

【Python】使用库 -- 详解

动态路由协议 —— EIGRP 与 OSPF 的区别

【Python系列】Python 缓存机制

【排序数组】python刷题记录

【运维】软件运维方案（2024word完整版）

Leetcode1688. 比赛中的配对次数

【计算机视觉】siamfc论文复现实现目标追踪