ICML2018 | PixelSNAIL+：An Improved Autoregressive Generative Model

ICML2018 | PixelSNAIL+：An Improved Autoregressive Generative Model

news2025/4/27 9:02:20

论文链接：PixelSNAIL: An Improved Autoregressive Generative Model

论文标题：PixelSNAIL: An Improved Autoregressive Generative Model

代码：GitHub - neocxi/pixelsnail-public

GitHub - neocxi/pixelsnail-public

一、问题提出

高维数据上的自回归生成模型x = (x1，……， xn)将联合分布分解为条件的乘积：

训练一个循环神经网络(RNN)来建模p(xi|x1:i−1)。可选地，模型可以以附加的全局信息h为条件(例如类标签，当应用于图像时)，在这种情况下，它在模型p(xi|x1:i−1,h)中。这种方法具有高度的表达性，并允许建模复杂的依赖关系。与GANs相比，自回归模型提供了易于处理的似然计算和易于训练，并已被证明优于潜变量模型。主要的设计考虑因素是用于实现RNN的神经网络体系结构，因为它必须能够很容易地引用序列的前面部分。存在以下几种可能性:

传统的RNN，如GRU或LSTM：通过将信息保持在隐藏状态来传播信息，从一个时间步长到下一个时间步长。这种暂时的线性依赖极大地抑制了它们在数据中建模长期关系的程度

Causal convolutions(因果卷积)：对序列应用卷积(掩盖或移位，以便当前预测仅受前一个元素的影响)。它们为序列的早期部分提供了高带宽访问。然而，它们感受域是有限的，并且对于序列中较远的元素仍然会经历明显的衰减。

Self-attention：这些模型将序列转换为无序的键值存储，可以根据内容进行查询。它们具有不受限制的接受域，并允许对序列中遥远的信息进行未退化的访问。然而，它们只提供对少量信息的精确访问，并且需要额外的机制来整合位置信息

因果卷积和自我注意表现出互补的优点和缺点:前者允许在有限的上下文大小上进行高带宽访问，后者允许在无限大的上下文上进行访问。因此，将两者交织在一起提供了两全其美的服务，模型可以获得高带宽访问，而不受其有效使用的信息量的限制。

新的架构PixelSNAIL。

二、PixelSNAIL

1、组件

Residual Block对其输入应用几个2d卷积，每个卷积都有残差连接。为了使它们具有因果关系，卷积被mask，以便当前像素只能访问它左边或上面的2个像素。使用类似于的门控激活函数。在整个模型中，每个块使用4个卷积，每个卷积中使用256个filters。

Attention执行单个键值查找。它将输入投影到较低的维度以产生key和value，然后使用softmax-attention(进行了mask，以便当前像素只能关注先前生成的像素)。使用大小为16的键和大小为128的值。

2、架构

仅在CIFAR-10模型中，在每个残差块的第一次卷积后应用了0.5的dropout，以防止过拟合。对于ImageNet没有使用任何dropout，因为数据集要大得多。

三、实验

1、baseline及其NLL损失：

2、生成采样

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/86285.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

程序人生：25岁我从零基础转到软件测试，我看到了前途...目前28K

程序人生：25岁我从零基础转到软件测试，我看到了前途...目前28K

推荐好文： [内部资源] 想拿年薪30W的软件测试人员，这份资料必须领取~ Python自动化测试全栈性能测试全栈，挑战年薪40W 没有一个人的人生，能够按照自己写好的脚本去走。从一而终是幸运的，但也是不幸的，因…

阅读更多...

1568_AURIX_TC275_电源管理_唤醒配置与状态

1568_AURIX_TC275_电源管理_唤醒配置与状态

全部学习汇总： GreyZhang/g_TC275: happy hacking for TC275! (github.com) 如果有待机RAM保持的功能激活了，那么唤醒以及复位都不会进行RAM的重新初始化。 PORST相关的滤波开了之后，可以抵抗500ns的尖峰脉冲干扰。 CPU不仅可以请求自我进入i…

阅读更多...

代码随想录刷题记录 day43 股票买卖的最佳时机1 2

代码随想录刷题记录 day43 股票买卖的最佳时机1 2

代码随想录刷题记录 day43 股票买卖的最佳时机1 2 参考：代码随想录 121. 买卖股票的最佳时机思想 dp数组定义 dp[i][0]表示第i天持有股票手头的最大的现金数为dp[i][0] dp[i][1]表示第i天不持有股票手头的最大的现金数为dp[i][1] 递推公式 dp[i][0] dp[i-…

阅读更多...

2004-2020年全国31省环境规制强度

2004-2020年全国31省环境规制强度

2004-2020年全国各省环境规制强度 1、时间区间为2004-2020年 2、范围：包括全国31个省份 3、缺失情况：西藏存在部分年份缺失，其他省份无缺失 4、指标包括： 工业污染治理完成投资(万元)、第二产业增加值(亿元)、环境规制强度 …

阅读更多...

vue父子组件之间的传值，及互相调用父子组件之间的方法

vue父子组件之间的传值，及互相调用父子组件之间的方法

场景：记录下父子组件之间的传值方法，以及调用他们的内部的方法 *** 父组件给子组件传值是通过属性绑定的方法 *** 子组件给父组件传值是通过绑定对应的方法将自身的值传递给父组件当然，我这只是说了一种传参方式，也包含通过vuex的…

阅读更多...

Spring Boot基于FreeMarker发送模板邮件（带附件）

Spring Boot基于FreeMarker发送模板邮件（带附件）

目录一、背景二、maven依赖三、编码实现3.1、邮件对象3.2、服务层3.2.1、抄送人3.2.2、嵌入式资源3.2.3、附件3.3、邮件模板3.3.1、模板引擎3.4、配置文件四、测试4.1、发送简单邮件4.2、发送复杂邮件4.3、效果图一、背景邮件在工作中中经常被用到，场景非常的广泛&…

阅读更多...

高分子PEG：8Arm PEG-DBCO，八臂聚乙二醇环辛炔 MV1K 2K 3.4K 5K

高分子PEG：8Arm PEG-DBCO，八臂聚乙二醇环辛炔 MV1K 2K 3.4K 5K

【中文名称】八臂聚乙二醇环辛炔【英文名称】 8Arm PEG-DBCO，DBCO PEG 8Arm 【结构式】【CAS号】N/A 【分子量】1000，2000，3400，5000，10000，20000 【基团部分】DBCO 【纯度标准】95% 【包装规格】1g&…

阅读更多...

【Lilishop商城】No3-8.模块详细设计，订单模块-2（订单）的详细设计

【Lilishop商城】No3-8.模块详细设计，订单模块-2（订单）的详细设计

仅涉及后端，全部目录看顶部专栏，代码、文档、接口路径在： 【Lilishop商城】记录一下B2B2C商城系统学习笔记~_清晨敲代码的博客-CSDN博客全篇会结合业务介绍重点设计逻辑，其中重点包括接口类、业务类，具体的结合源代…

阅读更多...

ssm+Vue计算机毕业设计校园社团管理系统（程序+LW文档）

ssm+Vue计算机毕业设计校园社团管理系统（程序+LW文档）

ssmVue计算机毕业设计校园社团管理系统（程序LW文档） 项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技…

阅读更多...

Android入门第46天-使用BroadCast来模拟异地登录事件发生后的主动退出另一个设备重登录

Android入门第46天-使用BroadCast来模拟异地登录事件发生后的主动退出另一个设备重登录

简介随着对BroadCast的越来越深入，我们今天要实现一个稍微复杂一点的BroadCast。即我们常用来有时APP打开时如果多个设备同时登录一个帐号，而我们只允许一个设备登录一个帐号时，此时我们的APP会弹一个对话框如：您的账号在别处登…

阅读更多...

结合面试详细分析 HashMap 源码

结合面试详细分析 HashMap 源码

个人文档站点：小熊学Java 1、底层结构相信大家都已经听过很多了，这里就不多阐述了，至于什么时候是数组，什么时候会变成链表，后续会讲解，别急！ JDK版本数据结构JDK1.7数组链表JDK1.8数组 &…

阅读更多...

腾讯云数据万象：智能+存储双驱动，数倍提升内容生产效能

腾讯云数据万象：智能+存储双驱动，数倍提升内容生产效能

伴随数字经济市场稳步扩张， AI和富媒体融合的场景式体验、营销模式、分享渠道已经成为数字商业中不可或缺的部分。12月1日，在2022腾讯全球数字生态大会存储专场，腾讯云数据万象发布产品更新，与腾讯云对象存储COS共同打造智能存储生…

阅读更多...

[附源码]Nodejs计算机毕业设计基于JAVA语言的国货美妆店管理系统Express(程序+LW)

[附源码]Nodejs计算机毕业设计基于JAVA语言的国货美妆店管理系统Express(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置： Node.js Vscode Mysql5.7 HBuilderXNavicat11VueExpress。项目技术： Express框架 Node.js Vue 等等组成，B/S模式 Vscode管理前后端分…

阅读更多...

JavaScript-DOM操作表单

JavaScript-DOM操作表单

目录表单事件表单方法操作表单获取表单的值表单内容html checkbox的获取办法表单事件注意：onsubmit,onreset只能给表单添加表单.submit ;表单.onreset; form.onsubmitfunction(){alert(表单即将被提交);};form.onresetfunction(){alert(表单即将被重…

阅读更多...

ChatGPT：竟然精通ENVI IDL、ArcGIS等软件！

ChatGPT：竟然精通ENVI IDL、ArcGIS等软件！

目录 01 使用途径 02 使用 01 使用途径我试了很多网站，包括注册登录、插件、镜像网站，微信机器人，QQ机器人，但是目前这些或多或少都由于OpenAI的限制无法正常使用。所以总的来说需要科学上网并且需要国外手机号，这有…

阅读更多...

CCIE-重认证-300-410-补充题库-必须的哟

CCIE-重认证-300-410-补充题库-必须的哟

实验题 VRF router bgp 65000 bgp router-id x bgp log-neighbor-cha address-fa ipv4 vrf green red con neigh x remote-as 65000 neigh x act 重复red inter e0/0 ip vrf for red ip add x x 重复e0/1,for green inter e0/2.100 enc dot 100 ip vrf for red ip add x x …

阅读更多...

无工具情况下linux数据库命（postgresql）令行建表操作文档

无工具情况下linux数据库命（postgresql）令行建表操作文档

首先将帮助文档下的test.sql放在服务器的某个位置。sql文件如下图： /*Navicat Premium Data TransferSource Server : postgres-123Source Server Type : PostgreSQLSource Server Version : 100010Source Host : 192.168.3.123:5432Source C…

阅读更多...

完全开源的代码生成器之code-generator

完全开源的代码生成器之code-generator

什么是code-generator code-generator是一个低代码平台, 可以解决90%单表增删改查工作量, 你可以通过自定义代码模板来生成适合自己的代码。目前该系统主要针对的是语言是java, 数据源是mysql(其他数据库待测试)，数据源支持mysql, oracle, dm, PostgreSql等数据库…

阅读更多...

[附源码]计算机毕业设计的在线作业批改系统Springboot程序

[附源码]计算机毕业设计的在线作业批改系统Springboot程序

项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： Springboot mybatis MavenVue等等组成，B/S模式…

阅读更多...

Revit 中注释族的应用详解及公共族库工具

Revit 中注释族的应用详解及公共族库工具

一、Revit 中注释族的应用详解： 注释族是用来表示二维注释的族文件，它被广泛用于很多构件的二维视图表现。下面以一个实例来说明注释族的应用 1、注释族创建实例用“公制常规注释.rft”族样板创建一个注释族，在“族类别和族参数”对话框中选…

阅读更多...

推荐文章

最新文章