ICLR 2022—你不应该错过的 10 篇论文(上)

news2025/1/24 11:36:49

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 

 

ICLR 2023已经放榜,但是今天我们先来回顾一下去年的ICLR 2022!

        ICLR 2022将于2022年 4 月 25 日星期一至 4 月 29 日星期五在线举行(连续第三年!)。它是深度学习研究领域规模最大、最受欢迎的会议之一,它汇集了超过 1000 篇论文、19 个研讨会和 8 个特邀报告。主题涵盖 ML 理论、强化学习 (RL)、计算机视觉 (CV) )、自然语言处理 (NLP)、神经科学等等。如果我们想要对这一庞大的内容阵容有所了解,就必须进行挑选,我们根据现有信息,挑选出10篇最能激起我们兴趣的论文。事不宜迟,快来看看吧!

1. Autoregressive Diffusion Models

标题:自回归扩散模型

文章链接:https://openreview.net/forum?id=Lm8T39vLDTE

项目代码:https://github.com/google-research/google-research/tree/master/autoregressive_diffusion

作者的 TL;DR 

         一个新的离散变量模型类,包括阶不可知自回归模型和吸收离散扩散。扩散模型在过去一年中越来越受欢迎,并且逐渐被吸收到深度学习工具箱中。本文为这些模型提出了一个重要的概念创新。

关键见解 

        用术语来说,扩散模型通过在像素网格上迭代添加“可微噪声”来生成图像,最终成为真实图像。推理从对某种“白噪声”图像进行采样开始。这项工作建议做一个类似的过程,但不是应用扩散步骤同时迭代解码所有像素,而是一次自回归地解码几个像素,然后在其余过程中保持固定(见下图)。

        此外,与 DALL·E⁴ 等其他用于图像生成的自回归方法相比,该方法在解码图像时不需要特定的顺序。甚至,在给定整个图像解码步骤的固定预算的情况下,模型可以动态调整每个扩散步骤解码的像素数量!

        对于训练,类似 BERT 的去噪自动编码器自监督目标就足够了:给定图像,屏蔽一部分像素并预测其中一些像素的值。虽7结果并不惊天动地,但这在概念上是扩散模型的简单而有效的演变,允许它们解码输出自回归并应用于非从左到右的文本生成。如果您想更深入地研究本文,Yannic Kilcher 有一个非常棒的解说视频,强烈推荐!

2.Poisoning and Backdooring Contrastive Learning

标题:中毒和走后门的对比性学习

作者:Nicholas Carlini, Andreas Terzis

文章链接:https://openreview.net/forum?id=iC4UHbQ01Mp

作者的 TL;DR 

         我们认为中毒和后门攻击是对多模态对比分类器的严重威胁,因为它们明确设计用于在来自 Internet 的未经整理的数据集上进行训练。使用从网络上抓取的数据进行大规模自监督预训练是训练大型神经网络的基本要素之一。对于来自 OpenAI 的著名 CLIP²,来自网络的嘈杂的未经整理的图像文本对用于训练。会出什么问题?

关键见解 

        本文探讨了对手如何毒害像 CLIP 这样的模型的训练数据的一小部分——使用来自网络的图像文本对的对比学习进行训练——这样模型就会对测试图像进行错误分类。他们尝试了两种方法:

        1.有针对性的中毒:通过添加中毒样本来修改训练数据集,目的是让最终模型对带有错误特定标签的特定图像进行错误分类。根据结果,这可以通过仅毒化 0.0001% 的训练数据集来持续实现,例如将 3 个图像对添加到包含 300 万个实例的数据集中。

        2.后门攻击:这种方法不是具有特定的目标图像,而是旨在在任何图像上覆盖一小块像素,这样这将被错误分类为所需的错误标签。这种更具野心的攻击可以通过中毒 0.01% 的训练数据集来持续实施,例如从 300 万个实例数据集中毒化了 300 张图像。

任何人都可以操纵公共互联网数据,这使得这些攻击成为可能。这是在开发和部署模型时应考虑使用未经整理的数据训练模型的新弱点。

3.Bootstrapped Meta-Learning

标题:自举元学习

作者:Sebastian Flennerhag, Yannick Schroecker, Tom Zahavy, Hado van Hasselt, David Silver, Satinder Singh

文章链接:https://openreview.net/forum?id=b-ny3x071E5

作者的 TL;DR 

         我们提出了一种带有梯度的元学习算法,该算法从自身或其他更新规则中引导元学习器。许多强化学习算法对超参数的选择非常敏感。元学习是一种很有前途的学习范式,用于改进学习者的学习规则(包括超参数),使学习更快、更稳健。

关键见解 

        在元学习中,学习者配备了一个外部优化循环,可以优化内部优化的“学习规则”,直接优化学习目标(例如通过梯度下降)。用非常简单的术语来说,现有的元学习算法通常依赖于学习者的表现来评估学习规则:让学习者运行 k 步,如果学习提高了就做更多,如果学习变得更糟,就做更少.直接使用学习者目标的问题在于,元学习优化将 (1) 被限制在与学习目标函数相同的几何形状上,并且 (2) 优化将是近视的,因为它只会针对以下范围进行优化k 步,而超出此范围的学习动态可能要复杂得多。

        坦率地说,这个过程的理论细节超出了我的理解范围,但其要点是元学习器首先被要求预测学习器在评估的 k 步之外的表现,然后根据预测进行优化;换句话说,元学习器生成自己的优化目标。这使元学习者能够针对更长的时间范围进行优化,而无需实际评估计算量大的如此长的时间范围。

        作者证明了这种方法的一些很好的理论特性,并且实证结果在 ATARI ALE 基准 1 上实现了最新的技术水平 (SOTA),并提高了多任务学习的效率。

4.Equivariant Subgraph Aggregation Networks

标题:等变子图聚合网络

作者:Beatrice Bevilacqua、Fabrizio Frasca、Derek Lim、Balasubramaniam Srinivasan、Chen Cai、Gopinath Balamurugan、Michael M. Bronstein、Haggai Maron

文章链接:https://openreview.net/forum?id=dFbKQaRk15w

作者的 TL;DR 

          我们提出了一个可证明的表达图学习框架,该框架基于将图表示为子图的多集并使用等变架构处理它们。消息传递神经网络 (MPNN) 在图上的有限表现力——属于图神经网络 (GNN) 的范畴——是阻碍 GNN 研究人员晚上睡个好觉的基本问题之一。

关键见解 

        你怎么知道两个图是否相同?你可能认为只看它们就足够了,但你错了。同一个图可以通过重组或允许节点的顺序以不同的方式表示,这样给定两个图就很难确定它们是否相同,即同构。

        Weisfeiler-Leman (WL) 测试是一种算法,它根据图的直接邻域递归地对图的节点进行分类。如果在所有这些过程之后,两个图的节点具有“不同的分类”,这意味着测试失败,这意味着两个图是不同的(非同构)。另一方面,如果两个图在 WL 测试后“仍然相同”,则它们可能是同构的,但不能保证!WL 测试无法区分某些图形结构。

        MPNNs GNNs 可以理解为 WL 测试的可微模拟,这就是为什么 MPNNs 继承了 WL 测试的表达力限制:它们无法区分某些图子结构。更进一步,根据 MPNN 如何聚合来自其邻居的信息,它们的表达能力甚至可能低于 WL 测试!

        这项工作建立了所有这些联系,并提出了一种最大化 MPNN 表达能力的方法,该方法包括将图分解为子图袋并将 MPNN 应用于这些子图袋。

5.Perceiver IO: A General Architecture for Structured Inputs & Outputs

标题:感知器 IO:结构化输入和输出的通用架构

作者:Andrew Jaegle, Sebastian Borgeaud, Jean-Baptiste Alayrac, Carl Doersch, Catalin Ionescu, David Ding, Skanda Koppula, Daniel Zoran, Andrew Brock, Evan Shelhamer, Olivier J Henaff, Matthew Botvinick, Andrew Zisserman, Oriol Vinyals, Joao Carreira

文章链接:https://openreview.net/forum?id=fILj7WpI-g

作者的 TL;DR 

          我们提出了 Perceiver IO,这是一种通用架构,可处理来自任意设置的数据,同时随输入和输出的大小线性缩放。通过对数据做出尽可能少的假设来建模数据很有趣,因为它有可能很好地转移到不同的模式。

关键见解 

        这项工作遵循与原始 Perceiver³ 相似的路线,通过使用灵活的查询机制对其进行扩充,该机制使模型具有任意大小的输出,而不是在模型末尾需要特定于任务的架构。支持各种大小和语义的输出,消除了对特定任务架构工程的需求。通过查看下图可以理解模型的概述:输入可以是任意长的嵌入序列,这些序列被映射到潜在数组编码中。这个过程允许对非常长的输入序列进行建模,假设潜在数组大小是固定的,当输入变得非常长时,二次复杂度不会爆炸。在这个“编码步骤”之后,模型应用了由自注意力层和前馈层组合组成的公共 L 变换器块。最后,解码步骤采用输出查询数组并将其与输入的潜在表示相结合以生成所需维度的输出数组。

        许多现有的学习技术,例如 Masked Language Modeling 或对比学习,也可以应用于此架构。遵循针对每种模态进行训练的常见现有方法,该模型在 NLP 和视觉理解、多任务和多模态推理以及光流方面产生了很好的结果。该死,他们甚至将其插入 AlphaStar(取代现有的 Transformer 模块),在具有挑战性的星际争霸 II 游戏中取得了强劲的成绩!

更多Ai资讯:公主号AiCharm
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/346573.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

1.8配置OSPF特殊区域

1.4.3实验8:配置OSPF特殊区域 实验目的实现OSPF Stub区域的配置实现OSPF NSSA区域的配置描述Type-7 LSA的内容描述Type-7 LSA与Type-5 LSA之间的转换过程实验拓扑配置OSPF特殊区域实验拓扑如图1-18的所示:[1] 图1-18 配置OSPF特殊区域 实验步骤 配置I…

有趣的HTML实例(十一) 烟花特效(css+js)

为什么今天不做炒土豆丝呢,为什么呢为什么呢为什么呢为什么呢,坚持问上一个时辰,一般来说,第二天我们的饭桌上就会出现炒土豆丝。这件事告诉了我们求知欲的重要性,知之才幸福,不知不幸福。 ——《华胥引》 …

ch4_1存储器

1. 存储器的类型 1.1 按照存储介质来分类 半导体存储器: TTL, MOS 易失性 磁表面存储器: 磁头, 载磁体; 磁芯存储器: 硬磁材料, 环状元件 光盘存储器: 激光, 磁光材料; 1.2 按…

【SSL/TLS】准备工作:证书格式

证书格式1. 格式说明1.1 文件编码格式1.2 文件后缀格式2. xca导出格式1. 格式说明 1.1 文件编码格式 1. PEM格式: 使用Base 64 ASCII进行编码的纯文本格式。后缀为“.pem”, ".cer", ".crt", ".key" 2. DER格式 二进制编码格式,文件…

Day889.MySQL高可用 -MySQL实战

MySQL高可用 Hi,我是阿昌,今天学习记录的是关于MySQL高可用的内容。 正常情况下,只要主库执行更新生成的所有 binlog,都可以传到备库并被正确地执行,备库就能达到跟主库一致的状态,这就是最终一致性。但是…

喜茶、奈雪的茶“花式”寻生路

配图来自Canva可画 疫情全面开放不少人“阳了又阳”,电解质饮品成为热销品,梨子、橘子、柠檬等水果被卖断货,凉茶、黄桃罐头被抢购一空,喜茶的“多肉大橘”、奈雪的“霸气银耳炖梨”、蜜雪冰城的“棒打鲜橙”、沪上阿姨的“鲜炖整…

深度学习网络模型——RepVGG网络详解

深度学习网络模型——RepVGG网络详解0 前言1 RepVGG Block详解2 结构重参数化2.1 融合Conv2d和BN2.2 Conv2dBN融合实验(Pytorch)2.3 将1x1卷积转换成3x3卷积2.4 将BN转换成3x3卷积2.5 多分支融合2.6 结构重参数化实验(Pytorch)3 模型配置论文名称: RepVGG: Making V…

Java实现定时发送邮件

特别说明&#xff1a;邮件所采用的均为QQ邮件 一、邮箱准备 作为发送方&#xff0c;需要开启相关服务。 首先打开邮箱&#xff0c;然后选择设置&#xff0c;再选择账户 开启以下服务 我们可以在这里获取邮箱的授权码。 二、项目准备 2.1、依赖引入 <dependencies>…

二分法-蓝桥杯

一、二分法引入-猜数游戏二分法:折半搜索。二分的效率:很高&#xff0c;O(logn)例如猜数游戏&#xff0c;若n1000万&#xff0c;只需要猜log10 7 24次猜数游戏的代码&#xff1a;bin_search------>二分搜索把一个长度为n的有序序列上O(n)的查找时间&#xff0c;优化到了O(lo…

【java】Spring Boot --Spring Boot 集成 MyBatis

文章目录1. 前言2. 实例场景3. 数据库模块实现4. Spring Boot 后端实现4.1 使用 Spring Initializr 创建项目4.2 引入项目依赖4.3 数据源配置4.4 开发数据对象类4.5 开发数据访问层4.6 添加 MyBatis 映射文件5. 测试6. 小结1. 前言 企业级应用数据持久层框架&#xff0c;最常见…

【项目】Vue3+TS CMS 基本搭建相关配置

&#x1f4ad;&#x1f4ad; ✨&#xff1a;Vue3 TS   &#x1f49f;&#xff1a;东非不开森的主页   &#x1f49c;: today beginning&#x1f49c;&#x1f49c;   &#x1f338;: 如有错误或不足之处&#xff0c;希望可以指正&#xff0c;非常感谢&#x1f609;   基本…

2023爱分析 · 数据科学与机器学习平台厂商全景报告 | 爱分析报告

报告编委 黄勇 爱分析合伙人&首席分析师 孟晨静 爱分析分析师 目录 1. 研究范围定义 2. 厂商全景地图 3. 市场分析与厂商评估 4. 入选厂商列表 1. 研究范围定义 研究范围 经济新常态下&#xff0c;如何对海量数据进行分析挖掘以支撑敏捷决策、适应市场的快…

Milvus 新版本来啦!首席工程师带你划重点:安全、稳定、升级友好

Milvus 又又又又出新版本了&#xff01;Milvus 2.2.3 版本是 2.2 系列的小版本升级&#xff0c;尽管是小版本的更新&#xff0c;但是依然干货满满&#xff1a;首先是带来了社区中呼声很高的 coordinator 节点的高可用能力&#xff1b;其次还新增了不停机滚动升级的功能&#xf…

第八章:DNS解析服务器搭建

今天先讲一下DNS的简单配置。 Windows server DNS&#xff1a; 点击工具选择DNS 右击正向查找区域&#xff0c;然后选择新建&#xff0c;如果是根域就可以勾AD储存&#xff0c;不是的话就别勾 名字可以随便 最后点击完成&#xff0c;这是正向解析 右击反向查找区域&#xff0c…

面试浅谈之十大排序算法

面试浅谈之十大排序算法 HELLO&#xff0c;各位博友好&#xff0c;我是阿呆 &#x1f648;&#x1f648;&#x1f648; 这里是面试浅谈系列&#xff0c;收录在专栏面试中 &#x1f61c;&#x1f61c;&#x1f61c; 本系列将记录一些阿呆个人整理的面试题 &#x1f3c3;&…

【QA】[vue/element-ui] 日期输入框的表单验证问题

引入&#xff1a;element-ui的表单验证是使用rules来定义规则&#xff0c;其中日期类型的表单输入框如图所示&#xff0c;一般会使用 format 来设置自己需要的日期格式&#xff1a; <el-form-item label"生日" prop"birthday"><el-col :span&quo…

Java高手速成 | 图说重定向与转发

我们先回顾一下Servlet的工作原理&#xff0c;Servlet的工作原理跟小猪同学食堂就餐的过程很类似。小猪同学点了烤鸡腿&#xff08;要奥尔良风味的&#xff09;&#xff0c;食堂窗口的服务员记下了菜单&#xff0c;想了想后厨的所有厨师&#xff0c;然后将菜单和餐盘交给专门制…

RabbitMQ运行机制

消息的TTL&#xff08;Time To Live&#xff09; 消息的TTL就是消息的存活时间。 • RabbitMQ可以对队列和消息分别设置TTL。 • 对队列设置就是队列没有消费者连着的保留时间&#xff0c;也可以对每一个单独的消息做单独的 设置。超过了这个时间&#xff0c;我们认为这个消息…

什么是溶血症?什么是ABO溶血?溶血检查些什么?

什么是溶血症&#xff0c;什么是ABO溶血&#xff1f;女人是O型血&#xff0c;男人是其他血型的夫妻配对&#xff0c;最担心的是胎儿溶血症。从理论上讲&#xff0c;只要夫妻双方血型不同&#xff0c;母亲一定缺乏胎儿从父亲那里遗传的抗原。当任何人接触到他们缺乏的抗原时&…

Vue+node.js火车票订票系统vscode开发的

该系统的基本功能包括管理员、用户二个角色功能模块。 对于管理员可以使用的功能模块主要有&#xff0c;首页、个人中心&#xff0c;用户管理、系统公告管理、车次管理、车票信息管理、订票信息管理、系统管理等功能。 对于用户所使用的功能模块的操作主要是首页、个人中心、订…