[l论文解析]Classifier-Free Diffusion Guidance

news2025/1/20 10:55:01

在这里插入图片描述

paper link:https://openreview.net/pdf?id=qw8AKxfYbI

文章目录

  • Overview
    • What problem is addressed in the paper?
    • What is the key to the solution?
    • What is the main contribution?
    • Potential fundamental flaws; how this work can be improved?
  • Content
    • 关于 classifier guidance :
    • classifier-free guidance
    • 背景
    • Guidance
      • classifier guidance
      • classifier-free guidance
    • Experiments
    • Discussion
    • Conclusion

Overview

What problem is addressed in the paper?

It also raises the question of whether guidance can be performed without a classifier: in what we call classifier-free guidance

What is the key to the solution?

we jointly train a conditional and an unconditional diffusion model, and we combine the resulting conditional and unconditional score estimates to attain a trade-off between sample quality and diversity similar to that obtained using classifier guidance

What is the main contribution?

We have presented classifier-free guidance, a method to increase sample quality while decreasing sample diversity in diffusion models.

Potential fundamental flaws; how this work can be improved?

  • A potential disadvantage of classifier-free guidance is sampling speed.
  • The necessity to run multiple passes of the diffusion model might be mitigated by changing the architecture to inject conditioning late in the network, but we leave this exploration for future work.
  • It would be an interesting avenue of future work to try to boost sample quality while maintaining sample diversity.

Content

在这里插入图片描述

关于 classifier guidance :

Classifier guidance is a recently introduced method to trade off mode coverage and sample fidelity in conditional diffusion models post training, in the same spirit as low temperature sampling or truncation in other types of generative models.

classifier guidance的不足:

  • Classifier guidance combines the score estimate of a diffusion model with the gradient of an image classifier and thereby requires training an image classifier separate from the diffusion model.
  • It also raises the question of whether guidance can be performed without a classifier.
  • classifier-guided diffusion sampling can be interpreted as attempting to confuse an image classifier with a gradient-based adversarial attack.

classifier-free guidance

  • our guidance method which avoids any classifier entirely. Rather than sampling in the direction of the gradient of an image classifier, classifier-free guidance instead mixes the score estimates of a conditional diffusion model and a jointly trained unconditional diffusion model.

取得的结果:
Our classifier-free guidance results demonstrate that pure generative diffusion models are capable of synthesizing extremely high fidelity samples possible with other types of generative models.

背景

forward process:在这里插入图片描述

在这里插入图片描述
forward process runs in the direction of decreasing λ。
reverse process start from 在这里插入图片描述
在这里插入图片描述我们根据预测的噪音参数化 x θ x_{\theta} xθ.
在这里插入图片描述
训练的目标函数是:
在这里插入图片描述

在conditional generative建模的情况下,数据x与条件信息c(即用于类条件图像生成的类标签)一起绘制。对模型的唯一修改是逆过程函数逼近器接收c作为输入,在这里插入图片描述

Guidance

在反向过程中缩放模型分数或降低高斯噪声的方差会导致扩散模型生成模糊的低质量样本

classifier guidance

(这个概念的主要工作是Diffusion models beat GANs on image synthesis,简称beat-gan)
其中diffusion score 在这里插入图片描述被修改如下:在这里插入图片描述其中w是控制分类器引导强度的参数。
由此,在采样过程中的分布近似为:
在这里插入图片描述
其效果是对分类器在这里插入图片描述所针对的数据的概率进行加权。 beat-gan发现,通过设定w>0, 他们可以提高其扩散模型的Inception score,但代价是样本的多样性降低。

figure2: guidance对三个高斯混合体的影响
在这里插入图片描述

  • 每个混合体成分代表一个类的条件数据。最左边的图是non-guided边缘密度。从左到右是归一化guided conditionals的混合密度,guidance strength增加。 随着引导强度的增加,每个条件质量都将概率质量放置在远离其他类别的位置,并朝向Logistic回归给出的高置信度方向,并且大多数质量变得集中在较小的区域。这种行为可以被看作是在ImageNet模型中增加分类器指导强度时发生的Inception score增加和样本多样性减少的简化表现。

将权重w+1的分类器指导应用于无条件模型理论上将导致与将权重w的分类器指导应用于条件模型相同的结果, 因为:在这里插入图片描述,就分数而言:在这里插入图片描述

classifier-free guidance

Classifier-free guidance is an alternative method of modifying θ (zλ, c) to have the same effect as classifier guidance, but without a classifier.

算法1和算法2详细描述了classifier-free guidance下的训练和采样
在这里插入图片描述
在这里插入图片描述

我们使用单个神经网络来参数化这两个模型,对于无条件模型,我们可以在预测分数时简单地为类标识符 c 输入空标记 ∅,也就是说在这里插入图片描述。我们联合训练unconditional 和conditional models 以一定的概率将 c 随机设置为无条件类标识符 ∅。

然后,我们使用以下条件分数估计和无条件分数估计的线性组合来执行采样。
在这里插入图片描述公式6不存在分类器梯度。

we show empirically that classifier-free guidance is able to trade off FID and IS in the same way as classifier guidance.

Experiments

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

实验结论:

  • 在这里,我们通过实验验证了本文的主要主张:无分类器指导能够以分类器引导或 GAN 截断等方式权衡 IS 和 FID。
  • 增加无分类器引导强度具有减少样本种类(FID)和增加单个样本保真度的预期效果(IS)。
  • 为了产生对样本质量有效的无分类器引导分数,扩散模型中只有相对较小的模型容量需要用于无条件生成任务。

Discussion

我们的无分类器指导方法最实用的优点是它的极端简单:它只需要在训练期间更改一行代码—随机去掉条件—以及在抽样期间—混合条件和无条件的分数估计。相比之下,分类器指导使训练管道复杂化,因为它需要训练额外的分类器。这个分类器必须在有噪声的zλ上训练,所以不可能插入一个标准的预先训练的分类器。

我们还得出了一个关于指导如何工作的直观解释:它减少了样本的无条件可能性,同时增加了条件可能性。无分类器指导通过减少带有负分值项的无条件可能性来实现这一点,据我们所知,该分值项尚未被探索,可能会在其他应用中找到用途。

无分类器制导的一个潜在缺点是采样速度。一般来说,分类器可以比生成模型更小、更快,所以分类器引导的采样可能比无分类器引导的采样更快,因为后者需要运行扩散模型的两个前向传递,一个用于条件评分,另一个用于无条件评分。通过改变架构,在网络后期注入条件反射,可能会减轻对扩散模型进行多次传递的必要性,但我们把这个探索留给未来的工作。

最后,任何以牺牲多样性为代价来提高样本保真度的guidance方法都必须面对减少多样性是否可接受的问题。 在已部署的模型中可能会有负面影响,因为在某些数据部分在其他数据上下文中没有得到充分表示的应用程序中,样本多样性对于维护应用程序非常重要。在保持样本多样性的同时,提高样本质量将是未来工作的一个有趣途径。

Conclusion

在扩散模型中,我们提出了一种既能提高样本质量又能减少样本多样性的无分类器引导方法。无分类器指导可以被认为是没有分类器的分类器指导,我们的无分类器指导的有效性证实了**纯生成扩散模型能够最大化基于分类器的样本质量度量,同时完全避免分类器梯度。**我们期待在更广泛的环境和数据模式中进一步探索无分类器指导。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/84628.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java 字符串 split 的一个反直觉陷阱

最近生产环境遇到一个奇怪的数组下标越界报错,如下图代码所示,我们可以肯定的是 fieldName 变量不为空(不是空字符串,也不是 null),但是代码执行到读取 names[0] 变量的时候,抛出了一个 数组下标…

5G无线技术基础自学系列 | 抗衰落技术

素材来源:《5G无线网络规划与优化》 一边学习一边整理内容,并与大家分享,侵权即删,谢谢支持! 附上汇总贴:5G无线技术基础自学系列 | 汇总_COCOgsta的博客-CSDN博客 无线信道是随机时变信道,信…

【云计算与大数据技术】文件存储格式行式、列式、GFS、HDFS的讲解(图文解释 超详细)

一、分布式文件系统 文件系统最后都需要以一定的格式存储数据文件,常见的文件存储布局有行式存储、列式存储以及混合式存储三种,不同的类别各有其优缺点和适用的场景,在目前的大数据分析系统中,列式存储和混合式存储方案因其特殊…

mysql 数据库设计三大范式

1. 什么是设计范式 设计表的依据,按照范式设计出来的表,不会出现数据的冗余 数据库的设计范式是数据库设计所需要满足的规范,满足这些规范的数据库是简洁的、结构清晰的;反之则是乱七八糟,不仅会给开发人员制造麻烦&a…

大数据面试之Hive常见题目

大数据面试之Hive常见题目 1. Hive的架构 1、重点四个器:解释器(SQL Parser)、Driver:编译器(Compiler),优化器(Optimizer),执行器(Executor&…

基于Python+Django的在线学习交流平台

在各学校的教学过程中,直播授课管理是一项非常重要的事情。随着计算机多媒体技术的发展和网络的普及,“基于网络的学习模式”正悄无声息的改变着传统的直播学习模式,“基于网络的直播教学平台”的研究和设计也成为教育技术领域的热点课题。采…

BEPUphysicsint定点数3D物理引擎介绍

帧同步的游戏中如果用物理引擎,为了保证不同设备上的结果一致,需要采用定点数来计算迭代游戏过程中的物理运算。也就是我们通常说的定点数物理引擎(确定性物理引擎)。本系列教程给大家详细的讲解如何在你的项目中内置一个确定性物理引擎。确定性物理引擎我们使用git…

es入门(中)

目录 6.Java api 实现es中的文档管理(增删改) 6.1 java 客户端简单获取数据 6.2结合spring-boot测试文档查询 配置环境 配置类 测试代码结构 简单的查询 对查询的请求设置参数 异步查询 6.4 结合spring-boot测试文档新增 6.5结合spring-boot…

C语言的预处理器无法先展开宏再拼接符号?可以!

背景 最近接到一个需求,要实现一个脚本,能提取.h文件里定义的所有全局变量的值,这些全局变量都是结构体变量,名字是结构体类型名加场景后缀——每个.h对应的场景都是唯一的,所以.h内所有变量名的后缀一致。 我的解决…

线段树详解(包含加法线段树、乘法线段树及区间根号线段树,简单易懂)

同步发表于洛谷梦回江南 这一篇文章我们将对线段树中的常规操作进行详细的讨论。 以下所提到的复杂度如无特殊说明均为时间复杂度。log⁡\loglog 的底数均为 222。 不开 long long 见祖宗! 文章目录第一部 普通线段树一、引入二、优化方案三、懒标记(l…

[附源码]Python计算机毕业设计电影网站系统Django(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等…

什么是编程的设计模式,史上最全面Java设计模式总结,看完再也不会忘记

文章目录**9.1 工厂方法模式与抽象工厂模式对比#****9.2 简单工厂模式与单例模式对比#****9.3 简单工厂模式与建造者模式对比#****10.1 装饰器模式与代理模式对比#****10.2 装饰器模式与门面模式对比#****10.3 装饰器模式与适配器模式对比#****10.4 适配器模式与代理模式…

人事管理系统--低代码课程的教学实验/实训教学 (①招聘管理)

人事管理系统是信息系统课程中最为常见的教学场景,对于非计算机专业的学生来说,如何使用低代码,甚至是零代码的方式搭建该系统呢?简道云「人事OA管理」应用包含招聘管理、人员入离职管理、考勤管理、会议室预约、物资进销存管理等…

#3文献学习总结--边缘计算资源分配与任务调度优化

文献:“边缘计算资源分配与任务调度优化综述 ” 1、系统模型“云-边-端” 第 1 层是物联网层,传感器、处理器根据应用需求感知、测量和收集原始数据,在本地处理大量数据或将其上传至计算节点。 第 2 层是边缘计算层,位于互联网边…

rollup打包vue组件

rollup安装与使用 npm i rollup -g # 全局安装 npm i rollup -D # 项目本地安装rollup配置 import vue from rollup-plugin-vue import typescript from rollup-plugin-typescript2 import postcss from rollup-plugin-postcss; import cssnano from cssnano i…

2022华为全球校园AI算法精英赛:季军方案!

Datawhale干货 作者:鲤鱼,西安交通大学,人工智能学院笔者鲤鱼,是西安交通大学人工智能学院的一名研究生,在2022华为全球校园AI算法精英赛的赛道二取得了季军的成绩。初赛阶段一直名列A榜的榜首,复赛前几天也…

zabbix6.0安装教程(二):Zabbix6.0安装最佳实践

zabbix6.0安装教程(二):Zabbix6.0安装最佳实践 目录概述一、Access control1.Zabbix agent 的安全用户2.UTF-8 编码二、Zabbix Security Advisories and CVE database1.为 Zabbix 前端设置 SSL三、Web server hardening1.在 URL 的根目录上启…

[附源码]Python计算机毕业设计SSM基于的开放式实验室预约系统(程序+LW)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

人家这才叫软件测试工程师,你那只是混口饭吃

前些天和大学室友小聚了一下,喝酒喝大发了,谈天谈地谈人生理想,也谈到了我们各自的发展,感触颇多。曾经找工作我迷茫过、徘徊不,毕业那会我屡屡面试失败,处处碰壁;工作两年后我一度想要升职加薪…

[附源码]Python计算机毕业设计SSM基于的二手车商城(程序+LW)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…