Adversarial Diffusion Distillation

news2024/11/14 19:45:35
  • sd turbo
  • https://static1.squarespace.com/static/6213c340453c3f502425776e/t/65663480a92fba51d0e1023f/1701197769659/adversarial_diffusion_distillation.pdf#page=5.83
  • https://github.com/Stability-AI/generative-models
  1. 问题引入
  • 1-4 steps fast diffusion model sampling;
  • 提出了adversarial diffusion distillation(ADD)方法来减少inference时候的step数,使用score distillation+adversarial loss来实现,效果比gan以及lcm要好,整体的;
  • 其中adversarial loss是用来使模型直接生成lie on the manifold of real images的sample结果,避免其他distiallation操作常见的模糊和artifact;
  • 在推理的时候,该方法不使用CFG,进一步降低了显存需求;
  • 之前的progressive distilltion和guidance distillation可以减少采样steps,但是生成效果会变差,还有lcm的方法可以降低采样step;这些方法存在一个统一的问题就是采样结果模糊或者存在artifact,还有gan的方法;
  • 之前有一些工作使用Score Distillation Sampling或者adversarial training来进行训练,本文结合使用两种方法来实现减少采样步骤并且保持采样效果的目的;
  1. methods
    在这里插入图片描述
  • 包含三个模型,ADD-student模型( θ \theta θ),参数使用预训练模型进行初始化,discriminator模型( ϕ \phi ϕ)以及DM-teacher模型( ψ \psi ψ),一个加噪的 x s = α s x 0 + σ s ϵ x_s=\alpha_sx_0 + \sigma_s\epsilon xs=αsx0+σsϵ,ADD-student生成 x θ ^ ( x s , s ) \hat{x_\theta}(x_s,s) xθ^(xs,s),定义 T s t u d e n t = { τ 1 , ⋯   , τ n } T_{student}=\{\tau_1,\cdots,\tau_n\} Tstudent={τ1,,τn},包含 N = 4 N=4 N=4个steps,其中 τ n = 1000 \tau_n=1000 τn=1000, s s s从其中进行采样;
  • 对应adversarial loss,生成的 x θ ^ \hat{x_\theta} xθ^ x 0 x_0 x0送到discriminator中,discriminator模型由冻结参数的feature network F F F和可训练的head D ϕ , k D_{\phi,k} Dϕ,k组成,其中head的输入是 F k F_k Fk k k k表示层数,训练的损失函数是hinge loss,对于ADD-student损失函数在这里插入图片描述
    对于discriminator的损失函数在这里插入图片描述
  • 对应distillation loss,生成的 x θ ^ \hat{x_\theta} xθ^会进一步加入噪声得到 x ^ θ , t \hat{x}_{\theta,t} x^θ,t,之后teacher模型进行denoising得到 x ^ ψ ( x ^ θ , t , t ) \hat{x}_\psi(\hat{x}_{\theta,t},t) x^ψ(x^θ,t,t),损失函数在这里插入图片描述
    其中 s g sg sg是stop-gradient operation, d d d表示距离的度量;
  • 总的噪声是两部分噪声的加权和,该方法在使用到ldm模型上面的时候可以在pixel或者latent空间计算distillation loss,但是本文在pixel空间,因为得到的结果更加稳定;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2071512.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软件测试最全面试题,了解一下

一、前言 近期有不少同学,朋友问我什么是软件测试,它是干什么的,我适不适合做、这行发展前景、工资怎么样等等等…在这里我把问题总结一下,整理一篇文章出来。 我也看过很多贴吧、论坛,在入行之前对这块都是迷茫的&a…

os 虚拟内存

虚拟内存不仅能隔离进程,还能提高内存利用率,请解释虚拟内存如何提高内存利用率??? 虚拟内存(Virtual Memory)通过以下几个机制来提高内存利用率: 1. 内存分页(Paging&…

20240824给飞凌OK3588-C的核心板刷Ubuntu22.04并安装iperf3测试网速

20240824给飞凌OK3588-C的核心板刷Ubuntu22.04并安装iperf3测试网速 2024/8/24 9:24 缘起,通过千兆交换机接入外网,开机之后发现以太网异常,多上电几次就会发现以太网也能用。 缘由:由于自制的飞凌的OK3588-C的核心板的底板对空间…

五子棋理解C++思想

双人五子棋项目目录: class Game { public:Game();void init();bool waitPlayerPutChess(Player* player, int& oldi, int& oldj);void draw();void play();bool isOver(int playerId);public:int whoWin -1; // 谁赢了(0:白棋&a…

【题解】【模拟】—— [CSP-J 2023] 一元二次方程

【题解】【模拟】—— [CSP-J 2023] 一元二次方程 [CSP-J 2023] 一元二次方程题目背景题目描述输入格式输出格式输入输出样例输入 #1输出 #1 提示 1.题意解析2.AC代码 [CSP-J 2023] 一元二次方程 戳我查看题目(洛谷) 题目背景 众所周知,对…

共享文件操作记录如何查看?这种方法帮你轻松实现

查看共享文件操作记录,可以通过以下几种方法实现: 一、利用操作系统的文件访问记录功能 在Windows操作系统中,可以利用“事件查看器”来查看共享文件的访问记录。事件查看器是Windows内置的一个工具,用于记录系统中发生的各种事…

50个必知的ChatGPT学术论文指令:提升研究效率,强烈推荐收藏!

随着AI技术的发展,AI已经成为学术创作的强大工具。如果你还不了解如何利用AI润色你的论文,那么这篇文章将为你提供极大的帮助。我们精心整理了50个顶级ChatGPT学术论文指令,强烈建议你加以利用! 这些指令非常实用,能显…

线性表的顺序表示—插入操作

线性表的顺序表示—插入操作 插入代码 #include <stdio.h> #include <stdlib.h> #include <stdbool.h> #define InitSize 15 // 初始化扩容长度 #define MaxSize 100typedef struct {int data[MaxSize]; // 申请空间&#xff08;静态&#xff09;int lengt…

探索ISP自动曝光技术:工作原理与应用(一)

在现代数码相机和智能手机中&#xff0c;图像信号处理器&#xff08;ISP&#xff09;是负责将传感器捕捉到的原始数据转换成高质量图像的重要组件。而在ISP的众多功能中&#xff0c;自动曝光&#xff08;Auto Exposure, AE&#xff09;是确保拍摄出清晰、明亮且细节丰富照片的关…

QT Quick QML 实例之定制 TableView

QT Quick QML 实例之定制 TableView 一、演示二、C关键步骤1. beginInsertRows()&#xff08;用户插入行&#xff09;2. roleNames() &#xff08;表格中列映射&#xff09;3. data() &#xff08;用户获取数据&#xff09;4. headerData() &#xff08;表头&#xff09;5. fla…

20240824给飞凌OK3588-C的核心板刷Ubuntu22.04后适配SONY索尼的HDMI OUT的机芯8530

20240824给飞凌OK3588-C的核心板刷Ubuntu22.04后适配SONY索尼的HDMI OUT的机芯8530 2024/8/24 16:33 echo 8 > /sys/class/gpio/export echo out > /sys/class/gpio/gpio8/direction echo 1 > /sys/class/gpio/gpio8/value 1、HDMI IN 4K 2024/7/25 18:01 v4l2-ctl -…

文件—python

一、文件编码 对于同一份文件&#xff0c;人的视角和计算机的视角是不相同的&#xff0c;人看到的是文字&#xff0c;计算机看到的0和1组成的编码。因为计算机只能识别0和1&#xff0c;无法直接识别文字&#xff0c;那我们是如何在电脑上看到文字的呢&#xff1f; 计算机按照一…

C++的动态数组vector番外之capacity

今日诗词&#xff1a; 爱他明月好&#xff0c;憔悴也相关。 西风多少恨&#xff0c;吹不散眉弯。 ——《临江仙寒柳》【清】纳兰容若 目录 引言 正文 string中的和vector中的capacity有什么区别 vector扩容时内存分配的策略是什么&#xff1f; capacity在vector中的表现如…

基于无人机边沿相关 ------- IBUS、SBUS协议和PPM信号

文章目录 一、IBUS协议二、SBUS协议三、PPM信号 一、IBUS协议 IBUS&#xff08;Intelligent Bus&#xff09;是一种用于电子设备之间通信的协议&#xff0c;采用串行通信方式&#xff0c;允许多设备通过单一数据线通信&#xff0c;较低延迟&#xff0c;支持多主机和从机结构&a…

redis | Django小项目之Mysql数据库和Redis缓存的应用

Django小项目 需求整体架构图技术细节环境配置各文件配置settings.pyurls.pyviews.pyuser_update.html 结果相关代码补充r.hgetall(cacahe_key)new_data {k.decode():v.decode() for k,v in data.items()} 需求 整体架构图 技术细节 环境配置 django-admin startprojrct rmysi…

WIFI 应用层代码

1.0 定义枚举类型 typedef enum {WIFI_COMM_WAIT, // AT 等待命令WIFI_COMM_OK, // AT 命令完成WIFI_COMM_FALL, // AT 命令失败 }WifiCommState_t; 注&#xff1a;该枚举类型的作用是&#xff0c;定义三个成员变量&#xff0c;分别表示AT指令等待发送&#xff0c;AT指令…

unity游戏开发——(细)深入解析 Unity 地形系统:从基础到高级应用

Unity游戏开发 “好读书&#xff0c;不求甚解&#xff1b;每有会意&#xff0c;便欣然忘食。” 本文目录&#xff1a; Unity游戏开发 Unity游戏开发前言深入解析 Unity 地形系统&#xff1a;从基础到高级应用一、初识 Unity 地形系统1. 地形尺寸与分辨率 二、地形编辑工具详解1…

下拉菜单 匹配搜索

操作版本&#xff1a;Excel 2010 下拉菜单 涉及到的函数&#xff1a; INDIRECT函数&#xff1a;返回由文本字符串指定的引用 原文链接 一级下拉菜单 方法一&#xff1a;手动输入 选中要制作下拉菜单的单元格区域&#xff0c;单击【数据】-【数据有效性】-【序列】&#…

15.CentOS7升级内核

升级内核 1.配置镜像源 vim /etc/yum.repos.d/elrepo.repo[elrepo] nameelrepo baseurlhttps://mirrors.aliyun.com/elrepo/archive/kernel/el7/x86_64 gpgcheck0 enabled12.备份 cd /etc/yum.repos.d/ mv local.repo repo.bak/ 3.清缓存 yum clean all 4.升级内核 yum ins…

背部筋膜炎最好的恢复办法

背部筋膜炎是由于寒冷、精神紧张、潮湿或慢性劳损等因素造成的背部肌筋膜和肌组织发生水肿、纤维变性和渗出&#xff0c;其主要症状包括&#xff1a; 1、疼痛&#xff1a;患者通常会出现背部疼痛&#xff0c;这种疼痛在着凉或劳累时可能会加重。晨起时疼痛可能尤为明显&#x…