Consistency Models

news2024/11/19 23:32:46

Consistency Models- 理解

      • 问题定义
          • 研究动机
          • 本文中心论点
      • 相关工作和进展
          • Consistency Models创新点
          • review扩散模型
      • Consistency Model-Definition
          • 一致性模型的定义
          • 一致性模型参数化
          • 一致性模型采样
      • Training Consistency Models via Distillation
      • Training Consistency Models in Isolation

在这里插入图片描述

pdf:https://arxiv.org/pdf/2303.01469.pdf
github:https://github.com/openai/consistency_models

问题定义

图像编辑等

研究动机

扩散模型依赖于迭代生成过程,导致采样速度较慢,实时应用有限。

本文中心论点
  • 给定一个概率流(PF) ODE,它能平滑地将数据转换为噪声。作者学习将ODE轨迹上的任何点(例如, x t , x t ′ x_t, x'_t xt,xt)映射到它的原点(例如, x 0 x_0 x0),用于生成建模。
  • 这些映射的模型称为一致性模型,因为对于同一轨迹上的点,他们的输出被训练为的一致的。

相关工作和进展

扩散模型受限于时间。

Consistency Models创新点
  • 一致性模型在设计上支持快速的一步生成,同时仍然允许少步采样以换取样本质量的计算。
  • 一种新的生成模型家族,可以在没有对抗性训练的情况下实现高样本质量
  • 支持zero-shot数据编辑,如图像修补、着色和超分辨率,而不需要对这些任务进行明确的训练。
  • 一致性模型既可以作为提取预训练扩散模型的一种方式训练,也可以作为独立的生成模型训练。
review扩散模型

将扩散理解为一个在时间上连续的变换过程(引入SDE形式来描述扩散模型的本质好处是“将理论分析和代码实现分离开来”,借助连续性SDE的数学工具做分析,实践的时候,则只需要用任意适当的离散化方案对SDE进行数值计算)
用随机微分方程(Stochastic Differential Equation,SDE)来描述扩散模型:
在这里插入图片描述
可以理解为下式(离散化):
在这里插入图片描述
在以前的论文中推导出上述SDE存在一个ODE形式的解轨迹(Probability Flow ODE)
在这里插入图片描述
在这里插入图片描述
SDE设计为让 p T ( x ) p_T(x) pT(x) 接近于易处理的高斯分布。采用别人论文中的设置,带入到(2)中
在这里插入图片描述

首先训练一个得分模型 s ϕ ( x , t ) ≈ ▽ l o g p t ( x ) s_\phi (\mathbf{x},t) \approx\bigtriangledown logp_t(\mathbf{x}) sϕ(x,t)logpt(x),(2)转化为。称为empirical PF ODE
在这里插入图片描述
采样 x ^ ∼ π = N ( 0 , T 2 I ) \widehat{\mathbf{x}} \sim \pi = N (0,T^2 I) x π=N(0,T2I)来初始化empirical PF ODE

  • 利用现有的数值ODE solver来求解(Euler,Heun solvers等)
  • 得到的 x ^ \widehat{\mathbf{x}} x 可以被看作是数据分布 p d a t a ( x ) p_{data}(\mathbf{x}) pdata(x)的一个近似样本。
  • 考虑到数值稳定性,往往不会直接求出原图,而是取一个很小的值逐步来进行近似,并持续这个过程来求出。(导致速度慢)

Consistency Model-Definition

一致性模型的定义

假设存在一个函数f,对于同一条PF ODE轨迹上的任意点都有相同的输出 f ( x t , t ) = f ( x t ′ , t ′ )  for all  t , t ′ ∈ [ ϵ , T ] \boldsymbol{f}\left(\mathrm{x}_{t}, t\right)=\boldsymbol{f}\left(\mathrm{x}_{t^{\prime}}, t^{\prime}\right) \text { for all } t, t^{\prime} \in[\epsilon, T] f(xt,t)=f(xt,t) for all t,t[ϵ,T]
在这里插入图片描述
consistency model的目标是从数据中估计一致性函数 f f f,来迫使self-consistency性质

一致性模型参数化

对于任意的一致性函数 f ( ⋅ , ⋅ ) f(\cdot, \cdot) f(,),用神经网络来拟合。但要满足两个条件:①同一个轨迹上的点输出一致;②在起始点f为一个对于x的恒等函数

  • 第一种做法简单地参数化consistency models
    在这里插入图片描述
  • 第二种做法使用跳跃连接(作者和许多其他的都用这个)
    在这里插入图片描述
一致性模型采样

有了训练好的一致性模型 f θ ( ⋅ , ⋅ ) f_\theta(\cdot, \cdot) fθ(,) ,就可以通过初始分布采样来产生样本。(这里指的是训练好后怎么来生成样本)

在这里插入图片描述

在一致性模型中,可以一步生成样本。也可以多步生成,算法1为多步生成。
想法就是预测出x后回退然后再进行预测减小误差。实际中,采用贪心算法来寻找时间点,通过三值搜索每次确定一个时间点,优化算法得到的样本的FID(不太重要)

Training Consistency Models via Distillation

第一种训练consistency model的方式——蒸馏预训练好的score model s ϕ ( x , t ) s_{\phi}(\mathrm{x}, t) sϕ(x,t)
假设采样轨迹的时间序列为 t 1 = ϵ < t 2 < ⋯ < t N = T t_{1}=\epsilon<t_{2}<\cdots<t_{N}=T t1=ϵ<t2<<tN=T
通过运行数值ODE求解器的一个离散化步骤从 x t n + 1 \mathbf{x}_{t_{n+1}} xtn+1得到 x t n \mathbf{x}_{t_{n}} xtn
在这里插入图片描述
Φ ( . . . ; ϕ ) \Phi(...;\phi) Φ(...;ϕ)为ODE solver
例如使用Euler solver d x d t = − t s ϕ ( x t , t ) \frac{\mathrm{dx}}{\mathrm{d} t}=-t s_{\phi}\left(\mathrm{x}_{t}, t\right) dtdx=tsϕ(xt,t) Φ ( x , t ; ϕ ) = − t s ϕ ( x , t ) \Phi(\mathrm{x}, t ; \phi)=-t s_{\phi}(\mathrm{x}, t) Φ(x,t;ϕ)=tsϕ(x,t)带入上式得到
在这里插入图片描述
沿着ODE轨迹的分布进行第一次采样 x \mathrm{x} x~ p d a t a p_{data} pdata,然后添加高斯噪声,生成一对在PF ODE轨迹上相邻的数据点 ( x ^ t n ϕ , x t n + 1 ) \left(\hat{\mathbf{x}}_{t_n}^\phi, \mathbf{x}_{t_{n+1}}\right) (x^tnϕ,xtn+1)

通过最小化这一对的输出差异来训练一致性模型,作者遵循一致性蒸馏损失来训练一致性模型,就有如下的consistency distillation loss:
在这里插入图片描述
在这里插入图片描述
在蒸馏的过程中,作者用预训练模型来估计得分.
采用EMA来更新模型会提高训练的稳定性,并且性能会更好
在这里插入图片描述

Training Consistency Models in Isolation

Consistency models也可以单独进行训练,而不依赖于预训练好的扩散模型。
作者说这与扩散蒸馏技术不同,使一致性模型成为一个新的独立的生成模型家族。
在consistency distillation中,使用了预训练的score model s ϕ ( x , t ) s_{\phi}(\mathrm{x}, t) sϕ(x,t)来近似ground truth score function ▽ l o g p t ( x ) \bigtriangledown logp_t(\mathbf{x}) logpt(x)
作者证明了 ▽ l o g p t ( x ) \bigtriangledown logp_t(\mathbf{x}) logpt(x)的一种无偏估计,即证明了一种新的得分函数的估计
在这里插入图片描述

即给定x, xt,可以用 − ( x t − x ) / t 2 -(\mathbf{x}_t -\mathbf{x})/t^2 (xtx)/t2 形式化 ▽ l o g p t ( x ) \bigtriangledown logp_t(\mathbf{x}) logpt(x)的蒙特卡罗估计,可以理解为
在这里插入图片描述
利用该得分估计,作者构建了新的consistency training (CT) loss记作 L C T N ( θ , θ − ) L_{CT}^{N}(\theta,\theta^-) LCTN(θ,θ)
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/451038.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ChatGPT on Notes/Domino

大家好&#xff0c;才是真的好。 随着春节过去&#xff0c;小盆友也开始陆续到幼儿园报到&#xff0c;我们又回来和大家一起继续Notes/Domino传奇之旅。 去年年底ChatGPT横空出世&#xff0c;让大家震惊了一把。 可能有些老Notes/Domino人&#xff0c;还不知道ChatGPT是什么…

MySQL_第11章_数据处理之增删改

第11章_数据处理之增删改 讲师&#xff1a;尚硅谷 - 宋红康&#xff08;江湖人称&#xff1a;康师傅&#xff09; 官网&#xff1a; http://www.atguigu.com 1. 插入数据 1.1 实际问题 解决方式&#xff1a;使用 INSERT 语句向表中插入数据。 1.2 方式1&#xff1a;VA…

在OpenHarmony 开发者大会2023,听见百业同鸣

加强开源&#xff0c;助推中国科技强国战略&#xff0c;已经成为中国科技繁荣的必要条件&#xff0c;“十四五”规划中首次提到了“开源”两个字&#xff0c;并明确指出&#xff0c;支持数字技术开源社区等创新联合体的发展。 在中国发展开源&#xff0c;有着拓荒的色彩&#x…

Springsecurity笔记14-18章JWT+Spring Security+redis+mysql 实现认证【动力节点】

15 SpringSecurity 集成thymeleaf 此项目是在springsecurity-12-database-authorization-method 的基础上进行 复制springsecurity-12-database-authorization-method 并重命名为springsecurity-13-thymeleaf 15.1 添加thymeleaf依赖 | <groupId>org.springframewor…

西门子s7-300/400PLC-MMC密码解密

西门子s7-300/400-MMC密码解密 简介西门子加密工具及操作密码验证 简介 目前&#xff0c;市面上或网络上有很多针对s7-200&#xff0c;300&#xff0c;400&#xff0c;1200&#xff0c;1500的密码解密破解软件&#xff0c;但很多时候只能解数字或英文密码&#xff0c;对设置了…

Linux-初学者系列——篇幅5_系统目录相关命令

系统目录相关命令-目录 一、系统目录层级1、目录绝对路径2、目录相对路径3、目录层级结构查看-tree不带任何参数获取目录结构数据信息以树形结构显示目录下的所有内容&#xff08;包含隐藏信息&#xff09;只列出根目录下第一层的目录结构信息只显示目录结构信息中的所有目录信…

ThingsBoard如何自定义topic

1、背景 业务需要,mqtt设备,他们协议和topic都定义好了,想使用tb的mqtt直接接入设备,但是设备的topic和tb规定的不一致,该如何解决呢? 2、要求 设备的topic要求规则是这样的 首先第二点是满足的,网关的发布主题是可以通过tb的设备配置来自定义遥测和属性的topic,问题…

qiankun应用级缓存-多页签缓存

需求&#xff1a; A&#xff1a;主应用 B&#xff1a;子应用 项目框架&#xff1a;vue2 全家桶 qiankun 应用间切换需要保存页面缓存&#xff08;多页签缓存&#xff09;&#xff0c;通过vue keep-alive只能实现页面级缓存&#xff0c;在单独打开的应用里能实现缓存&#xf…

德国申请专利,发明,实用,外观专利申请详细步骤

一、德国专利申请途径 申请人可以向德国专利商标局直接递交申请。要求优先权的情况下根据《保护工业产权巴黎公约》需要在递交中国在先申请的12个月之内向德国专利商标局递交申请。 另外&#xff0c;通过PCT&#xff08;“Patent Cooperation Treaty”&#xff0c;即《专利合作…

【分享】免费的AI绘画网站(5个)

哈喽&#xff0c;大家好&#xff0c;我是木易巷~ 随着人工智能技术的不断发展&#xff0c;越来越多的AI绘画软件开始涌现&#xff0c;如果你想要免费享受AI绘画的乐趣&#xff0c;那你可要好好看下面的内容~ Vega AI创作平台 入口&#xff1a;https://rightbrain.art 一款专业的…

AIGC+RPA丨大语言模型赋能实在智能数字员工“超进化”

前不久&#xff0c;全球最大上市咨询公司埃森哲发布2023年技术愿景《When Atoms meet Bits》报告&#xff0c;并在当中深度解析到&#xff1a;生成式AI成为2023年四大技术发展趋势之一。 大型语言模型&#xff08;Large Language Model, LLM&#xff09;领域的研发和布局在国内…

如何科学判断研发团队是否在健康工作?(内附量表)

研发效能管理覆盖了交付速度、质量和价值三个维度&#xff0c;但文化建设、团队氛围和客户协作等其他因素对团队工作的影响又该如何度量和管理呢&#xff1f; LigaAI 在 John Cutler 的一篇分享中找到了答案&#xff1a;团队健康度评分。就像我们都很关心自己的身体健康一样&a…

《程序员面试金典(第6版)》面试题 16.02. 单词频率(哈希法,C++)

题目描述 设计一个方法&#xff0c;找出任意指定单词在一本书中的出现频率。 你的实现应该支持如下操作&#xff1a; WordsFrequency(book)构造函数&#xff0c;参数为字符串数组构成的一本书get(word)查询指定单词在书中出现的频率 示例&#xff1a; WordsFrequency word…

DevEco Studio 3.1 Beta新特性知多少

HUAWEI DevEco Studio是开发HarmonyOS应用及服务的一站式集成开发环境&#xff08;IDE&#xff09;。本次&#xff0c;DevEco Studio 3.1 Beta新增支持当前在市面上新的操作系统&#xff0c;如Windows11、macOS&#xff08;ARM&#xff09;操作系统&#xff0c;还面向HarmonyOS…

4.数据结构(0x3f:从周赛中学算法 2022下)

来自0x3f【从周赛中学算法 - 2022 年周赛题目总结&#xff08;下篇&#xff09;】&#xff1a;https://leetcode.cn/circle/discuss/WR1MJP/ 包括堆&#xff08;优先队列&#xff09;、单调栈、单调队列、字典树、并查集、树状数组、线段树等。 学习这些只是开始&#xff0c;能…

Pytorch对机器学习模型的安全漏洞攻击方法之Fast Gradient Sign Attack(FGSM,快速梯度符号攻击)

原论文&#xff1a;EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES 一般本人的习惯是先看论文熟悉它&#xff0c;然后代码去实现它&#xff0c;这样感觉要好点。因为论文讲解的比较全面和一些实验对比还有很多的引用等&#xff0c;另外大家知道好论文基本都是英文&#xff0c…

【Python】【进阶篇】2、Django MTV和MVC的区别

目录 2、Django MTV和MVC的区别1. MVC设计模式2. MTV设计模式 2、Django MTV和MVC的区别 在上一节《Django是什么》中&#xff0c;我们对 Django 的诞生以及 Web 框架的概念有了基本的了解&#xff0c;本节我们介绍 Django 的设计模式&#xff0c;也就是 MTV。 在 Web 开发领…

Point cloud tools for Matlab(点云学习工具)

Point cloud tools for Matlab (tuwien.ac.at)https://www.geo.tuwien.ac.at/downloads/pg/pctools/pctools.html#PointCloud_class 下载&#xff1a;Download Matlab Code 添加路径 addpath(genpath(D:\MyMatlabCode\pointCloudTools)); pc pointCloud(Lion.xyz); pc.plot…

AI绘画——ChilloutMix模型(现实真人,实现写实逼真的图像)

目录 重要提示&#xff1a;首先&#xff0c;我从不建议再生“真实”人物的图像&#xff0c; 但是&#xff0c;照片“逼真”图像。 本人郑重声明&#xff1a;本模型原则上禁止用于训练基于明星、公众人物肖像的风格模型训练&#xff0c;因为这会带来争议&#xff0c;对AI社区…

全网详细介绍百度低代码框架amis及实例讲解

文章目录 1. 文章引言2. amis官网3. amis介绍3.1 amis的简述3.2 amis的初衷3.3 amis的其他亮点3.4 amis不适之处 4. amis使用4.1 amis框架集成4.2 amis切换主题4.3 amis配置与组件4.4 amis变量 5. amis实例5.1 amis实例5.2 列表查询5.3 查看详情5.4 自定义操作按钮5.5 提交表单…