LCM-LoRA:通用stable diffusion 加速模块!2023.11.13顶会论文速递!

news2025/1/11 8:16:57

整理:AI算法与图像处理

欢迎关注公众号 AI算法与图像处理,获取更多干货:

99a3bc00e44f5aa64ad0d7a928bf8552.jpeg

推荐

微信交流群现已有2000+从业人员交流群,欢迎进群交流学习,微信:nvshenj125

0d1e62e9cbe7d409451f44e8f0dd9e02.jpeg

B站最新成果demo分享地址:https://space.bilibili.com/288489574

顶会工作整理Github repo:https://github.com/DWCTOD/CVPR2023-Papers-with-Code-Demo

论文速读

LCM-LoRA:通用stable diffusion 加速模块

标题: LCM-LoRA: A Universal Stable-Diffusion Acceleration Module

论文:https://arxiv.org/pdf/2311.05556.pdf

github:https://github.com/luosiallen/latent-consistency-model

摘要:

潜在一致性模型 (LCM)(Luo 等人,2023)在加速文本到图像生成任务、以最少的推理步骤生成高质量图像方面取得了令人印象深刻的性能。LCM 是从预训练的潜在扩散模型 (LDM) 中提取出来的,仅需要 ∼32 个 A100 GPU 训练小时。该报告进一步扩展了 LCM 在两个方面的潜力:首先,通过将 LoRA 蒸馏应用于稳定扩散模型,包括 SD-V1.5 (Rombach et al., 2022)、SSD-1B (Segmind., 2023) 和 SDXL ( Podell 等人,2023),我们将 LCM 的范围扩展到更大的模型,内存消耗显着减少,实现了卓越的图像生成质量。其次,我们将通过LCM蒸馏获得的LoRA参数确定为通用的稳定扩散加速模块,命名为LCM-LoRA。LCM-LoRA 无需训练即可直接插入各种stable diffusion微调模型或 LoRA,从而成为适用于各种图像生成任务的通用加速器。与之前的数值 PF-ODE 求解器如 DDIM (Song et al., 2020)、DPM-Solver (Lu et al., 2022a;b) 相比,LCM-LoRA 可以被视为插件式神经 PF-ODE 求解器 具有很强的泛化能力

整体框架:

7327f71a27745a5d52b375f4edb355cf.png

LCM-LoRA 整体框架。通过将LoRA引入LCM的蒸馏过程,我们显着减少了蒸馏的内存开销,这使得我们能够在有限的资源下训练更大的模型,例如SDXL和SSD-1B。更重要的是,通过 LCM-LoRA 训练获得的 LoRA 参数(“加速向量”)可以直接与通过在特定风格数据集上微调获得的其他 LoRA 参数(“风格矢量”)相结合。无需任何训练,通过加速度向量和风格向量的线性组合获得的模型就能够以最少的采样步骤生成特定绘画风格的图像。

算法流程:

dd615e17d38f1dfdfcc13c916e4941a3.png

效果展示:

8a11e75a654fb793e35952edcafd74c8.png

8c93df53061b46e87f389e3238d00a71.png

更多细节参考论文原文和GitHub项目,如果有帮助欢迎转发,感谢

工作整理

ICCV 2023
Updated on : 13 Nov 2023
total number : 0

Improved Positional Encoding for Implicit Neural Representation based Compact Data Representation

  • 论文/Paper: http://arxiv.org/pdf/2311.06059

  • 代码/Code: None

WACV 2024
Updated on : 13 Nov 2023
total number : 9

Semantic-aware Video Representation for Few-shot Action Recognition

  • 论文/Paper: http://arxiv.org/pdf/2311.06218

  • 代码/Code: None

MonoProb: Self-Supervised Monocular Depth Estimation with Interpretable Uncertainty

  • 论文/Paper: http://arxiv.org/pdf/2311.06137

  • 代码/Code: metrics.https://github.com/CEA-LIST/MonoProb

U3DS$^3$: Unsupervised 3D Semantic Scene Segmentation

  • 论文/Paper: http://arxiv.org/pdf/2311.06018

  • 代码/Code: None

A Neural Height-Map Approach for the Binocular Photometric Stereo Problem

  • 论文/Paper: http://arxiv.org/pdf/2311.05958

  • 代码/Code: None

Automated Sperm Assessment Framework and Neural Network Specialized for Sperm Video Recognition

  • 论文/Paper: http://arxiv.org/pdf/2311.05927

  • 代码/Code: https://github.com/ftkr12/rostfine

PolyMaX: General Dense Prediction with Mask Transformer

  • 论文/Paper: http://arxiv.org/pdf/2311.05770

  • 代码/Code: None

GIPCOL: Graph-Injected Soft Prompting for Compositional Zero-Shot Learning

  • 论文/Paper: http://arxiv.org/pdf/2311.05729

  • 代码/Code: None

OmniVec: Learning robust representations with cross modal sharing

  • 论文/Paper: http://arxiv.org/pdf/2311.05709

  • 代码/Code: None

Layer-wise Auto-Weighting for Non-Stationary Test-Time Adaptation

  • 论文/Paper: http://arxiv.org/pdf/2311.05858

  • 代码/Code: https://github.com/junia3/LayerwiseTTA

NeurIPS 2023
Updated on : 13 Nov 2023
total number : 1

Learning Human Action Recognition Representations Without Real Humans

  • 论文/Paper: http://arxiv.org/pdf/2311.06231

  • 代码/Code: https://github.com/howardzh01/ppma

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1206463.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Actipro Software WinForms Controls 23.1.2

Actipro它被认为是一组 UI 控件,用于为用户和开发人员创建漂亮的窗口窗体以及桌面应用程序。Actipro Software 创建于 1999 年,被认为是为用户和开发人员(主要为 Microsoft 平台 .NET)提供软件组件的私营提供商。基于克利夫兰&…

Rust编程中的共享状态并发执行

1.共享状态并发 虽然消息传递是一个很好的处理并发的方式,但并不是唯一一个。另一种方式是让多个线程拥有相同的共享数据。在学习Go语言编程过程中大家应该听到过一句口号:"不要通过共享内存来通讯"。 在某种程度上,任何编程语言中的信道都类…

Actipro Software WPF Controls 23.1.3

Actipro Software WPF Controls v23.1.3 Actipro Software 为 Microsoft 提供软件组件和 .NET 平台。它位于克利夫兰,重点主要是提供高质量的用户界面软件组件以及客户的过程,以便他们有能力信任,以便为用户应用程序添加强大的功能。自 .NET…

Vscode舒适的主题推荐

1. One Dark Pro与One Dark Pro Darker 感觉配色特别好看,强烈推荐

如何编写一个Perl爬虫程序

要编写一个Perl爬虫程序,首先需要安装LWP::UserAgent模块。你可以使用cpan命令来安装该模块: cpan LWP::UserAgent 安装完成后,可以使用以下代码来编写爬虫程序: use LWP::UserAgent; use HTML::TreeBuilder; my $proxy_host …

【算法与数据结构】46、47、LeetCode全排列I, II

文章目录 一、46.全排列I二、47.全排列II三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、46.全排列I 思路分析:本题要求是全排列,意味着每次递归的时候startIndex都要从0开始,否则…

基于 Letterize.js + Anime.js 实现炫酷文本特效

如上面gif动图所示,这是一个很炫酷的文字动画效果,文字的每个字符呈波浪式的扩散式展开。本次文章将解读如何实现这个炫酷的文字效果。 基于以上的截图效果可以分析出以下是本次要实现的主要几点: 文案呈圆环状扩散开,扩散的同时…

代驾预约小程序系统源码 :提起预约,避免排队 带完整搭建教程

大家好啊,又到罗峰来给大家分享好用的源码系统的时间了。今天要给大家分享的第一款代驾预约小程序源码系统。传统的代驾服务中,用户往往需要在酒后代驾、长途驾驶等场景下,面对排队等待代驾司机空闲时间的繁琐过程。这不仅浪费了用户的时间和…

excel中的OFFSET函数

介绍 OFFSET函数是确定从基点出发移动后的引用区域。它有5个参数: 第1个参数是引用的参考基点区域第2个参数是移动的行数,正数代表向下移动的行数,负数代表向上移动的行数第3个参数是移动的列数,正数代表向右移动的列数&#xf…

性价比高的台灯推荐,呼声最高的五款护眼台灯推荐

台灯可以说家家必备!家中有上学的小孩更是需要一款好台灯,因为看书、写字、做作业都离不开台灯,一款好的台灯不仅会提供明亮的学习环境,而且还能保护视力,预防近视,因此,挑选台灯绝对不可以马虎…

企业计算机服务器中了halo勒索病毒怎么办,halo勒索病毒解密数据恢复

随着科技技术的不断提升,越来越多的企业开始走向数字化办公,让企业的生产运营得到了快速发展,但随之而来的网络安全威胁引起了人们的重视,近期,云天数据恢复中心陆续接到很多企业的求助,企业的计算机服务器…

产品经理天天跑火车,我直接和他闹翻

前言 说起产品经理与程序员,简直就是一对冤家。 程序员觉得产品经理不尊重技术规则,产品经理埋怨程序员不尊重创作用心。 一边互怼,一边还要合作,终于,有人忍不下去,动手了…… ![](https://img-blog.cs…

RFID技术在仓储物流管理中的应用方案

一、方案背景 当前市场竞争日益激烈,提高生产效率、降低运营成本对来说企业至关重要,仓储物流管理在各个行业广泛应用,设计和建立完善的仓储管理流程,提高仓储周转效率,减少运营资金的占用,将冻结的资产转…

第3关:集合操作100

任务描述相关知识编程要求测试说明 任务描述 本关任务:使用 集合操作解决实际问题 相关知识 1.集合并操作符 可转换为SQL 若R,S的属性名不同,可使用重命名使相应列名一致后进行并操作 例如:R(A,B,C) S(D,E,F) select A,B from R union sel…

深入了解鼠标光标的设置过程

有一位读者问了这样一个问题: “为什么鼠标光标的设定绑定在窗口类,而不是窗口上?” 这个问题隐含地假设了光标与窗口类相关联。虽然每个窗口类都有一个关联的光标,但决定使用哪个光标的是窗口。 光标设置过程在 WM_SETCURSOR 消…

用CHAT如何写视频剪辑思路?

问CHAT:我的行业是国学教育,我的工作是视频剪辑师,给我推荐几个剪辑思路 CHAT回复: 作为一个国学教育视频剪辑师,你的主要任务是通过剪辑创作引人入胜、富有教育性的视频。 以下是一些可能对你有帮助的剪辑思路&…

数据结构-散列表

列表(Hash Table),又称哈希表,是一种数据结构,特点是:数据元素的关键字与其存储地址直接相关 例:有一堆数据元素,关键字分别为{19,14,23&#xff…

Session、Token、Jwt三种登录方案介绍

新开发一个应用首先要考虑的就是登录怎么去做,登录本身就是判断一下输入的用户名和密码与系统存储的是否一致,但因为Http是无状态协议,用户请求其它接口时是怎么判断该用户已经登录了呢?下面聊一个三种实现方案。 一、传统sessio…

mysql 中with的用法(2)

with递归练习主要用于表里面包含父节点id之类的 查询出对应的省份和市。 建表 CREATE TABLE tb(id VARCHAR(3), pid VARCHAR(3), name VARCHAR(64));INSERT INTO tb VALUES(002, 0, 浙江省); INSERT INTO tb VALUES(001, 0, 广东省); INSERT INTO tb VALUES(003, 002, 衢州市…

模拟实现C语言--strstr函数

模拟实现C语言–strstr函数 文章目录 模拟实现C语言--strstr函数一、strstr函数是什么?二、使用示例三、模拟实现3.1 模拟实现1 一、strstr函数是什么? 在目标字符串中寻找字符串 char * strstr ( const char *str1, const char * str2);根据语法结构&…