【SD3的Turbo也来了】Jasper AI用Flash Diffusion的蒸馏技术为SD3提速

news2024/10/25 4:14:52

Flash Diffusion 是一种新颖的图像生成方法,旨在显著提高现有条件扩散模型(例如教师模型)的速度,而无需牺牲性能。它通过引入以下技术来实现这一点:

  • 蒸馏损失:在教师模型和学生模型之间引入蒸馏损失,以鼓励学生模型学习教师模型的输出分布。
  • GAN 损失:使用生成对抗网络(GAN)损失来提高生成图像的质量。
  • 高效网络架构:使用高效的网络架构来减少计算成本。
  • 步骤蒸馏:使用步骤蒸馏来进一步提高效率。

通过结合这些技术,Flash Diffusion 可以实现比现有方法更快的速度,同时生成高质量的图像。事实上,它已经证明能够在移动设备上以不到 2 秒的速度生成图像。

在这里插入图片描述

安装依赖

pip install git+https://github.com/initml/diffusers.git@clement/feature/flash_sd3

Demo

官方

import torch
from diffusers import StableDiffusion3Pipeline

pipe = StableDiffusion3Pipeline.from_pretrained("stabilityai/stable-diffusion-3-medium-diffusers", torch_dtype=torch.float16)
pipe = pipe.to("cuda")

image = pipe(
    "A cat holding a sign that says hello world",
    negative_prompt="",
    num_inference_steps=28,
    guidance_scale=7.0,
).images[0]
image

改进后

import torch
from diffusers import StableDiffusion3Pipeline, SD3Transformer2DModel, FlashFlowMatchEulerDiscreteScheduler
from peft import PeftModel

# Load LoRA
transformer = SD3Transformer2DModel.from_pretrained(
    "stabilityai/stable-diffusion-3-medium-diffusers",
    subfolder="transformer",
    torch_dtype=torch.float16,
)
transformer = PeftModel.from_pretrained(transformer, "jasperai/flash-sd3")


# Pipeline
pipe = StableDiffusion3Pipeline.from_pretrained(
    "stabilityai/stable-diffusion-3-medium-diffusers",
    transformer=transformer,
    torch_dtype=torch.float16,
    text_encoder_3=None,
    tokenizer_3=None
)

# Scheduler
pipe.scheduler = FlashFlowMatchEulerDiscreteScheduler.from_pretrained(
  "stabilityai/stable-diffusion-3-medium-diffusers",
  subfolder="scheduler",
)

pipe.to("cuda")

prompt = "A raccoon trapped inside a glass jar full of colorful candies, the background is steamy with vivid colors."

image = pipe(prompt, num_inference_steps=4, guidance_scale=0).images[0]

在这里插入图片描述
原本的sd3 medium需要28步推理, 而它只需要4步推理,推理速度显著。

未来

Flash Diffusion 是一项具有巨大潛力的新技术。它有可能彻底改变我们生成和使用图像的方式。随着该技术的不断发展,我们可以期待看到更加令人印象深刻的应用程序出现。

以下是一些关于 Flash Diffusion 未来发展的潜在方向:

  • 进一步提高速度和质量:研究人员将继续致力于提高 Flash Diffusion 的速度和质量。
  • 开发新的应用程序:新的 Flash Diffusion 应用程序将被开发出来,例如视频生成和 3D 图像生成。
  • 使 Flash Diffusion 更易于使用:Flash Diffusion 将变得更加易于使用,以便更多人可以利用它。

总而言之,Flash Diffusion 是一项开创性的技术,有望在未来几年对图像生成领域产生重大影响。

我会定期在CSDN分享我的学习心得,项目经验和行业动态。如果你对某个领域感兴趣,或者想要了解更多技术干货,请关注我的账号,一起成长!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1842625.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深信服科技:2023网络钓鱼趋势分析报告

随着互联网的快速发展和广泛应用,网络钓鱼活动带来的安全隐患愈演愈烈。因应威胁发展,我 们编撰了此份分析报告,旨在全面了解其发展态势,并提醒相关部门、企业和公众加强防范。 在本报告中,我们将详细梳理网络钓鱼的近…

【Git】基础操作

初识Git 版本控制的方式: 集中式版本控制工具:版本库是集中存放在中央服务器的,team里每个人work时从中央服务器下载代码,是必须联网才能工作,局域网或者互联网。个人修改之后要提交到中央版本库 例如:SVM和…

无忧易售新功能:集成图片库智能图片翻译,跨越语言障碍

在电商全球化的浪潮中,跨越语言的障碍,让产品图像说话,成为了商家致胜的关键。"无忧易售ERP"推出集成图片库与图片翻译功能的全新升级,为全球电商提供一站式解决方案,让商品跨越国界,沟通无界。 …

Gartner发布2024年人工智能技术成熟度曲线:29项决定人工智能领域发展方向的前沿和趋势性技术

人工智能投资已达到新高,重点是生成式人工智能,但在大多数情况下,该技术尚未实现预期的商业价值。这项研究通过分析各种人工智能创新(其中许多创新正在快速发展),帮助人工智能领导者确定其他值得投资的技术…

1台UG图形工作站实现5-7人共享使用

随着计算机辅助设计(CAD)和计算机辅助制造(CAM)技术的不断发展,UG图形工作站已成为许多行业不可或缺的重要工具。 对于许多中小型企业而言,购买多台高性能的UG图形工作站无疑是一笔巨大的开销,…

SolidWorks上海官方代理商亿达四方:赋能智能制造,创设计新高度

在上海这片充满活力的热土上,亿达四方作为SolidWorks的正版授权代理商,正以其专业的技术力量和周到的服务体系,为当地制造业的转型升级注入强大动力。我们专注于提供原装正版的SolidWorks系列软件,以及全方位的技术支持与解决方案…

Mac OS 安装frida

安装frida和frida-tools Python是基础,提前装好Python 终端执行 python3 -m pip install frida 如果出现error 按照提示处理 信息提示:brew install pipx 于是终端执行: brew install pipx 安装frida: pipx install frida…

Web3 学习

之前学习 web3,走了不少弯路,最近看到了 hackquest,重新刷了一遍以太坊基础,感觉非常nice,而且完全免费,有需要的可以试试,链接hackquest.io。

数据链路层【Linux网络复习版】

目录 一、数据链路层主要解决的是什么问题? 二、什么是以太网? 三、什么是MAC地址? 四、以太网帧的格式是什么? 五、 什么是MTU? 六、MTU和分片 MTU对IP协议的影响? 如何分片? 如何组装&a…

有什么值得推荐的文件外发权限管理软件?

你的身边有这种事情发生吗? 一些工作人员在传达文件、部署工作时,为贪图方便,直接将涉密文件、涉密工作通过微信群传达部署,造成了大量泄密案件发生。 有些责任人员为了工作方便,对涉密文件进行拍照,通过…

卡巴斯基安全卡片

卡巴斯基委托我们制作展示各种安全场景的插图卡片,这些卡片用于在欧洲委员会支持下开发的互动在线培训课程。我们的设计师为这个项目创造了一种独特的风格,既美观又实用。卡片展示了可能出现的潜在危险情况,例如在购物中心、公交车站或办公室…

【计算机网络篇】数据链路层(6)共享式以太网_网络适配器_MAC地址

文章目录 🍔网络适配器🍔MAC地址🗒️IEEE 802局域网的MAC地址格式📒IEEE 802局域网的MAC地址发送顺序🥚单播MAC地址🥚广播MAC地址🥚多播MAC地址🔎小结 🍔网络适配器 要将…

【产品面对面】deepin V23 RC 新体验,文件管理器全面升级!

内容来源:deepin(深度)社区 在日复一日的数据海洋遨游中,是否曾因文件杂乱无章而苦恼?是否渴望过有一种魔法,能让文件瞬间归位,触手可及? 今天,我们带着全新的文件管理工…

oracle 数据库导入dmp文件

荆轲刺秦王 从线上正式环境导出的 dmp 文件,导入到本地 oracle 数据库。 1. 创建用户: CREATE USER hf_chip IDENTIFIED BY hf_chip; 2. 授予 CONNECT 和 RESOURCE 基本权限给新用户。 GRANT CONNECT, RESOURCE TO hf_chip; 3. 创建表空间 CREATE TABLESPACE…

海外仓系统能解决海外仓哪些难题?海外仓标准化管理实用指南

海外仓管理问题常常导致业务流程变慢,根据我们的调查显示,至少有48%的海外仓每周都会出现一些“小意外”。甚至这些小问题每天都在发生,问题的出现已经严重影响到了海外仓业务的进行。今天我们将重点分析海外仓比较常见的一些问题&#xff0c…

工程施工安全检测嵌入式解决方案

工程施工安全检测嵌入式解决方案 1 范围1.1 引言1.2 系统概述1.3 文档概述 2 工程施工安全检测系统应用场景2.1 作业操作安全检查2.2 受限空间作业安全检测2.3 应急设备操作行为检测2.4 动火作业安全检测 3 工程施工安全检测系统设计方案概述3.1 AI识别系统3.2 AI关键技术介绍3…

中国最全的hive sql 函数集合(持续更新)

#6/20/24 增加greatest函数: select greatest(1,2,3,4,5,2) 结论:可以用hive presto spark得出正确的结果值 #6/20/24 增加last_value(cl1) ignore nulls over(order by ts ) as dt 函数: 有数据集: 1 1 1 2 2   3 3 …

实际二分搜索(写出函数,再用二分搜索法找左右边界 画图理解

实际二分搜索(写出函数,再用二分搜索法找左右边界 看到最大值的最小化,左边界,最小化的最大值,右边界 画图理解 爱吃香蕉的珂珂 class Solution {public int minEatingSpeed(int[] piles, int h) {int left1,right10…

Linux - 输入输出

一、输出格式 echo //末尾自带换行 -n //取消自带换行 -e //支持转移符 常见转义符 \n换行 \t制表符 printf // 格式化输出字符串 %-10s // %s代表字符串 -10 左对齐容纳10个字符 二、输入输出重定向 file descriptors &#x…

欧洲杯背后的CDN

随着欧洲杯在德国的顺利举行,上亿中国网友为了观看比赛熬了十几个不眠之夜,欢呼呐喊。他们或守在电视机前,或拿着手机、平板,公交车上地铁里也都是拿着手机看比赛视频的人。不仅各个互联网视频平台流量激增,就连运营商…