SDSX-小米这篇论文牛吹大了，比SD1.5快30倍，比SDXL快60倍

SDSX-小米这篇论文牛吹大了，比SD1.5快30倍，比SDXL快60倍

news2026/2/15 15:36:14

今天在论文集上看到一篇很新的文章：

SDXS: Real-Time One-Step Latent Diffusion Models with Image Conditions

大至意思就是，小米公司做了一个新的扩散模型，用的是蒸馏法（参见turbo模型及LCM模型)，速度很快，原文意思是：

We present two models, SDXS-512 and SDXS-1024, achieving inference speeds of approximately 100 FPS (30x faster than SD v1.5) and 30 FPS (60x faster than SDXL) on a single GPU, respectively. Moreover, our training approach offers promising applications in image-conditioned control, facilitating efficient image-to-image translation.

512尺寸或1024尺寸上，100FPS出图情况下，比SD1.5模型至少快30倍，比SDXL至少快60倍。

而且是一步生图，图片质量还相当的好。

看到这篇论文，我直接去看了github项目，也是又新又干净，除了几张图就没别的东西了。

然后我仔细研究了一下他们的论文，嗯.......没毛病，有雷不死的风格，就象不锈钢，玻璃一样，确实有这么个东西，但玩了点花活。

因为很多人对模型原理觉得高深莫测，所以我就简单分析一下。

1，蒸馏法，其实最早实现的模型应用的是我们中国人，也就是LCM，出图速度确实快，通常20步出的图，它只需要4步，LCM推出后几天后，老外也搞了一个Turbo, 能在1-2步出图。换句话说，你小米要把SDSX做速度对比，应该与LCM或者Turbo去比，才是同级别对比。

2, 优质出图，LCM与Turbo刚出来时，确实出图质量不行，但通过后级优化，已经不是问题了。

3, 小米模型用的是固态模型，只有512及1024二种，而别人用的是动态模型，支持多种分辨率，固态模型出图是比动态模型快，没毛病。

4. 100FPS, 30FPS，类似于“奥氏体304” 的意思，你出图就出图嘛，干嘛用FPS.

让子弹飞

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1550381.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

文生视频大模型Sora的复现经验

文生视频大模型Sora的复现经验

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的…

阅读更多...

QtCreator调试时无法显示std::string的内容

QtCreator调试时无法显示std::string的内容

在银河麒麟V10或Ubuntu下使用QtCreator调试代码时，std::string类型变量在大多数情况下不显示实际内容，而是显示"<无法访问>"字样，鼠标点击进去也是看不见任何有用信息，这样非常影响调试效率，为此&…

阅读更多...

docker 的网络管理

docker 的网络管理

docker应用自带了三种类型的网络，然后我们自己也能自定义网络 roottest-virtual-machine:~# docker network ls NETWORK ID NAME DRIVER SCOPE 4c3e28760cff bridge bridge local afd1493dc119 host host local 5f200e2eaf22 n…

阅读更多...

读所罗门的密码笔记04_社会信用

读所罗门的密码笔记04_社会信用

1. 人工智能 1.1. 人工智能可以帮助人们处理复杂的大气问题，完善现有的气候变化模拟，帮助我们更好地了解人类活动对环境造成的危害，以及如何减少这种危害 1.2. 人工智能也有助于减少森林退化和非法砍伐 1.3. 人工智能甚至可以将我们从枯燥…

阅读更多...

argocd部署

argocd部署

一、前言 ArgoCD 是一个开源的、持续交付工具，用于自动化部署应用程序到 Kubernetes 集群。它基于 GitOps 理念，通过使用 Git 作为单一的源头来管理应用程序的配置和部署状态，argocd会定时监控git仓库中的yaml配置文件，当git仓库中…

阅读更多...

uniapp 微信小程序 canvas 手写板文字重复倾斜水印

uniapp 微信小程序 canvas 手写板文字重复倾斜水印

核心逻辑先将坐标系中心点通过ctx.translate(canvasw / 2, canvash / 2) 平移到canvas 中心，再旋转设置水印假如不 translate 直接旋转，则此时的旋转中心为左上角原点，此时旋转示意如图所示当translate到中心点之后再旋转，此…

阅读更多...

题目 3152: 蓝桥杯2023年第十四届省赛真题-接龙数列【DFS简单爆搜做法】

题目 3152: 蓝桥杯2023年第十四届省赛真题-接龙数列【DFS简单爆搜做法】

👏这个是目录哦~ DFS 只能拿到 1/4 的分数心路历程核心出装三大件get_first()get_last()dfs() 全部 DFS 只能拿到 1/4 的分数心路历程核心出装三大件 get_first() inline int get_first(int n) {//123//12//1while (n / 10) {n / 10;}return n; }get_last() in…

阅读更多...

Neural Latents Benchmark: 尖锋序列潜变量模型

Neural Latents Benchmark: 尖锋序列潜变量模型

Neural Latents Benchmark ‘21: Evaluating latent variable models of neural population activity 挑战赛说明: https://neurallatents.github.io/ 挑战赛地址: https://eval.ai/web/challenges/challenge-page/1256/overview NeuralLatent 论文: https://arxiv.org/abs/…

阅读更多...

【opencv】教程代码 —ImgProc （6）通过Wiener滤波器恢复运动模糊图像

【opencv】教程代码 —ImgProc （6）通过Wiener滤波器恢复运动模糊图像

6. motion_deblur_filter.cpp通过Wiener滤波器恢复运动模糊图像（参数难调） 您将学习如何使用维纳滤波器恢复具有运动模糊失真的图像 /** * brief 学习如何使用Wiener滤波器恢复运动模糊失真的图像。 * author 混沌鱼, karpushinngs.ru, https://github.c…

阅读更多...

java图书管理系统（简易）

java图书管理系统（简易）

实现的基本功能： 登录时，需要输入姓名，然后选择作为管理者还是普通用户。选择成功后选择想要实现的功能。管理者的目录下方有有五个功能，而普通用户有4个功能，如下图首先我们要建立Book这个类，里面包含书…

阅读更多...

Swagger3探索之游龙入海

Swagger3探索之游龙入海

引言后端开发中常用的接口调用工具一般使用Postman、ApiPost工具，但后期需要与前端联调，要补充接口文档花费大量时间，此时Swagger3应运而生，大大提高沟通交流的效率。引用依赖 <!-- Swagger3 调用方式 http://ip:port/swa…

阅读更多...

Echarts之x轴，Y轴配置项大全

Echarts之x轴，Y轴配置项大全

ECharts是一个强大的数据可视化库，提供了丰富的配置项来定制图表的x轴和y轴。下面是ECharts中x轴和y轴的配置项大全： xAxis配置项： type：轴类型，可选值有：“value”（数值轴）, “cat…

阅读更多...

IP如何异地共享文件？

IP如何异地共享文件？

【天联】组网由于操作简单、跨平台应用、无网络要求、独创的安全加速方案等原因，被几十万用户广泛应用，解决了各行业客户的远程连接需求。采用穿透技术，简单易用，不需要在硬件设备中端口映射即可实现远程访问。异地共享文件在…

阅读更多...

excel匹配替换脱敏身份证等数据

excel匹配替换脱敏身份证等数据

假如excel sheet1中有脱敏的身份证号码和姓名，如： sheet2中有未脱敏的数据数据做法如下： 1、在sheet2的C列用公式 LEFT(A2,6)&REPT("*",8)&RIGHT(A2,4) 做出脱敏数据，用来与sheet1的脱敏数据匹配 2、在sheet…

阅读更多...

案例研究｜DataEase实现物业数据可视化管理与决策支持

案例研究｜DataEase实现物业数据可视化管理与决策支持

河北隆泰物业服务有限责任公司（以下简称为“隆泰物业”）创建于2002年，总部设在河北省高碑店市，具有国家一级物业管理企业资质，通过了质量体系、环境管理体系、职业健康安全管理体系等认证。自2016年至今，隆…

阅读更多...

以太网链路聚合——增加带宽，解决生成树收敛慢的问题

以太网链路聚合——增加带宽，解决生成树收敛慢的问题

目录一.对STP生成树的补充 1.STP接口状态 2.STP生成树的改进二.网络可靠性 1.单板可靠性 2.设备可靠性 3.链路可靠性三.链路聚合 1.多条链路聚合增加带宽 2.链路聚合术语四.链路聚合模式 1.手动模式 2.LASP模式 （1).LASP术语 （2&…

阅读更多...

[Qt] QString::fromLocal8Bit 的使用误区

[Qt] QString::fromLocal8Bit 的使用误区

QString::fromLocal8Bit 是一个平台相关的函数。默认情况下在 Windows 下就是 gbk 转 utf-8 ,在 Linux就应该是无事发生。因为Linux平台默认的编码方式就是 utf-8 可以通过 void QTextCodec::setCodecForLocale(QTextCodec *c)来修改 Qt默认的编码方式。如下第一输出乱码的…

阅读更多...

深入探讨分布式ID生成方案

深入探讨分布式ID生成方案

🎈🎈作者主页： 喔的嘛呀🎈🎈 🎈🎈所属专栏：python爬虫学习🎈🎈 ✨✨谢谢大家捧场，祝屏幕前的小伙伴们每天都有好运相伴左右，一定要天天…

阅读更多...

图神经网络实战（6）——使用PyTorch构建图神经网络

图神经网络实战（6）——使用PyTorch构建图神经网络

图神经网络实战（6）——使用PyTorch构建图神经网络 0. 前言1. 传统机器学习与人工智能2. 人工神经网络基础2.1 人工神经网络组成2.2 神经网络的训练 3. 图神经网络4. 使用香草神经网络执行节点分类4.1 数据集构建4.2 模型构建4.3 模型训练 5. 实现香草图神…

阅读更多...

广发期货：从灾备中心、信创云到主中心，超融合支撑云化与国产化双转型

广发期货：从灾备中心、信创云到主中心，超融合支撑云化与国产化双转型

案例亮点超过 30 节点承载灾备中心、信创云及主中心的 60% 以上业务系统。超融合信创资源池稳定运行超 1 年，承载 80% 以上的信创系统，顺利通过信创验收。引入超融合架构后，业务在 1 周内快速上线，稳定运行 3 年；减少…

阅读更多...

推荐文章

最新文章