Stable Diffusion教程——使用TensorRT GPU加速提升Stable Diffusion出图速度

Stable Diffusion教程——使用TensorRT GPU加速提升Stable Diffusion出图速度

news2026/3/23 10:22:32

概述

Diffusion 模型在生成图像时最大的瓶颈是速度过慢的问题。为了解决这个问题，Stable Diffusion 采用了多种方式来加速图像生成，使得实时图像生成成为可能。最核心的加速是Stable Diffusion 使用了编码器将图像从原始的 3512512 大小转换为更小的 46464 大小，从而极大地降低了计算量。它还利用了潜在表示空间（latent space）上的 Diffusion 过程，进一步降低了计算复杂度，同时也能保证较好的图像生成效果。在消费级GPU 上（8G显存），Stable Diffusion 要生成一张描述复杂图像大概需要 4 秒时间。

然而，对于许多面向消费者的应用来说，每张图像生成需要 4 秒的耗时仍然过长。这时候，TensorRT 就发挥了重要作用。TensorRT 是英伟达（NVIDIA）推出的高性能深度学习推理（inference）库，旨在优化和加速深度学习模型的推理过程。它能够将训练好的深度学习模型优化并部署到 NVIDIA GPU 上，实现实时推理任务的高效执行。TensorRT 的设计目标是提高推理性能、减少延迟和资源消耗，并支持在边缘设备上运行。

TensorRT 提供了许多优化技术，包括网络层融合（layer fusion）、内存优化、精度降级（precision calibration）、量化（quantization）和深度学习模型的裁剪（network pruning）。通过这些技术，TensorRT 可以最大限度地利用 GPU 的并行计算能力，实现深度学习模型的高效执行。

2023年10月18日 Nvidia终于推出了官方的TensorRT插件Stable-Diffusion-WebUI-TensorRT，该插件可以直接在 webui 的 extension 中安装即可，默认支持cuda11.x。

环境配置要求

要使用Stable-Diffusion-WebUI-TensorRT插件加速，有几个重要的前提条件，GPU必须是NVIDIA的（俗称N卡），GPU的显存必须在8G以上，包含8G，GPU驱动版本大于等于537.58,如果电脑没有别的深度学习模型要训练，建议驱动更新到最新的版本。物理内存大于等于16G。
支持Stable-Diffusion1.5,2.1，SDXL，SDXL Turbo 和 LCM。对于 SDXL 和 SDXL Turbo，官方推荐使用具有12GB 或更多 VRAM 的 GPU，以获得最佳性能。

在这里插入图片描述
查看GPU驱动版本：

查看内存与显卡型号：

我使用的环境是win10,GPU 3080 10G显存，32G内存，Stable Diffusion用的是秋叶大佬的4.5这个版本。

Stable-Diffusion-WebUI-TensorRT安装

1.安装

启动Stable-Diffusion-WebUI，找到扩展，然后从网址安装TensorRT插件：
插件网址：https://github.com/NVIDIA/Stable-Diffusion-WebUI-TensorRT.git 在这里插入图片描述
点击安装：

等侍2到10分钟，安装完成：

然后重启Stable-Diffusion-WebUI，就可以看到：
在这里插入图片描述

2.设置

打开设置——>用户界面——>快捷设置列表——>输入"sd_unet",然后保存设置，重载UI：
在这里插入图片描述
重启之后就可以看到多了一个SD Unet的选框了：

3.模型转换

选择要使用的模型，然后打开TensorRT——>TensorRT导出——>选择预设尺寸——>导出引擎:
在这里插入图片描述
关于导出尺寸，这是要设置不用尺寸，但尺寸大小只能是2的幕，这里面导出的模型为onnx模型，如果接触过深度学习的都清楚这个尺寸的含义。

4. 测试推理速度

使用TensorRT推理时，选择的模型与SD Unet要对应，出图的宽度与高度，也要对应上一步导出的模型的尺寸：
在这里插入图片描述

测试出图速度，使用TensorRT出图时，第一张图会很慢，要计算时间可以从第二张开始算，下面出图尺寸是1024*1024：

使用TensorRT推理：
在这里插入图片描述
不使用TensorRT推理，可以看出慢了2点几秒，差不多3秒：

使用TensorRT推理（出图尺寸512*512）：
在这里插入图片描述

不使用TensorRT推理（出图尺寸512*512），可以看出，不使用TensorRT差不多要慢上一倍左右：
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1441178.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【杂谈】年尾做了这件事，我后悔了.......

【杂谈】年尾做了这件事，我后悔了.......

文章目录前言1. 花钱1.1 购买并安装幻兽帕鲁1.2 阿里云服务器 2. 配置3. 游玩4. 总结与感悟4.1 总结4.2 感悟后记幻兽帕鲁多人服务器部署趁着过年放假，一本正经地玩游戏学习服务器部署啦！ 但是，部署完我就后悔了… 前言作为一名游戏…

阅读更多...

shellcode

shellcode

生成shellcode 在漏洞利用中，shellcode是不可或缺的部分，所以在网上有许多公开分享的 shellcode ，在不同平台上并不通用，需要选择适合的shellcode 。这里推荐两个常见公开的安全平台：一个为公开的漏洞库exploit-db&am…

阅读更多...

【汇编】简单的linux汇编语言程序

【汇编】简单的linux汇编语言程序

一、Linux系统汇编语言 Linux系统上的汇编语言可以使用不同的语法风格，主要包括Intel语法和AT&T语法。这两种语法有各自的特点和风格区别，尽管它们表示的底层机器指令相同。下面分别对两种语法进行简要说明： Intel语法 Intel语法是由I…

阅读更多...

深入理解ES的倒排索引

深入理解ES的倒排索引

目录数据写入过程词项字典 term dictionary 倒排表 posting list FOR算法 RBM算法 ArrayContainer BitMapContainer 词项索引 term index 在Elasticsearch中，倒排索引的设计无疑是惊为天人的，下面看下倒排索引的结构。倒排索引分为词项索引【…

阅读更多...

【高频前端面试题--TypeScript篇】

【高频前端面试题--TypeScript篇】

🚀 作者 ：“码上有前” 🚀 文章简介 ：前端高频面试题 🚀 欢迎小伙伴们点赞👍、收藏⭐、留言💬 高频前端面试题--Vue3.0篇什么是TypeScript？TypeScript数据类型TypeScript中命名空…

阅读更多...

[word] word 2010宏已被禁用警告关闭方法 #媒体#学习方法

[word] word 2010宏已被禁用警告关闭方法 #媒体#学习方法

word 2010宏已被禁用警告关闭方法 Word2010宏已被禁用警告关闭方法：在「信任中心设置」选项的宏设置中选择「禁用所有宏，并且不通知」即可。每次打开Word 2010，都会提示「完全警告：宏已被禁用」提示。自从Word 2010安装完毕&am…

阅读更多...

JavaScript鼠标移动事件

JavaScript鼠标移动事件

🧑‍🎓 个人主页：《爱蹦跶的大A阿》 🔥当前正在更新专栏：《VUE》、《JavaScript保姆级教程》、《krpano》、《krpano中文文档》 ✨ 前言鼠标移动是用户界面中非常重要的交互行为。学习区分不同的鼠标移动事…

阅读更多...

Vue事件中如何使用 event 对象

Vue事件中如何使用 event 对象

在Vue中，事件处理函数常常需要获取事件触发时的相关信息，比如鼠标位置、按键信息等。而要获取这些信息，就需要使用event对象。那么在Vue的事件中如何正确使用event对象呢？接下来就来详细介绍一下。首先，在Vue的事件中…

阅读更多...

ChatGLM2-6B模型的win10测试笔记

ChatGLM2-6B模型的win10测试笔记

ChatGLM2-6B介绍： 介绍 ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM2-6B 引入了如下新特性： 更强大的性能：基于 ChatGLM 初…

阅读更多...

#Js篇：js里面递归的理解

#Js篇：js里面递归的理解

定义： 递归是一种编程技术，它是指一个函数在其定义内部调用自身的过程。特点： 一个问题可以分解为更小的问题用同样的方法解决；分解后的子问题求解方式一样，不同的是数据规模变小；存在递归终止条件作…

阅读更多...

前端JavaScript篇之原型链的终点是什么？如何打印出原型链的终点？

前端JavaScript篇之原型链的终点是什么？如何打印出原型链的终点？

目录原型链的终点是什么？如何打印出原型链的终点？ 原型链的终点是什么？如何打印出原型链的终点？ 在 JavaScript 中，原型链是由对象和原型对象组成的链式结构。每个对象都有一个原型对象，并通过 __proto__…

阅读更多...

ruoyi若依框架SpringSecurity实现分析

ruoyi若依框架SpringSecurity实现分析

系列文章 ruoyi若依框架学习笔记-01 ruoyi若依框架分页实现分析 ruoyi若依框架SpringSecurity实现分析文章目录系列文章前言具体分析一、项目中的SpringSecurity版本二、登录认证流程分析三、权限鉴定四、退出登录五、SpringSecurity配置类总结前言在ruoyi-vue若依框…

阅读更多...

JavaScript综合练习2

JavaScript综合练习2

JavaScript 综合练习 2 1. 案例演示 2. 代码实现 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, initial-scale1.0" /><title&…

阅读更多...

docker 基于容器创建本地web容器化镜像

docker 基于容器创建本地web容器化镜像

一、docker 基于容器创建本地web容器化镜像 1、启动指定buysbox 镜像 docker run --name b1 -it busybox:latest 2、创建目录，并创建html mkdir -p /data/html vi index.html 内容自定义例如：<h1>welcome to busybox<h1> 3、新增窗口&am…

阅读更多...

Kubernetes实战(二十七)-HPA实战

Kubernetes实战(二十七)-HPA实战

1 HPA简介 HPA 全称是 Horizontal Pod Autoscaler，用于POD 水平自动伸缩， HPA 可以基于 POD CPU 利用率对 deployment 中的 pod 数量进行自动扩缩容（除了 CPU 也可以基于自定义的指标进行自动扩缩容）。pod 自动缩放不适用于无法…

阅读更多...

ubuntu22.04@laptop OpenCV Get Started: 005_rotate_and_translate_image

ubuntu22.04@laptop OpenCV Get Started: 005_rotate_and_translate_image

ubuntu22.04laptop OpenCV Get Started: 005_rotate_and_translate_image 1. 源由2. translate/rotate应用Demo3 translate_image3.1 C应用Demo3.2 Python应用Demo3.3 平移图像过程 4. rotate_image4.1 C应用Demo4.2 Python应用Demo4.3 旋转图像过程 5. 总结6. 参考资料 1. 源由…

阅读更多...

Seurat - 聚类教程 (1)

Seurat - 聚类教程 (1)

设置 Seurat 对象在本教程[1]中，我们将分析 10X Genomics 免费提供的外周血单核细胞 (PBMC) 数据集。在 Illumina NextSeq 500 上对 2,700 个单细胞进行了测序。可以在此处[2]找到原始数据。我们首先读取数据。 Read10X() 函数从 10X 读取 cellranger 管道的输出&…

阅读更多...

详细分析Redis性能监控指标附参数解释（全）

详细分析Redis性能监控指标附参数解释（全）

目录前言1. 基本指标2. 监控命令3. 实战演示前言对于Redis的相关知识推荐阅读： Redis框架从入门到学精（全）Python操作Redis从入门到精通附代码（全）Redis相关知识 1. 基本指标 Redis 是一个高性能的键值存储系统…

阅读更多...

AWS配置内网EC2服务器上网【图形化配置】

AWS配置内网EC2服务器上网【图形化配置】

第一种方法：创建EC2选择启用分配公网ip 1. 创建vpc 2. 创建子网 3. 创建互联网网关创建互联网网关创建互联网网关 ，设置名称即可然后给网关附加到新建的vpc即可 4. 给新建子网添加路由规则，添加新建的互联网网关然后点击保存更改 5. 新建…

阅读更多...

《MySQL 简易速速上手小册》第4章：数据安全性管理（2024 最新版）

《MySQL 简易速速上手小册》第4章：数据安全性管理（2024 最新版）

文章目录 4.1 用户认证和权限控制4.1.1 基础知识4.1.2 重点案例：使用 Python 管理 MySQL 用户权限4.1.3 拓展案例 4.2 防止 SQL 注入和其他安全威胁4.2.1 基础知识4.2.2 重点案例：使用 Python 和 MySQL 进行安全的数据查询4.2.3 拓展案例 4.3 数据加密和…

阅读更多...

推荐文章

最新文章