AI 绘画Stable Diffusion 研究（十六）SD Hypernetwork详解

AI 绘画Stable Diffusion 研究（十六）SD Hypernetwork详解

news2025/2/22 0:32:17

大家好，我是风雨无阻。

本期内容：

什么是 Hypernetwork？
Hypernetwork 与其他模型的区别？
Hypernetwork 原理
Hypernetwork 如何下载安装？
Hypernetwork 如何使用？

在上一篇文章中，我们详细介绍了 embedding 的定义、作用以及如何安装使用，相信看过的朋友都知道，embedding 是属于一种将提示词打包的模型微调技术。感兴趣的朋友，可以前往查看：AI 绘画Stable Diffusion 研究（十五）SD Embedding详解。

其实今天要讲到的 Hypernetwork 和 embedding 甚至和后面我们即将介绍的 Lora 模型一样，也属于一种模型微调技术。

Hypernetwork 其实并不是我们介绍的一个重点知识，我们只需要了解这个微调技术的原理和使用方法即可！

主要有以下原因：

Hypernetwork是一个比Lora更早的模型微调技术，现在使用的人数越来越少。

我们在c站筛选Hypernetwork，只有33个Hypernetwork文件。

在这里插入图片描述

Hypernetwork使用效果并不理想，甚至还不如体积只有几k的embeddings文件，但是Hypernetwork的文件体积却可以与lora相提并论，在几十M甚至上百M。

在这里插入图片描述

Hypernetwork可以实现的效果，用其他的替代方式几乎都可以实现，比如用embeddings或者用lora。

1、什么是 Hypernetwork？

Hypernetwork 中文名（超网络），最初由stable diffusion 早期使用者 NovelAI开发，它是一个附加到stable diffusion模型的小型神经网络，用于修改其风格。

2、Hypernetwork 与其他模型的区别

Hypernetwork VS Checkpoint（大模型）

Checkpoint模型包含生成图像的所有必要信息，我们可以通过其文件大小来识别，Checkpoint 它们的体积范围从 2 GB 到 7 GB不等，Hypernetwork通常低于 200 MB。

Hypernetwork无法单独使用，它需要与checkpoint模型配合来生成图像。

Hypernetwork VS LoRA模型

Hypernetwork与LoRA 模型很相似，它们的文件大小相似，通常低于 200MB，都比checkpoint模型小。

有一个事实是：LoRA 模型比Hypernetwork模型效果更好。
Hypernetwork VS Embeddings

Embeddings是一种称为Textual Inversion”文本反转”的微调方法，它只是定义新的关键字来实现某些样式。与 HypernetworkEmbeddings一样，不会改变模型Embeddings和Hypernetwork适用于stable diffusion模型的不同部分。

Embeddings在文本编码器中创建新的嵌入。

Hypernetwork将一个小型网络插入噪声预测器的cross-attention模块中。

3、Hypernetwork 的下载安装

这里我们以c站下载Hypernetwork 模型为例进行说明。

第一步，浏览器中打开c站，搜索 Hypernetwork

在这里插入图片描述

第二步，选择喜欢的 Hypernetwork模型，下载即可

我们这里以下载这个 Hypernetwork模型演示，如下：

在这里插入图片描述

下载完成，得到waterElemental_10.pt 文件

第三步，将这个模型文件拷贝到 \sd-webui-aki-v4.2\models\hypernetworks 目录

\sd-webui-aki-v4.2\models\hypernetworks

在这里插入图片描述

重新启动 stable diffusion 使其生效。

4、Hypernetwork 的使用

Hypernetwork的使用方式与Embeddings 类似，区别是 Hypernetwork 用在正向提示词中，而Embeddings 是用在反向提示词中。

我们的按钮使用的 Hypernetwork 模型是：

Water Elemental(水元素)

Water Elemental(水元素)是一个独特的超网络，可以将任何东西变成水!

在主题之前使用短语water elementa"可以将此超网络与Stable Diffusion v1.5结合使用，更改超网络权重以调整水效果。

(1)、设置正向提示词

water elemental woman walking across a busy street

(2)、选择 Water Elemental Hypernetwork 模型
在这里插入图片描述

选择 Water Elemental Hypernetwork 模型后，在正向提示词里面会自动添加：

在这里插入图片描述

(3)、设置参数

采样算法：DPM++2M Karras
迭代步数：15
CFG Scale: 7

在这里插入图片描述

（4）、点击按钮，效果如下：

在这里插入图片描述

好了，今天的内容就分享到这里，后面我们将持续分享有关 Stable Diffusion 的干货，喜欢的朋友请关注我，我们下次再见。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/930569.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

如何开发小程序 3 个月赚 6.18 元

如何开发小程序 3 个月赚 6.18 元

前言随着 Ai 的崛起，开发者的就业也越来越困难，好像疫情放开后整个世界都变了，全球都在经历经济下行的压力。那么作为个人开发者如何在工作之余获取额外收入呢？笔者也是个一般开发者，没有牛逼的技术实力，…

阅读更多...

rust交叉编译在mac下编译linux和windows

rust交叉编译在mac下编译linux和windows

系统版本macbook proVentura 13.5linux ubuntu22.04.3 LTS/18.04.6 LTSwindowswindows 10 专业版 20H2mac下rustc --versionrustc 1.74.0-nightly (58eefc33a 2023-08-24)查看当前系统支持的交叉编译指定系统版本列表 rustup target list如果已经安装这里会显示（installed）。…

阅读更多...

Zuul：路由网关

Zuul：路由网关

话不多说上实战先建一个子模块 pom <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://m…

阅读更多...

深入浅出AXI4协议（1）——概述

深入浅出AXI4协议（1）——概述

写在前面从这篇文章开始，我们将正式进入AXI4协议的学习，在xilinx系列的FPGA中，AXI4协议的使用是非常广泛的，很多的IP核都会支持AXI接口，而如果使用的是zynq系列，那AXI协议的学习更是重中之重。但是作为一款…

阅读更多...

Weblogic漏洞（一）之 Weblogic基本介绍

Weblogic漏洞（一）之 Weblogic基本介绍

Weblogic基本介绍 WebLogic是美国Oracle公司出品的一个application server，确切的说是一个基于JAVAEE架构的中间件，WebLogic是用于开发、集成、部署和管理大型分布式Web应用、网络应用和数据库应用的Java应用服务器。将Java的动态功能和Java Enterprise…

阅读更多...

【数据结构】栈（Stack）的应用场景

【数据结构】栈（Stack）的应用场景

文章目录 🌏前言🍀改变元素的序列🚩场景一📌解析： 🚩场景二📌解析： 🎍将递归转化为循环🌳[括号匹配](https://leetcode.cn/problems/valid-parentheses/)&…

阅读更多...

指针-C语言（初阶）

指针-C语言（初阶）

目录一、什么是指针二、指针和指针类型 2.1 指针-整数 2.2 指针的解引用三、野指针 3.1 野指针形成原因 3.2 如何规避野指针四、指针运算 4.1 指针-整数 4.2 指针-指针 4.3 指针的关系运算五、指针和数组六、二级指针七、指针数组一、什么是指针指针是内存中一个…

阅读更多...

k-近邻算法概述,k-means与k-NN的区别对比

k-近邻算法概述,k-means与k-NN的区别对比

目录 k-近邻算法概述 k-近邻算法细节 k值的选取分类器的决策 k-means与k-NN的区别对比 k-近邻算法概述 k近邻（k-nearest neighbor, k-NN）算法由 Cover 和 Hart 于1968年提出，是一种简单的分类方法。通俗来说，就是给定一个…

阅读更多...

Linux操作系统--网络配置(2)

Linux操作系统--网络配置(2)

在上一次课程中，我们对Linux课程中的网络有了一个了解，下面我们来看看如何配置网络IP。 1.配置网络IP地址在Linux操作系统中，比如搭建集群，这一个时候如果使用DHCP实现动态IP的分配，那么如果需要访问管理其中一个节点操作时候，就需要通过其IP访问。这一个时候还得去查看…

阅读更多...

十五、systemctl命令如何使用？

十五、systemctl命令如何使用？

在Linux系统中，一些内置服务可以通过systemctl控制，部分第三方软件也可以通过systemctl控制。 1、基础语法 start：开启服务； stop：关闭服务； status：查看服务当前状态； enable&a…

阅读更多...

【推荐】Spring与Mybatis集成整合

【推荐】Spring与Mybatis集成整合

目录 1.概述 2.集成 2.1代码演示： 3.整合 3.1概述 3.2 进行整合分页接着上两篇，我已经写了Mybatis动态之灵活使用，mybatis的分页和特殊字符的使用方式接下来把它们集成起来，是如何的呢👇👇&#x1…

阅读更多...

Stm32的时钟系统以及使用SysTick滴答定时器实现延时

Stm32的时钟系统以及使用SysTick滴答定时器实现延时

前言 STM32的时钟系统由多个时钟源和时钟树组成时钟源包括主时钟源（HSE）、内部高速时钟源（HSI）、内部低速时钟源（LSI）和外部低速时钟源（LSE）。时钟树由多个时钟分频器和时钟门控器组…

阅读更多...

五、多表查询-2.概述分类

五、多表查询-2.概述分类

一、多表查询概述二、演示 1、准备数据 （1）创建emp1表并注入数据，添加外键： 2、多表查询一共 102条数据：17个员工，6个部门，176102 3、消除笛卡尔积一共16条记录： 为啥17个员工&…

阅读更多...

Aos插件实现滚动动画效果

Aos插件实现滚动动画效果

aos文档 aos使用感受跟wow相似，但比wow多了浏览器回滚，动画效果会再次展现安装 npm install aos使用 main.js全局导入css import aos/dist/aos.cssvue文件 <template><div class"box"><div class"code" v-for&q…

阅读更多...

Java接收json参数

Java接收json参数

JSON 并不是唯一能够实现在互联网中传输数据的方式，除此之外还有一种 XML 格式。JSON 和 XML 能够执行许多相同的任务，那么我们为什么要使用 JSON，而不是 XML 呢？ 之所以使用 JSON，最主要的原因是 JavaScript。众所周知…

阅读更多...

搭建 Qt6 开发环境

搭建 Qt6 开发环境

作者： 一去、二三里个人微信号： iwaleon 微信公众号： 高效程序员 Qt 是一个跨平台的 C 应用程序开发框架，它提供了丰富的组件库和工具，使得开发人员可以在各种平台上轻松地开发 GUI 应用程序。由于我们的教程《细说…

阅读更多...

嵌入式设备应用开发（发现需求和提升价值）

嵌入式设备应用开发（发现需求和提升价值）

【声明：版权所有，欢迎转载，请勿用于商业用途。联系信箱：feixiaoxing @163.com】很多做技术的同学，都会陷入到技术的窠臼之中。对于如何做具体的产品、实现具体的技术，他们可能很感兴趣。但是做出来的东西做什么用，或者说是有没有竞争力，事实上他们不是很关心…

阅读更多...

$二叉搜索树-----红黑树$

二叉搜索树-----红黑树

✅<1>主页：我的代码爱吃辣📃<2>知识讲解：数据结构——红黑树☂️<3>开发环境：Visual Studio 2022💬<4>前言：红黑树也是一颗二叉搜索树，其作为map，set的底层…

阅读更多...

AttributeError: module ‘torchvision.io.image‘ has no attribute ‘ImageReadMode‘

AttributeError: module ‘torchvision.io.image‘ has no attribute ‘ImageReadMode‘

我的torch和torchvision版本 import torch torch.__version__‘1.7.1cu110’ import torchvision torchvision.__version__‘0.8.2cu110’ 原代码 mode torchvision.io.image.ImageReadMode.RGB labels.append(torchvision.io.read_image(os.path.join(voc_dir, Segmentat…

阅读更多...

文生图模型之Stable Diffusion

文生图模型之Stable Diffusion

原始文章地址 autoencoder CLIP text encoder tokenizer最大长度为77（CLIP训练时所采用的设置），当输入text的tokens数量超过77后，将进行截断，如果不足则进行paddings，这样将保证无论输入任何长度的文本&…

阅读更多...

推荐文章

最新文章