(二) AIGC—Stable Difussion （1）

news2025/7/16 9:19:20

1. 前置知识

目前通用的图像生成模型一般包含三个组件：

Text Encoder 根据文字生成向量
生成模型根据向量和Noise 生成缩小版本的图像
Image Decoder 根据小分辨率图像生成大分辨率图像

2. Text Encoder

在这里插入图片描述
文字的Encoder对于结果的影响很大，增大Diffusion Model对结果的影响比较有限。

在这里插入图片描述

FID : 衡量一个图像好坏的一个标准,需要sample很多的Image进行标准衡量
CLIP-Score : 也是一个衡量标准，如下图，两个encoder生成出来的向量距离远近

在这里插入图片描述

3. Decoder

额外的Decoder不需要piar的资料，只需要图像就可以把Decoder训练出来

在这里插入图片描述

Imagen用到就是把小图当作中间产物，Stable Diffusion和DALL-E把latent representation当作中间产物

4. Generative Model

在这里插入图片描述

在这里插入图片描述
Midjourney 生图的时候，从模糊到清楚，其原理就是把每次Denoise的中间产物经过Decoder再次加工，所以可以看到比较清楚，而不是噪声

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/455665.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

华为p60系列超级快充 Turbo技术，轻松搞定充电困扰！

随着手机的功能越来越丰富，电量消耗也越来越快，当手机电量剩余20%时，是否有电量焦虑。为了满足大家快速充电的需求，华为P60系列配备了超级快充Turbo充电技术，让我们手机充电更快，用的更久，从此告…

Python爬虫解读

爬虫： Python爬虫是指利用计算机程序或者脚本自动抓取网站数据的一种行为，通常是为了提取网站数据或者进行数据分析等目的。 Python 爬虫可以分为手动爬虫和自动爬虫两种。手动爬虫是指完全由人工编写代码来实现的爬虫，这种方式需要编写大量的…

ES使用小结

ES使用总结 1.查询es全部索2.根据es索引查询文档3.查看指定索引mapping文件4.默认查询总数10000条5.删除指定索引文档6.删除所有数据包括索引7.設置窗口值8. logstash简单配置Logstash配置：logstash 控制台输出 9. filebenat配置 1.查询es全部索 localhost:9200/_c…

为什么说网络安全行业是IT行业最后的红利？

前言 2023年网络安全行业的前景看起来非常乐观。根据当前的趋势和发展，一些趋势和发展可能对2023年网络安全行业产生影响： 5G技术的广泛应用：5G技术的普及将会使互联网的速度更快，同时也将带来更多的网络威胁和安全挑战。网络安全…

DHCP 给内网客户端分配ip地址

~ 为 InsideCli 客户端网络分配地址，地址池范围： 192.168.0.110-192.168.0.190/24； ~ 域名解析服务器：按照实际需求配置 DNS 服务器地址选项； ~ 网关：按照实际需求配置网关地址选项； ~ 为…

JAVAWeb08-手动实现 Tomcat 底层机制+ 自己设计 Servlet

1. 前言先看一个小案例， 引出对 Tomcat 底层实现思考 1.1 完成小案例 ● 快速给小伙伴完成这个小案例 0. 我们准备使用 Maven 来创建一个 WEB 项目, 老师先简单给小伙伴介绍一下 Maven 是什么, 更加详细的使用，我们还会细讲, 现在先使用一把先创建…

【MySQL】带你了解MySQL 如何学习MySQL以及MySQL的用途以及意义

目录 1 MySQL的起源和发展 1.0.1 数据库管理系统 1.1 MySQL的起源命名由来： 1.2 MySQL的发展历程 2 什么是MySQL？ 2.1 数据库 2.1.1 我们之前存储数据的格式： 2.1.2 使用数据库的目的： 2.1.3 数据库分类 2.2 SQL语句 2…

STM32-HAL-串口的printf重定向

一、C语言的格式化输出 C语言的printf是一个标准库函数，用于将格式化的数据输出到标准的输出设备（通常是终端） 基本语法： int printf(const char *format, ...);其中的第一个参数const char *format表示输出格式，后面…

Kubernetes核心组件及资源介绍

文章目录一、Kubernetes架构二、Kubernetes核心组件三、Kubernetes核心资源四、拓展1、Service和Ingress的区别是什么？2、Replicaset和Deployment的区别是什么？3、Deployment和Statefulset的区别是什么？4、Job和Cronjob的区别是什么&#xf…

【FAQ】统一扫码服务常见问题及解答

1.隐私政策是怎么样的？收集哪些信息？ 关于Scan Kit的隐私政策及收集的信息，请查看SDK隐私安全说明。 Android：SDK隐私安全说明 iOS：SDK隐私安全说明 2.如何使用多码识别？多码模式下如何实现指定条码&am…

vue生命周期的理解？

目录标题一、什么是生命周期？二、生命周期的流程图： 一、什么是生命周期？ Vue 实例有一个完整的生命周期，也就是从开始创建、初始化数据、编译版、挂载Dom ->染、更新 ->渲染、卸载等一系列过程，称这是Vue的生…

简单清晰了解B树和B+树

一.学习背景在MySQL的学习中,我们了解到了索引的知识,而关于MySQL索引背后的数据结构,我们在这里进行学习. 首先,我们要了解到的是,MySQL的索引用到的数据结构为B树. 使用B树是因为,在数据量大的时候,内存不够用，大部分数据只能存放在磁盘上，只有需要…

【Linux命令行与Shell脚本编程】第七章 Linux文件权限

Linux命令行与Shell脚本编程第七章 Linux文件权限文章目录 Linux命令行与Shell脚本编程七,Linux文件权限7.1,Linux的安全性7.1.1,用户信息　/etc/passwd文件7.1.2,用户密码 /etc/shadow文件7.1.3,useradd 添加新用户7.1.4,userdel 删除用户7.1.5, 修改用户1,usermod2,passwd…

Hystrix Dashboard图形化监控

👉🏻 SpringCloud 入门实战系列不迷路 👈🏻： SpringCloud 入门实战（一）什么是SpringCloud？SpringCloud 入门实战（二）-SpringCloud项目搭建SpringCloud 入门实…

【云计算•云原生】1.什么是云计算？它为什么这么火？

文章目录 1.云计算基础什么是云计算云计算的分类开源软件、自由软件、免费软件 2.云计算机制云基础设施机制云管理机制云安全机制基本云架构 3.虚拟化技术服务器虚拟化服务器虚拟化技术CPU虚拟化内存虚拟化设备和I/O虚拟化存储虚拟化网络虚拟化桌面虚拟化 KVM 4.网络与存储基础…

90后，第一批接棒白酒的“年轻人”

【潮汐商业评论/原创】又到了每月的公司团建，“团建必喝酒”似乎已经成为了大家的共识。但在酒水的选择上，有红的、啤的、洋的，还有低度果酒，唯独不见听谁说聚会喝白的。当Jason询问为什么没有白酒时，得到了几乎一…

C语言函数大全-- o 开头的函数

C语言函数大全本篇介绍C语言函数大全-- o 开头的函数 1. obstack_init，obstack_free，obstack_alloc，obstack_blank，obstack_grow 1.1 函数说明函数声明函数功能void obstack_init(struct obstack *obstack_ptr);它是 POSIX …

Python采集某网站小sp内容, m3u8内容下载

前言嗨喽~大家好呀，这里是魔王呐 ❤ ~! 环境使用: Python 3.8 Pycharm 模块使用: import requests >>> pip install requests import re 正则表达式解析数据 import json 本次案例所用知识点: python基础语法: 字典创建/取值 print输出函数使用…

【人工智能概论】 RNN、LSTM、GRU简单入门与应用举例、代码耗时计算

【人工智能概论】 RNN、LSTM、GRU简单入门与应用举例、代码耗时计算文章目录【人工智能概论】 RNN、LSTM、GRU简单入门与应用举例、代码耗时计算一. RNN简介1.1 概念简介1.2 方法使用简介二. 编码层embedding2.1 embedding的参数2.2 embedding的理解三. Linear层与CrossEnt…

全景图像算法简述

全景图像拼接是一种将多个图像合成为一个大型全景图像的技术。这种技术广泛应用于虚拟现实、游戏开发、文化遗产保护等领域。本文将介绍三种主流的全景图像拼接算法，并对它们进行综合比较。一、基于特征点匹配的拼接算法特征点匹配是全景图像拼接中最常用的一种算…