文生图模型之Stable Diffusion

news2024/9/25 1:24:09

原始文章地址

autoencoder在这里插入图片描述

CLIP text encoder

tokenizer最大长度为77(CLIP训练时所采用的设置),当输入text的tokens数量超过77后,将进行截断,如果不足则进行paddings,这样将保证无论输入任何长度的文本(甚至是空文本)都得到77x768大小的特征

问题:当输出超长prompt会分段处理?每段的权重如何处理?

UNet

text condition将通过CrossAttention模块嵌入进来,此时Attention的query是UNet的中间特征,而key和value则是text embeddings。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

SD图生图

在这里插入图片描述

SD Inpainting

第一种形式:
在这里插入图片描述
第二种形式:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/930533.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue2向Vue3过度核心技术综合案例

目录 1 面经基础版-案例效果分析1.面经效果演示2.功能分析3.实现思路分析:配置路由功能实现 2 面经基础版-一级路由配置3 面经基础版-二级路由配置1.使用场景2.语法3.代码实现 4 面经基础版-二级导航高亮1.实现思路2.代码实现 5 面经基础版-首页请求渲染1.步骤分析2…

新开通的抖店体验分太低,达人不愿意合作怎么办?解决办法如下

我是王路飞。 找达人带货的玩法是最适合新手抖店商家的,同时也是最适合长线去玩的方法。 但是新手前期找达人的时候,会有一个难点,就是自己的抖店因为是新开通的,所以要么没体验分,要么就是体验分太低了,…

崔东树:汽车行业正在迎来令人兴奋的时代,智能座舱推动私车普及

随着新能源汽车和智能座舱的不断发展,汽车行业正经历着一场革命性的变革。当前,不仅汽车电动化的进程在加速推进,智能座舱的升级与完善也成为了行业的热点话题。崔东树指出,随着汽车电动化和智能化的发展,智能座舱的快…

学习高等数学需要的初等数学知识

文章目录 名词解释常用希腊字符读音幂、根式和对数常用的三角函数值三角函数变换一元二次方程求解充分条件和必要条件切线方程、斜率和法线隐函数极坐标排列组合 名词解释 教材中存在着许多熟悉且陌生的词汇,作者在此进行了整理: 概念:概念…

开始MySQL之路—— DDL语法、DML语法、DQL语法基本操作详解

DDL语法 DDL(Data Definition Language) 数据定义语言,该语言部分包括以下内容。 对数据库的常用操作 对表结构的常用操作 修改表结构 对数据库的常用操作 1: 查看当前所有的数据库 show databases; 2:创建数据库 create dat…

Linux下的Shell基础——流程控制(三)

前言: 每门编程都有它独特的语法,比如C语言,Java等编程语言,有相同的地方也有自己独特的地方,但都离不开变量、运算符,条件判断、循环和函数这几个地方的学习,下面就让我们学习一下shell编程里…

CRM软件的功能与报价如何制定?

CRM软件很贵吗?CRM价格与系统功能、部署方式、用户数量、附加服务等有关。当然,不同的CRM厂商,也会有不同的定价模式。下面我们就来说说决定CRM系统报价的几个因素。 系统功能: CRM软件的功能越全面、越强大,其定价也…

携手共进:OpenAI与ScaleAI开展合作,为企业增强GPT模型微调功能

8 月 26 日消息,OpenAI 近日发布新闻,除了与Scale AI 展开深度合作外,OpenAI 还宣布他们计划扩展GPT系列的大语言模型。通过与Scale AI 的合作,OpenAI 能够在企业环境中定制GPT-3.5 Turbo和即将发布的GPT-4,以满足不同…

Typora上使用Mermaid语法展示流程图、时序图、甘特图

你已经安装Typora并打开了一个新文档后,可以按照以下详细步骤在Typora上使用Mermaid语法展示流程图、时序图、甘特图 流程图 使用graph LR声明开始,并使用箭头和连接符号定义节点之间的关系。例如,A --> B表示从节点A指向节点B的箭头连接。graph TB A[界面布局图] -->…

npm 卸载 vuecli后还是存在

运行了npm uninstall vue-cli -g,之后是up to date in,然后vue -V,版本号一直都在,说明没有卸载掉 1、执行全局卸载命令 npm uninstall vue-cli -g 2、删除vue原始文件 查看文件位置,找到文件删掉 where vue 3、再…

魏副业而战:闲鱼卖货做什么类目好?

我是魏哥,与其躺平,不如魏副业而战! 做闲鱼,有人做高客单价的,也有人做低客单价的。 之前魏哥有做宠物产品,利润低,每单赚几元,做的很累,但做过一段时间后发现有很多复…

左耳朵耗子:TCP 的那些事儿(上)

原文地址:https://coolshell.cn/articles/11564.html TCP是一个巨复杂的协议,因为他要解决很多问题,而这些问题又带出了很多子问题和阴暗面。所以学习TCP本身是个比较痛苦的过程,但对于学习的过程却能让人有很多收获。关于TCP这个…

nrm管理源仓库及发布私人npm包

使用nrm管理源及切换源仓库 1.安装nrm源管理器 npm install nrm -g2.查看目前现有的源仓库 通过 nrm ls 查看现有的源 nrm ls 输出:这是目前现有的源 3.切换不同的源 可以通过 nrm use xxx(源仓库名)来切换不同的源地址 nrm use taobao…

激活函数总结(二十):激活函数补充(SQNL、PLU)

激活函数总结(二十):激活函数补充 1 引言2 激活函数2.1 Square nonlinearity (SQNL)激活函数2.2 Piecewise Linear Unit (PLU)激活函数 3. 总结 1 引言 在前面的文章中已经介绍了介绍了一系列激活函数 (Sigmoid、Tanh、ReLU、Leaky ReLU、PR…

【Android】相对布局(RelativeLayout)最全解析

【Android】相对布局(RelativeLayout)最全解析 一、相对布局(RelativeLayout)概述二、根据父容器定位三、根据兄弟控件定位 一、相对布局(RelativeLayout)概述 相对布局(RelativeLayout&#x…

Xtrfy M42W鼠标说明书

下载:https://wwtf.lanzoul.com/ikXQh16gnmpe 密码:8h5t

OpenCV实战(基础知识三)

简介 OpenCV是一个流行的开源计算机视觉库,由英特尔公司发起发展。它提供了超过2500个优化算法和许多工具包,可用于灰度、彩色、深度、基于特征和运动跟踪等的图像处理和计算机视觉应用。OpenCV主要使用C语言编写,同时也支持Python、Java、C…

RocketMQ零拷贝原理

1 PageCache ●由内存中的物理page组成,其内容对应磁盘上的block。 ●page cache的大小是动态变化的。 ●backing store:cache缓存的存储设备。 ●一个page通常包含多个block,而block不一定是连续的。 1.1读Cache ●当内核发起一个读请求时&#x…

Meta发布AI编码工具,或可实现智能生成代码和调试代码

据悉,日前Meta推出名为 Code Llama 的AI编码工具,号称“最先进的大型编码语言模型”。 该模型基于Llama 2大型语言模型打造,可以理解为“Llama 2 的写代码专用版”,能够“生成新的代码并调试人类编写的工作”,目前已上…

Mycat事务补偿设计

1.概述 在使用数据分片场景下,单库下的事务处理无法满足系统的需求,因而需要进行分布式事务处理设计。 2.主要方案对比分析 处理分布式场景下的事务有很多种方案,主要方案如下表所示: 主要技术 优点 缺点 适用场景 XA with 2PC (JTA)、…