Stable Diffusion 提示词攻略

news2025/1/21 5:57:27

一、提示词作用

提示词所做的工作是缩小模型出图的解空间,即缩小生成内容时在模型数据里的检索范围,而非直接指 定作画结果。 提示词的效果也受模型的影响,有些模型对自然语言做特化训练,有些模型对单词标签对做特化训练,那么对不同的提示词语言风格的反应就不同。

二、提示词内容

  • 自然语言,可以使用描述物体的句子作为提示词。大多数情况下英文有效,也可以使用中文。避免复 杂的语法。
  • 单词标签,可以使用逗号隔开的单词作为提示词。一般使用普通常见的单词。单词的风格要和图像的 整体风格搭配,否则会出现混杂的风格或噪点。避免出现拼写错误。 可参考 Tags | Danbooru (donmai.us)
  • Emoji、颜文字 Emoji ( ) 表情符号也是可以使用并且非常准确的。因为 Emoji 只有一个字符,所以 在语义准确度上表现良好。关于 emoji 的确切含义,可以参考 Emoji List, v15.0 (unicode.org),同 时 Emoji 在构图上有影响。

对于使用 Danbooru 数据的模型来说,可以使用西式颜文字在一定程度上控制出图的表情。如::-) 微笑 :-( 不悦 ;-) 使眼色 :-D 开心 :-P 吐舌头 :-C 很悲伤 :-O 惊讶 张大口 :-/ 怀疑 

三、提示词语法

多个提示词之间使用英文半角符号 [ , ],如:

masterpiece, best quality, ultra-detailed, illustration, close-up, straight on, face focus, 1girl, white hair, golden eyes, long hair, halo, angel wings, serene expression, looking at viewer

 一般而言,概念性的、大范围的、风格化的关键词写在前面,叙述画面内容的关键词其次,最后是描述 细节的关键词,大致顺序如:

(画面质量提示词), (画面主题内容)(风格), (相关艺术家), (其他细节)

提示词的顺序很重要,越靠后的权重越 低。关键词最好具有特异性,譬如 Anime(动漫)一词就相对泛化,而 Jojo 一词就能清晰地指向 Jojo 动漫 的画风。措辞越不抽象越好,尽可能避免留下解释空间的措辞 

提示词的权重:

  • (word) - 将权重提高 1.1 倍
  • ((word)) - 将权重提高 1.21 倍(= 1.1 * 1.1)
  • [word] - 将权重降低至原先的 90.91%
  • (word:1.5) - 将权重提高 1.5 倍
  • (word:0.25) - 将权重减少为原先的 25%

( n ) = ( n : 1.1 ) (( n )) = ( n : 1.21 ) ((( n ))) = ( n : 1.331 ) (((( n )))) = ( n : 1.4641 ) ((((( n )))) = ( n : 1.61051 ) (((((( n )))))) = ( n : 1.771561 )

请注意,权重值最好不要超过 1.5。

还可以通过 Prompt Editing 使得 AI 在不同的步数生成不一样的内容,譬如在某阶段后,绘制的主体由 男人变成女人。

语法为:

[to:when] 在指定数量的 step 后,将to处的提示词添加到提示
[from::when] 在指定数量的 step 后从提示中删除 from处的提示词
[from:to:when] 在指定数量的 step 后将 from处的提示词替换为 to处的提示词

 例如: a [fantasy:cyberpunk:16] landscape 在一开始,读入的提示词为: the model will be drawing a fantasy landscape. 在第 16 步之后,提示词将被替换为:a cyberpunk landscape, 它将 继续在之前的图像上计算 又例如,对于提示词为: fantasy landscape with a [mountain:lake:0.25] and [an oak:a christmas tree:0.75][ in foreground::0.6][ in background:0.25][shoddy:masterful:0.5],100 步 采样, 一开始。提示词为: fantasy landscape with a mountain and an oak in foreground shoddy 在第 25 步后,提示词为: fantasy landscape with a lake and an oak in foreground in background shoddy 在第 50 步后,提示词为:fantasy landscape with a lake and an oak in foreground in background masterful 在第 60 步后,提示词为:fantasy landscape with a lake and an oak in background masterful 在第 75 步后,提示词为:fantasy landscape with a lake and a christmas tree in background masterful

提示词还可以轮转,譬如:

[cow|horse] in a field

在第一步时,提示词为“cow in a field”; 在第二步时,提示词为"horse in a field."; 在第三步时,提示 词为"cow in a field" ,以此类推

四、提示词模板

可参考 Civitai | Stable Diffusion models, embeddings, hypernetworks and more中优秀作品的提示词 作为模板。

类似的网站还有:

  • Majinai: MajinAI | Home
  • 词图: 词图 PromptTool - AI 绘画资料管理网站
  • Black Lily: black_ lily Danbooru 标签超市:
  • Danbooru 标签超市 魔咒百科词典:
  • 魔咒百科词典 AI 词汇加速器:
  • AI 词汇加速器 AcceleratorI Prompt NovelAI 魔导书:
  • NovelAI 魔导书 鳖哲法典:
  • 鳖哲法典
  • Danbooru tag: Tag Groups Wiki | Danbooru (donmai.us) AIBooru:
  • AIBooru: Anime Image Board

五、提示词准则

指令的三段式表达:

第一段:画面质量:高清的、最好的质量、照片式、画面风格:如油画、写实、卡通;著名艺术家:如毕加索、达芬奇
第二段:画面主体,主体细节概括。主体可以是人、事、物、景,是画面核心内容,描述物体主要特征,主要动作,主要材质如布料、玻璃,主要景色或景色框架等
第三段:场景设定,光影、摄影机、构图与景别:如对称、特写、全景

注:表达尽可能清晰、详细,加上修饰语会

提示词基本准则:

  • 同一指令,不同的模型库、不同的参数形成的效果不一样
  • 越靠前的权重越大;比如景色在前,人物就会小,相反的人物会变大或半身。
  • 生成图片的大小会影响指令的效果,图片越大需要的指令越多,指令会相互污染。
     

可以参考着几个要素去写提示词:

性别国籍或肤色年龄景别服装 姿势表情发型环境画质
1girlRussian20 years oldupper bodycoatstandingsmilelong hairstreethigh quality

比如:1 girl waring skirt, standing, upper body, masterpiece, high quality, highres

 切断提示词污染:
有时候关键词之间会产生互相影响的问题,比如(1个女孩,红色帽子,蓝色大衣):

1 girl, red hat, blue coat
它可能会生成穿红色外套,蓝色帽子;这是可以用BREAK进行阻断
1 girl, red hat BREAK blue coat
它就能大大提高提示词的准确度

反向提示词模型:https://civitai.com/models/4629/deep-negative-v1x

mv ng_deepnegative_v1_75t.pt stable-diffusion-webui/embeddings/

 选择Textual Inversion,并且单击,则反向提示词就包含了模型的。

 六、提示词插件

https://gitee.com/physton/sd-webui-prompt-all-in-one.git
可以在这里进行安装:

 也可以直接下载下来,然后解压到extensions文件夹中

下载好后重新加载UI

重启后出现的界面

新的界面查看

选择翻译API,测试查看可用翻译API 

七、案例

通过旗袍美女大模型-Checkpoint-LiblibAI模型进行测试

7.1 指令的三段式描述

1、画面设定:画面质量、画面风格
(高清晰、写实、照片、3D、卡通)
2、画面主体,主体细节,场景布置
(人、事、物、景)
3、 艺术效果指令
(光线、景别、沟通)

7.2 风格和画质指令

modelshoot style,(best quality,masterpiece:1.1), (realistic:1.4), full shot body photo of the most beautiful artwork in the world,intricate elegant, (highly detailed),sharp focus, dramatic,photorealistic

模型拍摄风格,(最佳质量,杰作:1.1),(真实感: 1.4) ,世界上最美艺术品的全拍身体照片,复杂优雅,(高度详细),清晰聚焦,戏剧化,照片真实感

7.3 主体指令

A beautiful Miss,Chinese,(High Detail ),smile,qipao,(Fashion:1.1), Chinese traditional texture, purple,high-heeled shoes,In the lobby,Screen window, corridor,Curtains of fluttering yarn

美丽的小姐,中国, (高细节) ,微笑,旗袍, (时尚: 1.1) ,中国传统质地,紫色,高跟鞋,在大堂,纱窗,走廊,飘动的纱窗帘

7.4 艺术表达指令

(full-body picture),((Mottled light and shadow,warm light ,depth of field)),Wide angle view

(全身照片)、(斑驳的光影,暖光、景深),广角视图

7.5 通过测试下来

1、画幅大小影响画面效果
2、指令会相互污染
3、权重非常重要
4、人工智能有较强的自我学习能力

推荐:

AI模特绘画提示词表格:腾讯文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1957773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Lumos学习王佩丰Excel第八讲:IF函数逻辑判断

本节课与数学无关,与逻辑强相关。这节课对理工科,尤其是对有计算机基础的同学们会很友好。 一、使用IF函数 1、IF函数的基本用法 函数语法:IF(logical_test,[value_if_true],[value_if_false]) logical_test:判断条件 [value…

现在有什么赛道可以干到退休?

最近,一则“90后无论男女都得65岁以后退休”的消息在多个网络平台流传,也不知道是真是假,好巧不巧今天刷热点的时候又看到一条这样的热点:现在有什么赛道可以干到退休? 点进去看了几条热评,第一条热评说的…

品牌控价:维护市场秩序的关键策略

在当今竞争激烈的市场环境中,品牌控价成为了品牌发展的重要环节。品牌在拓展销售渠道时,为确保自身的形象与利益,通常会为经销商设定出货价和建议零售价。然而,部分经销商为追求短期利益,在电商平台上进行低价引流&…

Ollama怎么启动.gguf 大模型

环境: Llama3-8B 问题描述: Ollama怎么启动.gguf 大模型 解决方案: 要使用 Ollama 启动 .gguf 大模型,你可以按照以下步骤操作: 创建 Modelfile:首先,创建一个名为 Modelfile 的文件&…

【C++BFS算法】886. 可能的二分法

本文涉及的点 CBFS算法 LeetCod886. 可能的二分法 给定一组 n 人(编号为 1, 2, …, n), 我们想把每个人分进任意大小的两组。每个人都可能不喜欢其他人,那么他们不应该属于同一组。 给定整数 n 和数组 dislikes ,其…

高效工作流:用Mermaid绘制你的专属流程图;如何在Vue3中导入mermaid绘制流程图

目录 高效工作流:用Mermaid绘制你的专属流程图 一、流程图的使用场景 1.1、流程图flowChart 1.2、使用场景 二、如何使用mermaid画出优雅的流程图 2.1、流程图添加图名 2.2、定义图类型与方向 2.3、节点形状定义 2.3.1、规定语法 2.3.2、不同节点案例 2.…

【C语言】整数类型及其数值范围(截断+数据)

🦄个人主页:小米里的大麦-CSDN博客 🎏所属专栏:https://blog.csdn.net/huangcancan666/category_12718530.html ⚙️操作环境:Visual Studio 2022 目录 一、介绍 二、整数类型表 1.分析 2.小结 三、截断 1.什么是截断? 2.为什么需要截断…

【刷题汇总 -- 笨小猴、 主持人调度(一)、分割等和子集】

C日常刷题积累 今日刷题汇总 - day0251、笨小猴1.1、题目1.2、思路1.3、程序实现 2、主持人调度(一)2.1、题目2.2、思路2.3、程序实现 3、分割等和子集3.1、题目3.2、思路3.3、程序实现 -- 0/1背包问题 4、题目链接 今日刷题汇总 - day025 1、笨小猴 1…

JAW:一款针对客户端JavaScript的图形化安全分析框架

关于JAW JAW是一款针对客户端JavaScript的图形化安全分析框架,该工具基于esprima解析器和EsTree SpiderMonkey Spec实现其功能,广大研究人员可以使用该工具分析Web应用程序和基于JavaScript的客户端程序的安全性。 工具特性 1、动态可扩展的框架&#x…

设计模式7原则

链接:设计模式7原则 (qq.com) 设计模式7原则JAVA代码实现 (qq.com)

2024年7月29日(web nginx)

web 一、web基本概念和常识 Web:为用户提供的一种在互联网上浏览信息的服务,Web服务是动态的、可交互的、跨平台的和图形化的。 Web 服务为用户提供各种互联网服务,这些服务包括信息浏览服务,以及各种交互式服务,包括聊天、购物、学习等等内容。 Web 应用开发也经过了几代技术…

Linux基础复习(五)

前言 本文介绍了Linux常用命令,接Linux基础复习(四) 一、常用命令 命令通配符 在Linux中,命令通配符(也称为通配符模式或通配符表达式)是用来匹配文件名或其他字符串的一种特殊字符。这些通配符可以帮助…

leetcode日记(61)矩阵置零

看起来很简单的题目,最简单粗暴的方法是建立两个数组记录需要置零的行和列,但是题目中有一个进阶版要求: 进阶: 一个直观的解决方案是使用 O(mn) 的额外空间,但这并不是一个好的解决方案。一个简单的改进方案是使用 O…

VC14(VC2015)安装失败报错0x80240017

百度网盘链接:https://pan.baidu.com/s/1ybBriAXfxtvLvk7ve2zwIg?pwd1111 提取码:1111 必须按以下顺序安装: clearcompressionflag.exe、KB2919355、KB2932046、KB2959977、KB2937592、KB2938439、KB2934018。 KB2919442 是 Windows 8.1 更…

【根据字符出现频率排序】python刷题记录

R2-字符串算法 包哈希表的呀。 注意 class Solution:def frequencySort(self, s: str) -> str:dictdefaultdict(list)#字符串不能直接排序,需要转换为列表["a","b","c"]slist(s)for str in s:if not dict[str]:dict[str]1else:…

扫码登录方案

以哔哩哔哩扫码登录为例 二维码解码后内容为:https://passport.bilibili.com/h5-app/passport/login/scan?navhide1&qrcode_keye60869ce7f5235c7123175a7effc6f90&frommain-fe-header 扫码登陆,利用已登录设备授权未登录设备登录的方式 扫码…

android settings提示音开关状态与修改(一)

android系统&#xff0c;settings提示音类型&#xff1a; 提示音开关默认状态&#xff0c;定义文件&#xff1a; frameworks/base/packages/SettingsProvider/res/values/defaults.xml 提示音默认定义&#xff1a; // 锁屏提示音 <integer name"def_lockscreen_sounds_…

前端canvas——贝塞尔曲线

曲线之美&#xff0c;不在于曲线本身&#xff0c;而在于用的人。 所以就有了这期贝塞尔曲线。 新规矩&#xff0c;先上个GIT。 效果图 开局一张图&#xff0c;代码全靠编。 代码 画骨 先想着怎么画一个心形吧&#xff0c;等你想好了&#xff0c;就知道怎么画了。 首先就还…

知识图谱增强的RAG(KG-RAG)详细解析

转自&#xff1a;知识图谱科技 这是一个与任务无关的框架&#xff0c;它将知识图谱&#xff08;KG&#xff09;的显性知识与大型语言模型&#xff08;LLM&#xff09;的隐含知识结合起来。这是该工作的arXiv预印本 https://arxiv.org/abs/2311.17330 。 我们在这里利用一个名为…