Stable Diffusion 使用详解(1)---- 提示词及相关参数

news2024/9/20 18:36:20

目录

背景

提示词

内容提示词

人物及主体特征

场景

环境光照

画幅视角

注意事项及示例

标准化提示词

画质等级

风格与真实性

具体要求

背景处理

光线与色彩

负向提示词

小结

常用工具

另外几个相关参数

迭代步数

宽度与高度

提示词引导系数

图片数量


背景

AI作图提示词其实是一门学问,本质上,如果AI足够智能,其实不会有提示词写法这一说,按照人脑所想即所得的原则,进行无差别障碍的生图才是最终目标。但这之间,就现有技术而言,有着一条难以逾越的鸿沟,就是AI 生图的机制决定了,你在文生图的过程中,提示词需要尽量符合AI 模型能捕捉的原则,这是不得已而为之的做法。未来这条鸿沟应该能跨越,但实现的技术方式需要仰仗LLM及其他领域对人类语言的更深层次理解。现阶段,要想用好AI绘画,特别是文生图,掌握提示词及相关参数的用法是必不可少的。提示词有两大类,一类是内容相关的,一类是画质等绘画要求相关的,比如绘画的风格,清晰度,镜头的长远等。今天主要看下提示词的用法。

提示词

内容提示词

就是指与这个画面相关的提示词,说的越清楚,AI绘制的越到位。

人物及主体特征

  1. 服饰穿搭
    • 示例:white dressjeans and T-shirtbusiness suit
    • 可以通过颜色和款式详细描述服饰。
  2. 发型发色
    • 示例:blonde hairlong curly hairshort black hair
    • 注意描述发型的长度、颜色和卷曲程度。
  3. 五官特点
    • 示例:small eyesbig nosesmiling lips
    • 详细描述面部特征,包括眼睛大小、鼻子形状和嘴唇表情。
  4. 面部表情
    • 示例:smilingserioussad
    • 表情是传达人物情感的重要部分。
  5. 肢体动作
    • 示例:sittingwalkingstretching arms
    • 描述人物的姿态和动作。

场景

  1. 室内/室外
    • 示例:indooroutdoor
    • 初步确定场景的大致环境。
  2. 大场景
    • 示例:forestcitybeach
    • 描述主要场景背景。
  3. 小细节
    • 示例:treebushflower
    • 增添场景中的小元素,使画面更丰富。

环境光照

  1. 白天/黑夜
    • 示例:daynight
    • 确定整体光照的时间段。
  2. 特定时段
    • 示例:morningsunset
    • 细化到具体的时间段,如早晨或日落。
  3. 光环境
    • 示例:sunlightbrightdark
    • 描述整体光线的亮度。
  4. 天空
    • 示例:blue skystarry sky
    • 特定天空的颜色和特征。
  5. 光影效果
    • 示例:soft lightinghard shadowscinematic lighting
    • 详细描述光线的柔和度、阴影的强度和电影般的灯光效果。

画幅视角

  1. 距离
    • 示例:close-updistant
    • 描述镜头与主体的距离。
  2. 人物比例
    • 示例:full bodyupper body
    • 展示人物的整体或局部。
  3. 观察视角
    • 示例:from abovefrom belowfront view
    • 描述观察者的视角位置。
  4. 镜头类型
    • 示例:wide angletelephoto
    • 镜头类型影响画面的构图和透视。

注意事项及示例

需要说明的是,你最好使用英文来描述提示词,虽然有些国内的stable diffusion 应用在上面做了二次开发,支持了中文,但效果毕竟没有原生的好。实际上他的做法也是将中文提示词通过AI等翻译成英文的,所以不如英文来的直接,不对还可以自己调整。

比如我想绘制: ‘一搜木船停泊在碧蓝色的海上,阳光照耀着海水,波光粼粼,很美。’

翻译成提示词:

‘a sleek speedboat moored peacefully at the lower right corner of a sparkling, crystal clear turquoise sea, with sunlight gently kissing the water's surface, causing a shimmering, rippling effect of light and shade, capturing a serene and breathtaking beauty’

标准化提示词


画质等级


best quality:最佳质量
highest quality:最高质量
ultra highres:超高分辨率
highres:高分辨率
extremely detailed:极其详细
ultra-detailed:超详细
highly detailed:高度精细
detailed and intricate:细致而复杂


风格与真实性


photorealistic:照片真实感
realistic:真实感
raw photo:原始照片
professional illustration:专业插图
fine art:美术精品
cinematic:电影级画质


具体要求


masterpiece:杰作
best quality, masterpiece, best quality, ultra highres, ultra-detailed:这些组合词常用于提升图像的整体品质
8k wallpaper:8K高清壁纸,指明输出分辨率
physically-based rendering:基于物理的渲染,模拟真实光照和材质效果


背景处理


detailed background:细致的背景
blurry background:模糊背景
white background:白色背景
这些提示词可以帮助控制图像的背景细节或风格


光线与色彩


虽然不是直接关于画质的提示词,但光线和色彩的处理对画质有很大影响。

例如,perfect lighting、dynamic lighting等提示词可以引导模型生成具有优秀光影效果的图像。


负向提示词


有时,通过避免某些不想要的元素也可以间接提升画质。

例如,no blur、no jpeg artifacts等提示词可以确保图像清晰无伪影。

小结

描述人物
描述场景
描述环境 (时间、光照)
描述画幅视角
其他画面要素
高品质标准化画风
标准化
其他特殊要求

我们改变一些构图权重,看看

我希望看到水质发生一些变化:

a sleek speedboat,parked gracefully,on a (crystal:0.8) (clear:1.3),(turquoise:0.7) blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,

冒号后面的是比例,默认1。 按照我的经验调整不要超过+- 0.5,不然容易走形。

水波更大了,但是我们希望船远一点,于是拉大视角,加入关键词即可。

a sleek speedboat,parked gracefully,on a (crystal:0.8) (clear:1.3),(turquoise:0.7) blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,long zoom,

其实有时候长的短语更能让AI找到意境,因为一个逗号表示一个完整信息,如果这个信息比较足,他会走位一个整体考虑,同时整个场景需要他考虑的事情会比那种一直满篇都是逗号的可能要好,你可能只能用权重来调整这些分布,但好的提示词更能在意境与短语间折中。

a sleek speedboat parked gracefully on a crystal clear turquoise blue sea,sunlight pouring down,casting shimmering reflections on the rippling waves,creating a stunning display of light and color,ultra-detailed,photorealistic,masterpiece,

常用工具

推荐个写提示词的网站给你,因为我经常用。

AI绘画提示词生成器 - 一个工具箱 - 好用的在线工具都在这里!

另外几个相关参数

今天先讲下这几个参数

迭代步数

我们都知道 stable diffusion 的基本扩散原理,就是先变模糊,再不停迭代绘制将图片变清晰,在这一过程中,迭代步数 就是指 图像从水滴落下开始扩散,到完全清晰的过程中,你需要AI帮你做多少轮的绘制。通常来讲,迭代次数越多,画面越清晰,画质也会越好。当然决定画质的不止这一个因素,与高宽像素等也有密不可分的关系。但就一般情况而言,迭代次数达到某个阈值后,并不是迭代次数越多,画质越好。我的经验是一般 7 - 20  为宜,上了30以后,迭代次数不管怎么增加,都没太大意义。

宽度与高度

用AI绘画的人,都希望绘制的作品满足自己的大小要求,这里一般是比较大的画作。但不幸的是,AI绘画的宽度与高度越大,那么需要使用显卡的memory 就越多,所需要的时间也越多。一般情况下,要看你显卡的配置,一般大家都是用的是N卡,就是Nivida 的显卡。显存越大,AI作画的高宽像素也就越大。通常我自己来说,一般不超过1024,因为我的N卡在超过1024后,就比较慢。这时候可以通过诸如图片修复或是图生图的方式来解决,调优。

提示词引导系数

顾名思义,就是你写的prompt对AI作画影响的权重,是要完全符合你说的,还是说给AI自己一定的想象空间来完成作画。你可以尝试改变这个权重来看下对画作的影响。

图片数量

就是一次生成多少张符合你要求的图片,你可以从中选取一张作为最好的,在上面尽心后期调优。

比如像这样,一次生成3张:

今天就先写到这里吧。希望你对提示词等用法有所感悟,掌握人类语言转换为AI 作画提示词的一些技巧,这也不可能一蹴而就,需要多加练习才可以达到一定的境界。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1940574.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MongoDB教程(十三):MongoDB覆盖索引

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快! 文章目录 引言什么是覆盖…

开放式牙耳机选哪种?2024五大新晋爆卖机型精选!

开放式蓝牙耳机不会因为耳机与耳朵的贴合度不够而影响音质。此外,开放式蓝牙耳机的外形设计更加时尚,更加符合现代人的审美需求。开放式蓝牙耳机的出现不仅解决了传统入耳式蓝牙耳机佩戴不适的问题,还具有更加舒适、健康、自然、时尚等多重优…

小白可用超稳定内网穿透工具——natapp全方位使用教程(合法合规)

本篇博客仅供学习参考使用!!! 2021年11月14日,国家网信办发布《网络数据安全管理条例(征求意见稿)》,《条例》第41条第2款规定,任何个人和组织不得提供用于穿透、绕过数据跨境安全网关的程序、工具、线路等…

实验07 接口测试postman

目录 知识点 1 接口测试概念 1.1为什么要做接口测试 1.2接口测试的优点 1.3接口测试概念 1.4接口测试原理和目的 2 接口测试内容 2.1测什么 2.1.1单一接口 2.1.2组合接口 2.1.3结构检查 2.1.4调用方式 2.1.5参数格式校验 2.1.6返回结果 2.2四大块 2.2.1功能逻辑…

降低物联网开发门槛的TuyaOS操作系统重磅更新:AI赋能设备升级,配网速度10倍提升,改变传统开发方式

作为降低智能解决方案开发门槛的 TuyaOS 操作系统,此次又迎来了重大更新(点击查看 TuyaOS 完整介绍)! 本次 TuyaOS 3.10.0 版本发布了超丰富的开发框架,覆盖多种协议连接和平台,可供开发者更快速便捷地接入…

直播领夹式麦克风哪个品牌好?直播麦克风十大排行榜推荐

​在这个充满活力与创意的时代,无线领夹麦克风成为了我们捕捉声音的得力助手。无论是在熙熙攘攘的美食街探店,还是在安静的书房进行录制,还是在嘈杂的户外采访,无线领夹麦克风都能出色地完成任务。很多朋友都曾为麦克风的选择而烦…

数据字典的解释

一、没有数据字典的时候,一般通过备注来标明,数据项不同数值所代表的不同含义。 如下图所示,但这样不够灵活。 二、引入数据字典的形式 数据字典由两张表组成,分别是字典类型表和字典数据表。 字典类型表中的字段都是存在多个值…

【初阶数据结构】掌握二叉树遍历技巧与信息求解:深入解析四种遍历方法及树的结构与统计分析

初阶数据结构相关知识点可以通过点击以下链接进行学习一起加油!时间与空间复杂度的深度剖析深入解析顺序表:探索底层逻辑深入解析单链表:探索底层逻辑深入解析带头双向循环链表:探索底层逻辑深入解析栈:探索底层逻辑深入解析队列:探索底层逻辑深入解析循环队列:探索…

部分功能的实现和算法

目录 1.雪花算法 2.MD5加密 3.小眼睛显示密码 4.发送验证码 5.倒计时 1.雪花算法 SnowFlake 中文意思为雪花,故称为雪花算法。最早是 Twitter 公司在其内部用于分布式环境下生成唯一 ID。在2014年开源 scala 语言版本 雪花算法的原理就是生成一个的 64 位比特…

探索XEX数字资产交易的优势与操作指南

随着数字资产市场的快速发展,越来越多的投资者开始关注并参与其中。XEX交易所作为一个新兴的数字资产交易平台,以其用户友好的界面和高效的交易服务,迅速吸引了大量用户。本文将介绍XEX数字资产交易的主要特点和优势,帮助新手更好…

昇思25天学习打卡营第18天|munger85

DCGAN生成漫画头像 首先肯定是下载训练数据,而这些训练数据就是一些卡通头像。后来我们会看到这个具体的头像 就像其他的数据集目录一样,它是由一些目录和这个目录下面的文件组成的数据集。 有相当多的图片。所以可以训练出来比较好的效果。 图片的处理…

Python应用开发——30天学习Streamlit Python包进行APP的构建(20):配置

Configuration配置 config.toml config.toml 是一个可选文件,你可以为工作目录或全局开发环境定义它。当 config.toml 文件同时在全局和工作目录中定义时,Streamlit 会合并配置选项,并优先使用工作目录配置。此外,你还可以使用环境变量和命令行选项来覆盖其他配置选项。更…

PySide(PyQt),使用 QGraphicsOpacityEffect 设置小部件的整体显示透明度

基本的demo 在 PySide6 中,可以使用 QGraphicsOpacityEffect 类来实现整体显示透明度。下面是一个简单的示例,演示了如何为 QLabel 设置透明度: from PySide6.QtWidgets import QApplication, QLabel, QGraphicsOpacityEffect, QVBoxL…

Java--接口

目录 语法规则 例子 实现多个接口 接口之间的继承 抽象类和接口的区别 接口使用实例--Comparable接口 Clonable接口 浅拷贝 深拷贝 在现实生活中,接口的例子比比皆是,比如:电源插座,主机上的USB接口等。这些插口中可以插…

【C++】位运算:两整数之和

1.题目 2.算法思路 本题不能只用 -,那大概率用到位运算符。 异或的作用是无进位相加,所以需要通过异或运算(^)来替代加法运算,但是我们无法确定进位的信息。所以需要与运算(&)来得到进位的…

【数据结构与算法 经典例题】翻转二叉树

💓 博客主页:倔强的石头的CSDN主页 📝Gitee主页:倔强的石头的gitee主页 ⏩ 文章专栏:《数据结构与算法 经典例题》C语言 期待您的关注 ​ 目录 一、问题描述 二、解题思路 三、C语言实现代码 一、问题描述 给你一…

golang 字符编码 gbk/gb2312 utf8编码相互转换,判断字符是否gbk编码函数, 字符编码转换基础原理解析, golang默认编码utf8

虽然golang里面的默认编码都是统一的unicode utf8编码, 但是我们在调用外部系统提供的api时,就可能会遇到别人的接口提供的编码非 utf8编码,而是gbk/gb2312编码, 这时候我们就必须要将别人的gbk编码转换为go语言里面的默认编码ut…

2024国内AI公司50强榜单。。。

你好,我是郭震 近日,2024国内AI公司50强榜单发布。 1 AI公司50强榜单 AI公司排名前五分别是:百度,阿里,华为,腾讯,科大讯飞。 6-10名分别是:小米,商汤,字节跳…

Jeston Orin IIC 驱动测试 —— 以MPU6050为例

前言 后续驱动需要需要使用IIC作为通讯的协议,但是做的板子还没来,因此,在开发板驱动加载真正的之前,我们需要确保IIC能够正常通信。 网上的博客基本都是教怎么使用i2c-tools进行通信的,但是这种方法只是在用户空间下…

【效率提升】程序员常用Shell脚本

文章目录 常用Shell脚本一. 定期更新分区数据二、获取系统资源的使用情况 常用Shell脚本 一. 定期更新分区数据 在某些场景下,我们需要对N年前某一分区的数据进行删除,并添加今年该对应分区的数据,实现数据的流动式存储。 #!/bin/bash dt$…