保姆级教程来了,AI绘画提示词原理揭秘

news2024/10/5 15:06:26

为了让你快速上手从 0 到 1 的绘图流程,在这篇文章中,我们将重点讲解 Prompt 提示词。

1、解析提示词的概念

在深入讲解之前,我们首先来了解一些基本概念,以便更好地学习和理解。

提示词,也就是 Prompt,主要是指用户输入的文本或图像信息,其目的是为了引导模型根据特定需求生成相应的作品。简单来说,就是用来告诉 AI 我们想要创作什么样的图片,这可以被理解为一种与 AI 沟通的特定格式的语言。

在之前的文章中,我们介绍了 SD 的「文生图」和「图生图」两种功能。

「文生图」主要通过文字与 AI 模型沟通,而这就需要使用到我们的提示词。

ad041855f588fb47d1c68e302ac34c57.jpeg

「图生图」则是通过图片来传递信息给 AI 模型,这里同样会用到提示词。

81332e80ef8f80dfac8a76480bfe964c.jpeg

提示词在 AI 绘图中的应用范围非常广泛,包括但不限于图片的主题、风格、场景、人物特征、服装特点和其他额外参数等。

有时候为了生成一幅图片,我们可能需要用到十几行的提示词。事实上,许多提示词都是固定和规律的。

描述越详细,提示词就越长,AI 模型就能更精确地输出与我们需求一致的作品。

2、分类与书写提示词

那么,我们该如何书写提示词呢?

书写提示词其实没有严格的限制,不管你输入什么,AI 都会尝试为你生成一幅图片。但如果你想让 AI 更准确地理解你的需求,那么掌握基本的语法和规则是非常必要的。

以 SD 为例,在「文生图」操作中,你会看到输入「正向提示词」和「反向提示词」的区域。

06ae6519a23ef4a54bfced3bdee393d1.jpeg

首先,提示词仅支持英文输入。如果你的英语水平尚可,你可以直接输入英文;否则,你可以借助翻译工具。

其次,提示词应以词组为基本单位,各个词组之间用英文逗号「,」分隔。

例如,如果你想要 AI 为你生成「一个又高又瘦的女生和一杯又浓又香的咖啡」的图片,你可以将其拆分为以下词组:「女生, 高, 瘦, 咖啡, 浓, 香」。

5e1170c4c95c00d6c7c6e0bbbf6009e1.jpeg

这样,AI 就能更好地理解你想要生成什么样的图片,甚至比口头描述更加精准。

根据以上提示词,你可以尝试直接生成图片。可能结果会符合你的期望,但也可能会出现一些奇怪的效果。这是因为 AI 在处理时具有一定的「随机性」,每次生成的图片都不会完全相同。

64cd11127cf88882caa3775c2726a224.jpeg

例如,「一个又高又瘦的女生,和一杯又浓又香的咖啡」这个描述其实非常抽象和简短。这个女孩是学生还是上班族?时间是白天还是夜晚?场景是在咖啡店还是在家里?这些都是 AI 无法从简短的描述中得知的信息。

因此,如果提示词过于抽象和笼统,AI 就只能根据自己的理解随机生成一幅图片。

实际上,一个完整的提示词通常是通过不断与 AI 调试、逐步细化和微调而成的。

那么在提示词的基础上我们还需要添加哪些内容呢?

我们可以将其简单概括为以下几大类,以方便你在微调关键词和补充细节时,能够迅速找到合适的词组,从而快速生成你想要的作品。

主要包括五类:人物特征提示词、环境提示词、场景提示词、视角提示词、画质提示词。

abc901fc7a019184e6a221be97c5ad2c.jpeg

例如,我们可以将前面的提示词进一步细化和补充,形成一组标准化的提示词,以便更好地引导 AI 生成高质量的图片。参考如下:

1 girl, high, thin, coffee, thick, fragrant,
white dress, blonde hair, long hair, smiling, beautiful, happy, outdoor, day, sunlight, blue sky, close-up,
best quality, ultra detailed, masterpiece, 8k, extremely detailed CG unity 8k wallpaper,
painting, illustration, anime, game cg,

这种标准化的提示词可以使我们的图像更加细致和丰富。

使用这些标准化提示词后,是否感觉图像的质感和细节更加丰富了?

0231a6d25254cc67b7d25a6a496a2fed.jpeg

至此,我们实际上已经很清楚地了解了如何从零开始编写提示词。提示词的结构已经为你清晰地划分出来。

6c6668788043edf5cbeab91dd68ea62e.jpeg

如果想要让AI更准确地理解提示词,内容应该既丰富又有明确的标准。

另外,我还为你提供了一个如何书写提示词的模板。点击下方链接并关注我们的公众号后,在后台回复「提示词模板」即可获得。


提示词的词组化结构在微调时非常方便,不需要重新组织整个语句,只需直接修改对应的词组即可,图像也会根据这些修改进行相应的变化。

3、提示词权重与负面提示词介绍

你可能已经注意到,我们的提示词中有些是带有特定的符号,如 ( ) 或 { } 。这些符号代表什么含义呢?这正是本节要讲的「提示词权重」。

d90a388a583c54ab7354723065f911a2.jpeg

在现实场景中,当你在书写描述时,可能会有多个描述词组。例如,你可能描述了头发的长度(long hair)、衣服的颜色(white dress)以及面部表情(smiling)。但AI可能并不总是能够准确地识别所有的描述。

06e7c45daae5a8ed901fab5b4f1c4c71.jpeg

对于这种情况,我们可以通过调整权重来强调某个词组的重要性,使其在图像中更加突出。增加权重主要有两种方法:一种是使用括号,另一种是使用数字权重。

f4e2407c211aa4d3f026017fa487b54a.jpeg

经过权重调整后的图像,是否感觉加权的提示词更加突出了?

4fcd264f42862a6ae4c786b8b8866d3d.jpeg

当你发现某些描述没有被AI准确地反映在图像中时,你就可以考虑「增加提示词权重」来强调它们的重要性。

但是,请注意不要将权重设置得过高,这可能导致图像内容严重失真。

一般来说,提示词权重的安全范围为0.5至1.5。如果某个词组的权重超出这个范围,生成的图像可能会出现扭曲。

至于「负面提示词」,它主要用于指定我们不希望在图像中出现的元素。反向提示词可以为空,但通常,为了标准化图片,我们会选择加入一些常见的词组。

为了更方便地输入提示词,我们推荐使用如下插件:

插件地址:

https://github.com/Physton/sd-webui-prompt-all-in-one.git

安装该插件后,你将在提示词页面看到新增的功能。

6acd9728aa5a4539b7f1115c51e1693e.jpeg

4、AI 绘图必备提示词工具

许多在线工具可以帮助你编写提示词。例如:

- https://ai.dawnmark.cn/ - https://civitai.com/images - https://openart.ai/discovery

这些工具的使用方法非常简单,你只需选择相应的参数和风格,然后复制生成的提示词到SD中。

5、AI 绘图工具:ChatGPT DALL·E 3与 Midjourney比较

在 AI 绘图领域,ChatGPT 的 DALL·E 3 和 Midjourney 无疑是两大巨头。而对于很多用户来说,了解它们之间的不同可能会影响其选择。以下是两者的详细比较。

fa64a74ef4fdff27397db2282da1f633.jpeg

1. 功能性与易用性:

- ChatGPT 的 DALL·E 3:DALL·E 3 的最大优势在于其与 ChatGPT 的无缝集成。用户只需通过文本聊天框提供指示,即可生成所需的图像。这种自然语言处理方式使得使用起来非常直观和简单,无需复杂的界面和操作。

- Midjourney:虽然 Midjourney 也为用户提供了直观的界面,但其更偏向于专业用户,可能需要更多的学习和适应。

2. 图像质量与创意性:

- ChatGPT 的 DALL·E 3:DALL·E 3 生成的图像细节丰富,能够准确捕捉到用户的意图并将其转化为有趣的图像创意。它的技术使其在理解复杂的描述和生成相应图像方面表现出色。

- Midjourney:Midjourney 在艺术效果和专业质量方面表现出众,更适用于需要高水平审美和专业领域的场景。

3. 适用领域:

- ChatGPT 的 DALL·E 3:由于其易用性和广泛的应用范围,DALL·E 3 更适合日常用户和非专业人士,例如内容创作者、博主和设计爱好者。

- Midjourney:由于其艺术性和专业性,Midjourney 更适合设计师、艺术家和专业团队使用,特别是在需要高质量输出的项目中。

4. 开放性与集成:

- ChatGPT 的 DALL·E 3:由于是 OpenAI 的产品,DALL·E 3 有可能与 OpenAI 的其他产品进行集成,这为未来的发展和扩展提供了更多的可能性。

- Midjourney:作为一个独立的平台,Midjourney 在与其他系统集成时可能需要更多的工作和调整。

总结,选择 ChatGPT 的 DALL·E 3 还是 Midjourney 主要取决于个人或团队的需求。对于那些需要快速、简单的图像生成的人,DALL·E 3 可能是更好的选择。而对于那些追求专业质量和艺术效果的人,Midjourney 可能更具吸引力。

如果你觉得这些内容对你有所帮助,请分享给你的朋友。如果你需要更多的资料,可以扫描下方的二维码加我为微信好友(chatgptplus2023)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1168312.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis ----使用Java代码操作redis(2)

⭐⭐ Redis专栏:Redis专栏 ⭐⭐ 个人主页:个人主页 目录 一.Java连接redis 二.Java操作redis常见数据类型存储 2.1 String类型的操作 2.2 hash 2.3 集合 list 三.redis的运用场景 一.Java连接redis 第一步:导入依赖…

【Redis】使用java代码操作Redis,以及在实际应用的场景

一,Java代码操作Redis 1.1在 Java 中使用 Redis 前, 我们需要确保已经安装了 redis 服务及 Java redis 驱动,且你的机器上能正常使用 Java 如下图:关于如何使用window安装Redis,我已在上一篇博客中详细介绍了&#x…

Quantile Loss

文章目录 Quantile Loss示例 定量qₐ是一个值,它将一组给定的数字进行划分,其中 α * 100%的数字小于该值,(1-α) * 100%的数字大于该值。 统计中经常使用 α 0.25、α 0.5 和 α 0.75 的四分位数 qₐ,称为四分位数。这些四分位…

使用Postman工具做接口测试 —— 环境变量与请求参数格式!

引言 在上一篇笔记我们主要介绍了接口测试的基础知识与基本功能,本章主要介绍如何使用postman做接口测试。 配置环境变量和全局变量 环境变量和全局变量 环境管理中还可以点击“Global”添加全局变量,环境变量只有当选择了该环境时才生效,…

Stable Diffusion WebUI扩展sd-webui-controlnet安装教程

话不多说,上链接: https://github.com/Mikubill/sd-webui-controlnethttps://github.com/Mikubill/sd-webui-controlnet同样,直接安装到extensions文件中。 什么conda还是python安装也不多说了,前面很多讲了如何安装,这里就不当赘婿了。 安装好后,我们最好手动安装模型…

为什么树莓派安装Ubuntu的时候无法通过有线(网线)连网

这个东西从软件角度有很多解释,但是我这里遇到的情况是: 因为一个标注2A但是实际电流虚标的充电头浪费了我2天的时间。 也即是说:如果你的树莓派无法通过网线联网,很有可能是因为供电不足。因为一个新的树莓派一般不会有故障&am…

纽扣电池上架TEMU美国站合规认证标准ANSI C18.3M认证

近日,Temu连发多条卖家弹窗内容均为商品质量事故违规处理通告。其中一条为卖家销售的车载吸尘器发生烧毁、冒烟等情况,产生用户人伤、财损等舆情。经查实是商家偷换关键部件锂电池,导致商品质量下降造成事故。TEMU对于问题车载吸尘器处理结果…

OpenShift - 利用容器的特权配置实现对OpenShift攻击

《OpenShift / RHEL / DevSecOps 汇总目录》 说明:本文已经在 OpenShift 4.13 的环境中验证 本文是《容器安全 - 利用容器的特权配置实现对Kubernetes攻击》的后续篇,来介绍 在 OpenShift 环境中的容器特权配置和攻击过程和 Kubernetes 环境的差异。 文…

Kaprekar 7641 - 1467= 6174

package homework;import java.util.Arrays;import util.StringUtil;/*** 数学黑洞数6174,即卡普雷卡尔(Kaprekar)常数, 它的算法如下: 取任意一个4位数(4个数字均为同一个数的除外)&#xff0…

C++类和对象(七)const成员 及其初始化列表

1.const成员 将const修饰的“成员函数”称之为const成员函数,const修饰类成员函数,实际修饰该成员函数隐含的this指针,表明在该成员函数中不能对类的任何成员进行修改。 成员函数定义的原则: 1.能定义成const的成员函数都应该定义…

Leetcode—100.相同的树【简单】明天写另一种解法!

2023每日刷题(十八) Leetcode—100.相同的树 递归实现代码 /*** Definition for a binary tree node.* struct TreeNode {* int val;* struct TreeNode *left;* struct TreeNode *right;* };*/ bool isSameTree(struct TreeNode* p, struc…

举个栗子!Alteryx 技巧(7):轻松使用公式

在使用 Alteryx 的日常中,你是否遇到这些问题:需要创建计算字段,但不确定要使用哪个公式?那么,如何快速且高效地理解公式的逻辑,有没有全部公式的汇总资料供用户学习呢?Sure! 本期《…

Temp directory ‘C:\WINDOWS\TEMP‘ does not exist

问题描述 解决方法 管理员权限问题,进入temp文件夹更改访问权限即可。 点击 temp文件夹 属性 -> 安全 -> 高级 -> 更改主体Users权限 给读取和写入权限 参考博客 开发springboot项目时无法启动Temp directory ‘C: \WINDOWS\TEMP‘ does not exist

2023年测试如果想拿到心怡的offer必会的12大技能

01 业务熟悉 🎯 1:熟悉本系统 测试人员参与测试的系统的各种业务场景,必须做到精熟 。一旦需求有改动,可以清楚快速的知道上下文。同时可以清楚的知道哪些点是需要重点测试的。 🎯 2:熟悉跟本系统有通讯…

服务号升级订阅号的流程

服务号和订阅号有什么区别?服务号转为订阅号有哪些作用?首先我们要知道服务号和订阅号有什么区别。服务号侧重于对用户进行服务,每月可推送4次,每次最多8篇文章,发送的消息直接显示在好友列表中。订阅号更侧重于信息传…

✔ ★【备战实习(面经+项目+算法)】 11.3学习

✔ ★【备战实习(面经项目算法)】 坚持完成每天必做如何找到好工作1. 科学的学习方法(专注!效率!记忆!心流!)2. 每天认真完成必做项,踏实学习技术 认真完成每天必做&…

踏步红色桂东 重走红军走过的路

——“中国体育彩票”2023年“走红军走过的路”徒步穿越系列活动(桂东站)暨桂东首届山地运动会 秋高气爽云淡风轻,齐聚桂东漫步山野。11月3日,“中国体育彩票”2023年“走红军走过的路”徒步穿越系列活动(桂东站)暨桂东首届山地运动会如期举行。来自全国…

面试知识储备-Vue3篇

1.ref和reactive Vue3为什么推荐使用ref而不是reactive ref: 将内部值包装在特殊对象中,是内部值具有响应性 reactive使对象本身具有响应性 若我们将同样的函数定义为一个方法而不是计算属性,两种方式在结果上确实是完全相同的,然而&#xf…

D-Link DAR-8000操作系统命令注入漏洞(CVE-2023-4542)

D-Link DAR-8000操作系统命令注入漏洞(CVE-2023-4542) 免责声明漏洞描述漏洞影响漏洞危害网络测绘Fofa: body"DAR-8000-10" 漏洞复现1. 构造poc2. 发送数据包,执行命令id命令pwd命令 免责声明 仅用于技术交流,目的是向相关安全人员展示漏洞利…

什么是分立器件高速测试系统,如何进行ATE测试?

分立器件高速测试系统是一种用于测试分立器件性能的自动化测试系统。它能够对各种类型的分立器件进行功能和交参数测试,如二极管、三极管、绝缘栅型场效应管、结型场效应管、单向和双向可控硅、普通和高速光耦、整流桥、共阴共阳二极管及多阵列器件等各类半导体分立…