AI绘画-Midjourney基础1-基本操作

news2024/12/28 20:53:52

Midjourney是一款 AI 绘画工具,可以根据你的提示(本文中称为 prompt)创作出各种图像。你只需要在Discord上和一个机器人聊天,就可以用简单的命令来控制它。目前已不支持免费试用,可以选择付费计划来获得更多功能和优势。

目前 Midjourney 的最新模型为 v5.1 模型,新用户有25次免费额度,快去体验吧!

本文干货满满,建议收藏!!!

一、第一幅 AI 绘画作品

要使用 Midjourney 进行 AI 绘画,首先要创建一个 Discord 账号,然后加入 Midjourney 服务器。

具体如何注册 Midjourney 网上已有大量教程,还是不会注册的朋友们可以私聊博主。

1. 创作(/imagine)

在控制台输入 /imagine 指令,在 prompt 框中输入提示信息,完成后输入回车,即可创作一张 AI 绘画作品。

如我们在控制台输入 /imagin a cute cat,就会得到4张可爱的小猫咪图片:

2. 升档和变体

在使用 /imagine 指令创作图片后,会生成4张不同的图片,同时下方会出现一排按钮,接下来讲解按钮的作用。

首先,使用1、2、3、4分别对这4张图片进行编号,U1~U4 和 V1~V4 表示对对应的图片做 U 操作(upscale,升档)或 V 操作(variations,变体),重做按钮表示按刚刚的提示重新生成4张图片。

(1) 升档操作

mj 会为每条指令生成4张图片,升档操作表示从这4张图片中选择某张图片,放大这张图片并增加细节,提高清晰度。

可以看到,U1 操作即为选择了第1张图片,将其放大并增加细节,更加清晰。

下面还有3个按钮,功能如下:

Make Variations 按钮表示对这张图片进行变体操作。

Web 按钮,表示在个人主页中查看这张图片,如下所示:

右下角有个保存按钮,点击即可将其下载到我们自己的设备上了!

Favorite 按钮则表示收藏,可以在个人主页查看已收藏的图片。

(2) 变体操作

变体操作表示从这4张图片中选择某张图片,对这张图片做变体处理,按照这张图片生成4张主体一致,细节有所变化的新图片。新生成的这4张图片还可以继续进行 U 操作、V 操作和重做操作。

二、Midjourney 设置

在控制台输入指令 /settings,进入设置页面。如下图所示: 

1. 模型

配置界面第1行和第2行的选项代表使用哪个模型进行作图,只能选择一项。当前版本默认使用 v5.1 模型,分辨率更高,理解力更强,细节处理更好。

Niji 模型是二次元风格的模型,适用于生成二次元风格的图片。RAW Mode 版本是 v5.1 模型的另一种模式,会生成另一种风格的图片,适合生成电影类型的图像,在选择 v5.1 模型时才会出现这个模式。

2. 风格参数

第3行的配置项为风格参数,有low、med、high、very high四种模式,越高图片越精细。

这一行的4个选项只可以选择其中1个。

3. 公开模式 / 隐身模式

第4行的第1个选项 Public mode,选中表示公开模式,所有人都能看见你生成的图片。

取消选中则表示隐身模式,别人看不见你生成的图片。

隐身模式只有高级订阅(即60$一月)的用户才可以使用。把 Midjourney bot 机器人拉入自己的服务器虽然看起来是只有自己看到自己生成的图片,但实际上你的 prompt 和你生成的图片也被发送到 Midjourney 的公共频道,所有人都可见。

4. 快速模式 / 放松模式

第4行的第2个选项 Fast mode,选中表示快速模式,需要消耗占用 GPU 的快速时长。快速模式下不需要排队,出图速度较快。普通订阅的用户和高级订阅的用户每个月都有一部分快速时长。

取消选中则表示放松模式,需要排队作业,出图速度较慢。

5. 混音模式

第4行的第3个选项 Remix mode 代表混音模式,选中后可以对图片的局部风格进行调整,即在变体操作时调整生成图片的 prompt。

使用文本描述 A happy girl,绘画效果如下:

打开 Remix mode 后,做 v1 操作,可以看到出现一个弹窗,在弹窗中我们可以修改 prompt:

修改文本描述为 A sad girl 后,效果如下:

可以看到,混音模式下,可以对图片的局部风格进行调整,甚至可以完全改变图片的风格。

三、Midjourney 后缀参数

Midjourney 的 prompt 由文本描述和后缀参数两部分组成。文本描述推荐使用英文,Midjourney 对中文的识别能力不是很强。

由于博主英语不是很好,接下来的示例我都是使用 AI 来帮忙生成 prompt。

后缀参数可以控制图片的大小、风格、样式、质量等,可以更容易生成我们想要的图片。

后缀参数之间的顺序可以任意改变。

1. -- [模型]

-- 后跟上模型代表使用这个模型进行作图。如 -- v5.1(注意 -- 后面有一个空格)表示使用 v5.1 模型,--niji 5(注意这里的 -- 后没有空格)表示使用 niji 5模型等。

2. --ar 比例

后缀参数 ar 表示生成图片的比例。参数值为图片的宽高比,格式为 w:h,w 为宽,h 为高。

默认值为 1:1,一般的取值有 3:2,4:3,3:4 等。

网页上的图片比例一般为 16:9,来看下面的示例:

Welcome to the world :: of a future city ::2 that shines under the starlit sky. Neon lights twinkle in the distance, reflecting off the sleek, glassy surfaces of towering structures. Futuristic vehicles zoom through the air, leaving trails of light in their wake. It's a city that's awake, alive, and pulsating with energy. --ar 16:9

这条 prompt 中文本提示中有权重切分符(::),权重切分符如何使用将在 Midjourney 的进阶篇中进行讲解。

3. --style 风格

后缀参数 style 表示模型生成图片的风格。

v4 模型有 4a、4b 和 4c 3种风格,niji 5 模型有 expressive(默认)、cute 和 scenic 3种风格,v5.1 模型有默认风格和 raw 风格2种风格。

Embark on a journey :: into the world of an endearing girl ::2 in a room inspired by Japanese aesthetics. The room bursts with pastel colors, plushies, and eclectic decorations, creating a warm and inviting ambiance. The girl, in her adorable clothes, with a sweet smile, embodies pure charm. --niji 5 --seed 1024

如下分别为 niji 5 模型使用 expressive 风格和 cute 风格的效果:

可以看到,cute 风格下的图片显得更加可爱。

4. --chaos 多样性,变化

后缀参数 chaos 影响初始图像网格的差异程度,可以简写为 c。取值范围为0-100,默认为0。

高 chaos 值将生成更不寻常和意外的结果和构图,低 chaos 值则会产生更可靠和可重复的结果。

如下分别为 chaos 参数值为0和80时的效果:

Welcome to the world of the Rainbow Windmill Island. ::2 The island, adorned with vibrant windmills spinning joyfully, stands in the middle of a turquoise sea. ::1.5 The sky above is bright and clear, with fluffy white clouds scattered across the azure expanse. The sight of the island, so full of life and color, brings a sense of peace and tranquility.

可以看到,chaos 值越高,生成的图片越更富有想象力。

5. --seed 一致性

后缀参数 seed 表示生成图片时使用的种子,可以确保生成的图片的一致性,相近的 seed 值生成的图片的构图和风格都很接近。使用相同的文本提示、模型、风格和 seed 值的 prompt,生成的四宫格图片将一模一样。

上面 --style 的案例中,和我使用相同的 seed 值1024,会得到和我一样的四宫格图片。

这个参数将在进阶篇详细展开。

6. --no 否定提示

后缀参数 --no 表示否定提示,表明在图像生成中不想要的东西,作用是对不需要的元素进行删除,使它们不太可能出现在输出中。

例如想生成一幅没有任何河流的风景画,可以这样写:

a landscape painting --no rivers

7. --tile 无缝贴图

后缀参数 tile 生成可以用作重复图案的图像,用于制作无缝图案、壁纸和纹理。

woodden board texture --tile

一个检查无缝贴图的网站:Seamless texture check | pycheung.com

8. --quality 质量

后缀参数 quality  影响生成图像所需的时间,即图片的质量,可以简写为 q。默认值为1,可选值有 .25、.5、1、2 四个值。

高质量的设置需要较长的处理时间并生成更多细节,更高的数值也意味着每个作业使用的GPU分钟数更多。

质量设置不影响分辨率,更高的 quality 设置并不总是更好。有时,较低的 quality 设置可以产生更好的结果,这取决于试图创建的图像。较低的 quality 设置可能最适合于手势抽象外观。更高的 quality 值可以改善从许多细节中受益的建筑图像的外观。选择与希望创建的图像类型最匹配的设置。

如下为 quality 值为1和2时的效果:

Welcome to a cityscape of the future, where skyscrapers::2 loom large against the sky, their futuristic design a testament to human ingenuity and progress::1.5. Neon lights flicker on their surfaces, painting an electrifying picture of the city night. --ar 3:2

可以看到,quality 值为2时图片有更丰富的细节。

9. --stylize 相关度

后缀参数 stylize 影响生成的图片和 prompt 的相关度,可以简写为 s。取值范围为0-1000,默认值为100。数值越小,和我们 prompt 关联度越高;数值越大,生成的图片更加高调。

如下为 stylize 值为100和800时的效果:

Step into the enchanting world ::2 of a cute magical kitten in the realm of anime ::2. With sparkling eyes and a tiny wand, it casts spells of joy and laughter. --niji 5 --style cute

可以看到,当 stylize 值为800时,图片主体都变了,上面的 prompt 的主体为魔法猫咪。

10. --iw 图文相关性

取值范围0.5 ~ 2,用于图生图控制生成图片的图文相关性。取值越高,则生成的图片参考 prompt 中“图”的比重就越高;反之,参考“文”的比重就越高。在后续图生图的文章中会详细解析。

四、Midjourney 常用指令

1. 绘图相关

(1) /imagine 生成图片

最基本的指令,用于文本生成图片,prompt后面加描绘词,即文生图。

(2) /discribe 生成文本

用于图片生成与之相关的4条英文的文本描述,即图生文。

控制台输入 /describe 指令,上传一张图片,发送,即可得到4条文本描述。

注意:这几条文本描述只是 AI 分析图片得出来的,并无法保证使用这些文本描述可以得到相同的图片。

(3) /blend 两个图片混合

将两张图片按照文本描述进行混合,即图生图。后续文章会详解讲解。

(4) /show 结合任务ID生成原图片

在聊天记录中的一个任务右上角,点击添加反应按钮,搜索 "envelope",点击这个信封图标。

这时就可以在 Midjourney Bot 给你的私信中看到这个任务的 Job ID 和 seed 值。

这个时候控制台输入 /show 指令,job_id 框中粘贴上面查看到的 job_id,就可以看到这条消息了,同时可以对这个任务继续进行升档操作和变体操作。

这个指令并不经常使用,细心的朋友已经发现,上面获取 Job ID 那里同时还获取到了 seed 值,有用的其实就是这个 seed 值。

上文已经提到,使用相同的文本提示、模型、风格和 seed 值的 prompt,生成的四宫格图片将一模一样。现在就来试验一下:

Embark on a journey :: into the world of an endearing girl ::2 in a room inspired by Japanese aesthetics. The room bursts with pastel colors, plushies, and eclectic decorations, creating a warm and inviting ambiance. The girl, in her adorable clothes, with a sweet smile, embodies pure charm. --ar 1:1 --niji 5 --seed 4123671164

使用上面的 prompt,你将会得到和我相同的图片。这就是 seed 的神奇之处!

利用这个特性,我们就可以使用控制变量法对图片的细节进行微调了,进阶篇中我将详细讲解。

2. 设置相关

(1) /settings 设置

(2) /fast 切换到快速模式

(3) /relax 切换到放松模式

(4) /public 切换到公共模式

(5) /stealth 切换到隐身模式

(6) /prefer remix:切换到混合模式

3. 后缀相关

(1) /prefer suffix 指定要添加每个提示末尾的后缀

Midjourney 有很多的后缀参数,有时候在每次作图时都会添加一些固定的后缀参数,显然有点麻烦。使用 /prefer suffix 指令可以定要添加每个提示末尾的后缀:

如下面这条指令,会在每次绘图时,prompt 后都添加上 --ar 16:9 --v 5.1 --style raw --q 2 --s 800。 

接下来我输入文本描述,运行时后面会自动加上预设的后缀。

Step into the world of Zaun ::2, a city steeped in darkness and chaos. The high-tech industrial infrastructure towers above, offering a stark contrast to the disorder below

直接输入 /prefer suffix 指令,后不加任何内容,可以重置后缀预设。

(2) /prefer option set 创建自定义变量

使用 /prefer suffix 设置默认后缀参数的默认值,只能设置一条预设。如果想要设置多条后缀参数的预设,在不同情况下使用不同预设,那么就可以使用 /prefer option set 创建变量的方法。

定义变量 x 为 "--ar 4:3 --chaos 30",之后就可以直接在 prompt 中以 --x 的形式使用该变量,x 即等于 "--ar 4:3 --chaos 30"。

出现下面的提示时,即为创建变量成功!

使用变量 x 的方式如下:

Step into the vastness of the universe ::2. The sky is ablaze with countless stars, each one a distant world waiting to be discovered

如上案例中,在运行时变量 x 被自动替换为已经预设好的后缀参数。

(3) /prefer option list 列出之前设置的所有变量

控制台输入指令 /prefer option list 后回车发送,可以看到已定义好的变量。

另外,如果想要删除变量,可以使用 /prefer option set,设置空的 value 即可。

看到如下消息即为成功删除变量:

再次输入 /prefer option list 指令,可以看到已经没有了变量 x。

4. 系统相关

(1) /info 查看基本信息

如订阅状况、工作模式等。

Subscription:订阅信息,有订阅等级,订阅方式(按月 / 按年)和订阅时间。

Job Mode:工作模式,Fast(快速模式)/ Relax(放松模式)。

Visibility:可见性,Publuic(公开模式)/ Stealth(隐身模式)。

Fast Time Remaining:剩余多少快速时长。

Lifetime Usage:快速模式下生成了多少张图片,使用了多长时间 GPU。

Relaxed Usage:放松模式下生成了多少张图片,使用了多长时间 GPU。

Queued Jobs (fast):当前有多少个快速模式的作业正在排队队列。

Queued Jobs (relax):当前有多少个放松模式的作业正在排队队列。

Running Jobs:当前有哪些作业正在运行。

(2) /ask 获取问题答案

(3) /help 查看帮助信息

(4) /subscribe 管理订阅

附:使用 AI 生成 Midjourney 的提示词

我在 ZelinAI 上做了一个 AI 应用,可以根据用户输入的内容生成一条适用于 Midjourney 的文本描述,对不熟悉英文的小伙伴们非常友好。

点击这里来体验吧!

由于 Zelin AI 目前只能使用 ChatGPT 模型(即 GPT-3.5),能力不是很强。这个 AI 工具目前还无法生成完整的 prompt,只能生成英文描述,后缀参数还需要我们来手动调配。

另外,我用 GPT-4 训练了一个生成 Midjourney 提示的 AI 工具,GPT-4 相比于 GPT-3.5 强大了很多,理解能力大幅度提高,已经可以生成完整的带后缀参数的 prompt。

如下为 GPT-4 模型下 Midjourney 提示工程师 AI 工具的表现:

可以看到,生成了完整的 prompt!使用第3条 promot,效果如下:

生成的图片还是非常不错的!正文部分的各种案例图片的 prompt 都由 GPT-4 版本的 Midjourney 提示工程师 AI 工具生成。

点赞达到15个,后续我会在本专栏发一篇文章来详解讲解如何训练这个模型!

点赞达到30个,我将公开这篇文章!

三连 + 关注,在评论区回复 "AIGC!",我将把 GPT-4 版本的 Midjourney 提示工程师模型的训练咒语发给你!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/535105.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Ae 效果详解:Roto 笔刷和调整边缘

使用 Roto 笔刷工具或调整边缘工具之后,Ae 会向图层应用“Roto 笔刷和调整边缘” Roto Brush & Refine Edge效果。 版本 Version 目前包括 1.0(经典)1.0 Classic和 2.0 两个版本。 品质 Quality 选择围绕边缘的细节质量。 --标准 Stan…

传输时延和传播时延(补充:频段,信道带宽,数据速率的区别,以及帧大小和帧长)

先来看例题,看是否能区分 例题1: 假设生产管理网络系统采用B/S工作方式,经常上网的用户数为150个,每用户每分钟产生8个事务处理任务,平均事务章大小为0.05MB,则这个系统需要的信息传输速率为(68)。 (68)A…

Node接入ChatGPT 的最强对手Claude

由于个人的chatGPT免费版本即将到期, Claude 很火,在网上被说成是 ChatGPT 的最强对手,是 ChatGPT 的替代品。本文我将介绍下 Claude 是什么,以及如何免费使用 Claude. 什么是Claude 看一下它是如何自我介绍的 Slack Slack 是一款流行的团…

在 Transformers 中使用对比搜索生成可媲美人类水平的文本

1. 引言 自然语言生成 (即文本生成) 是自然语言处理 (NLP) 的核心任务之一。本文将介绍神经网络文本生成领域当前最先进的解码方法 对比搜索 (Contrastive Search)。提出该方法的论文 “A Contrastive Framework for Neural Text Generation” 最初发表于 NeurIPS 2022 ([论文]…

目标检测创新:一种基于区域的半监督方法,部分标签即可(附原论文下载)...

关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2201.04620v1.pdf 计算机视觉研究院专栏 作者:Edison_G 研究表明,当训练数据缺少…

招募:AICG内容联合创作计划 | AIGC实践

AIGC(AI Generated Content,人工智能自动生成内容)必将成为小微创业团队进行低成本内容运营的最佳实践。 你同意这个观点吗? 如果我们恰好想法一致,或许可以一起搞点事情,探索一下商业场景下,应…

ChatGPT prompt指令大全

ChatGPT prompt指令大全 更多Prompt自动使用,可以在chrome插件中搜索 WebChatGPT,没有账号的,可以拉到文章最下面。 目录 担任雅思写作考官 写小说 充当 Linux 终端 充当英语翻译和改进者 充当论文润色者(拿摘要部分举例&am…

企业实践 | 如何从VMWare ESXi Shell中挂载以及拷贝NTFS或者FAT32分区格式的USB闪存驱动器...

欢迎关注「WeiyiGeek」公众号 点击 👇 下方卡片 即可关注我哟! 设为「星标⭐」每天带你 基础入门 到 进阶实践 再到 放弃学习! 涉及 网络安全运维、应用开发、物联网IOT、学习路径 、个人感悟 等知识 “ 花开堪折直须折,莫待无花空折枝。 ”…

K_A39_004 基于STM32等单片机驱动AT24C02模块 串口+OLED0.96显示

K_A39_004 基于STM32等单片机驱动AT24C02模块 串口OLED0.96显示 所有资源导航一、资源说明二、基本参数参数引脚说明 三、驱动说明时序对应程序: 四、部分代码说明1、接线引脚定义1.1、STC89C52RCAT24C02模块1.2、STM32F103C8T6AT24C02模块 五、基础知识学习与相关资料下载六、…

〖技术人必学的职业规划白宝书 - 职业规划篇②〗- 进入职场前必须要考虑的问题

历时18个月,采访 850 得到的需求。 不管你是在校大学生、研究生、还是在职的小伙伴,该专栏有你想要的职业规划、简历、面试的答案。说明:该文属于 技术人必学的职业规划白宝书 专栏,购买任意白宝书体系化专栏可加入TFS-CLUB 私域社…

如何优雅的使用各类LLM

近几个月,随着ChatGPT的风靡,大型语言预训练模型也如雨后春笋般地涌现,虽然效果差强人意,好在不受限制。配置稍好的电脑也能跑个7B、13B参数的大语言模型。 虽然模型众多,但是如果给每一个模型都单独去配置环境&#x…

Go语言的条件判断和循环语句

目录 【if语句】 if语句的内部变量 if语句的优雅写法 【switch语句】 switch语句的特点 switch语句的表达式类型 switch获取变量类型 x.(type) 【for语句】 for语句的变体 for...range break 和 continue goto for 语句的常见“坑”与避坑方法 Go语言的条件判断有…

数组map用法以及特殊值的情况

数组map用法以及特殊值的情况 一、map用法的说明 map(callbackFn, thisArg); // callbackFn回调函数,thisArg可选 callbackFn是个回调函数,该回调函数的参数按照顺序为element(当前正在处理的元素),index&#xff0…

深化企业数据智能应用 用友敢当“急先锋”

面对扑面而来的数字经济时代,一场轰轰烈烈的企业数智化转型正进行得如火如荼。 然而许多企业虽然明知道数智化转型势在必行,但是又担忧自己不具备相关能力。这些企业在数据和智能上面临哪些挑战?如何才能如何加速数智化创新?AIGC和…

人机融合智能与哲学

GPT系列的大型语言模型(LLM)在初步成功之后,需要人们重新审视图灵的计算理论,重新认识计算的本质和形式,重新思考计算机和计算机理论,以及深入思考计算的家族、广义的计算和计算的哲学等问题。这是因为GPT系…

从面对代码下不去的文章,到DBA群讨论

开头还是介绍一下群,如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,在新加的朋友会分到2群(共…

小米加速技术突破,为充电生态赋能,领航未来

5月13日,中国电工技术学会电力电子专业委员会第十八届学术年会在上海召开。小米公司作为快充技术领域代表,手机部基带总监杨玉巍出席本次年会并发表以《小米下一个十年的“助推器”——硬件技术创新与应用》为主题的报告,介绍小米最新的充电技…

简单做一下 银川第九届数模A题

A题 随着三年新冠疫情结束后第一个五一假期的到来,许多人选择出门旅游,在有限的几天假期怎样玩好就是一件值得考虑的事。小明是一位旅游爱好者,想在五一期间到宁夏一些著名景点旅游。由于跟着旅游团会受到若干限制,所以他&#xf…

Google Bard 对战 ChatGPT4

话题之一:如何降低血压 我家老爷子血压有点高,所以我挑了这么个话题。 如果用中文来问 Bard, 有点欺负它,那么索性用英文 1. Bard 在速度上占有绝对优势 2. GPT4 在最后一条监测就医建议上,完胜。 很多老人得过且过,不…

OpenCV实战(24)——相机姿态估计

OpenCV实战(24)——相机姿态估计 0. 前言1. 相机姿态估计2. 3D 可视化模块 cv::Viz3. 完整代码小结系列链接 0. 前言 校准相机后,就可以将捕获的图像与物理世界联系起来。如果物体的 3D 结构是已知的,那么就可以预测物体如何投影…