使用midjourney搞出一套三国人物画像!

news2025/1/19 22:07:44

  当下已进入如火如荼的全民AI时代,最近体验了下midjourney,使用它的以图生图功能生成出来一套三国人物画像,和大家分享下使用心得。

使用midjourney的准备工作

下载工具

  使用midjourney生产图片依赖的工具和流程,大致如下:

image.png

  • [1] 下载Discord App
  • [2] 添加Midjourney Bot
  • [3] 发送交互指令
  • [4] 生成图片

image.png

  midjourney.commidjourney的官网,可以跟随网站引导提示完成使用体验。较为推荐和常见的使用姿势是在discord.com下载discord app后添加midjourney bot来进行指令交互完成图片生成。

image.png

交互流程

image.png

  对于图片的生成主要是通过输入给midjourney一些prompt和参数来完成的。

  • prompt 可以分为文本和图片两种类型,可以同时存在施加干预
  • 参数 常用参数如--ar指定图片比例、--vmidjourney版本等

参考midjourney参数

以图生图

指令

  以图生图的指令结构非常简单,如下:

/imagine [url] [prompt] [param]

url:上传到midjourney的图片url

prompt:影响midjourney的提示

param:midjouryney支持的参数配置

出图流程

image.png

  • [1] 上传图片:在本地选择一张图片上传到midjourney,支持jpgpng等通用格式,而bmp等格式需要转换后方可上传
  • [2] 复制图片地址:复制图片地址以备发送交互指令后使用
  • [3] 发送交互指令
/imagine https://s.mj.run/wws8EMAvHdE
she is a woman,in ancient China,2 foot tall doll in pixar::2 
--ar 3:4 --v 5 --q 2 --s 750 
--no braid,barbarians,earrings,glasses,wrinkle,baldness
  • [4] 生成图片:根据出图体感做v1~v4u1~u4prompt调整直到生成最满意的图

初体验

  • 文字生图/以图生图的差别

image.png

  在纯文字prompt的场景下,生成出来的图是一个几乎全未知的结果,需要进行大量的prompt调整才可能达到要求,在我进行纯文字prompt测试的case中几乎没有一张能够满足我的出图要求,这既有个人指令熟练度、覆盖度的原因,也有文字prompt相对局限性的问题,当下涌现了很多prompt网站,很多近乎成品的图和对应prompt被分享出来,但是拿着一致的prompt不一定拿到一致的图,存在很大的随机性、不稳定。

  但是,以图生图的好处是可以通过一个已经存在的图像,让AI来识别,基于“模板”来进行二创,在我进行以图生图prompt的测试case中拿到满意出图效果。如果你的出发点是通过已有图片做较为稳定性的出图,比如给自己的照片做卡通形象,以图生图是很好的一种实现形式。

  • 模型数据影响

  对于出图描述体感上更符合欧美人群,而且亚裔人的描述并不是很符合现实,猜测和训练数据有一定关系,如果prompt不进行细节描述,描述很难符合预期。

最佳实践

  总结一句话就是:喜欢的原型图 + 喜欢的风格 = 二创满意的图!

image.png

  • 第一步: 在prompt分享网站找到自己喜欢的midjourney生成好的图片,如https://lexica.art/ ,大部分是支持关键字检索的,可以检索自己期望的风格、物品等描述。
  • 第二步: 查看它的prompt进行参考,过于简短的prompt没有太大参考价值,主要参考哪些风格系描述,如cartoon(卡通)、painting(绘画)等,这里我想要给我找到的原型图卡通一点的形象,我抽取了prompt为2 foot tall doll in pixar (皮克斯的 2 英尺高娃娃)作为我的出图效果设定。
  • 第三步 对图片细节进行详尽描绘,具体可以参考如下人物特征描述。如果你对于细节要求不高,对出图效果比较佛系,可以简单描述核心特征即可。比如我在二创三国人物时候,会给简单prompt提示,如:
//性别
a man,
//中国古代
in ancient China,
//皮克斯风格,这里配置了权重::2,增强midjourney的感知
2 foot tall doll in pixar::2
//我需要3:4比例的图片
--ar 3:4

  如果需要更为详尽的人物特征刻画,可以参考下面这组prompt。值得一提的是,并不是事无巨细越全越好,而是要挑选重点进行描述,以图生图的好处之一是已经有一个成型的图片模板,AI会识别它的特征,而我们二创只需要基于它进行“改版”做适当微调就可以。
image.png

错误陷阱

  在使用过程中也遇到很多badcase,这里分享下:

  • 颜色敏感

  在一个测试case中发现,midjourney对颜色词汇非常敏感,但是也容易产生混乱,比如:

//带红色的帽子
wearing a red hat,
//穿绿色的衣服
wearing a green clothes,

  有时候会只识别到一种颜色,而且会把整个画面变得过于“色彩化”。

  • 配合权重设置

  权重设置可以参考上面的参数列表使用,它相当于是prompt的手动调优,让AI“重视”你的选择和倾向。比如,我在使用皮克斯这个风格的时候AI有时会”忽略“我的prompt,因此我会设置它的权重,增强这个prompt的存在感。

//设置权重,增强存在感
2 foot tall doll in pixar::2
  • 画“手”很难

  AI对手的描述并不是很好,很多时候可能是“4指怪”、“6指怪”,握住东西,拉开一张弓等等,都是比较难的动作,需要反复调优prompt或者“碰运气”。

  • 女性角色更容易

  从我自身测试case来看,女性角色的以图生图刻画更贴近并且更容易接受一些,出图效果更符合预期,男性角色可能由于图画中夹杂了更多的人物外物品如刀、枪、弓等,原型图刻画张力更复杂有关系,偶尔会出现匪夷所思的效果。

效果展示

  下面是一些没有做太多微调的粗制版,供大家参考。

原型图皮克斯风格
关羽.jpg关羽.png
0001_张飞_3.png张飞.png
赵云.bmp赵云.png

资料整理

网站描述
https://discord.com/社群工具,相当于一个IM端可以在群内拉入midjourney bot进行交互
https://midjourney.commidjourney官网
https://atoolbox.netprompt网站
https://ai.dawnmark.cnprompt网站
https://lexica.art可以根据关键字来查看midjourney已生成的作品,相当于通过已生成图来反查对应的prompt,如果喜欢类似风格和样式,可以参考prompt被己所用
https://www.mubucm.com/doc/_2As4DSE4mB站一个还不错的prompt分享
https://jpg2.cn/免费的批量图片转换网站,midjourney只接收jpg/png等格式,如果有bmp等格式可以尝试使用它来做转换
三国志14人物头像链接: https://pan.baidu.com/s/1X5kBnAqRXUG2uj7Kms4BDA 提取码: 2qex

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/532327.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Parasoft和TASKING联手提供卓越的汽车软件开发和自动化测试

​​Parasoft与TASKING宣布建立合作 2023年4月26日,全球嵌入式软件测试解决方案领导者Parasoft宣布与汽车嵌入式软件开发工具行业领导者TASKING建立合作伙伴关系。Parasoft和TASKING的合作为汽车行业提供了一套完整的软件全生命周期解决方案,通过CI/CD工…

Shell基础学习---2、运算符、条件判断、流程控制

1 、运算符 1、基本语法 “$((运算式))”或‘“$[运算式]” 2、案例实操 2 、条件判断 1、基本语法 (1)test condition (2)[ condition ] (注意condition前后要有空格) 注意:条件非空即为tr…

批量域名综合信息查询-域名批量注册查询软件

域名综合信息查询 域名是一个网站的重要组成部分,它直接影响着网站的流量和排名。对于网站管理者来说,了解域名的综合信息是非常重要的。为了便于管理者查询和了解域名的综合信息,147SEO提供了免费的域名综合信息查询服务。下面,…

案例9:Java公益物资分配系统设计与实现开题报告

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

k8s系列-eureka部署集群

1.基本信息 2.容器信息 容器镜像名称: xxxx:30002/dmp/eureka:2022.10.08.14.39.17 环境变量 参数名称 参数值 eureka.instance.hostname ${HOSTNAME}.dmp-eureka-cloud eureka.instance.prefer-ip-address false eureka.client.service-url.defaultZone http://dmp-eureka…

CLLC谐振变换器的基波分析

CLLC谐振变换器_基波分析 目录 CLLC谐振变换器_基波分析 目录电路图FHA分析基于FHA的电路增益特性分析 电路图 FHA分析 输入电压FHA分析 谐振输入假设为理想方波 V i ( t ) 4 V i n π ∑ n 1 , 3 , 5... ∞ 1 n s i n ( 2 π n f s t ) V_{i}(t)\frac{4Vin}{\pi}\sum_…

拓尔微芯片TMI33421在家电上的应用、特点及概述

TMI33421是拓尔微最新推出的一款30V, 2A 同步降压DC-DC转换器,在效率和可靠性方面表现俱佳。 高效率:最高可达95% TMI33421是一颗同步降压转换器,将2颗MOS管集成在芯片内部,实现更小的功率损耗,在2A的正常工作电流下&…

第03讲:SpringCloudStream实现分布式事务

需求分析 本案例是通过一个发送短信验证码的功能来实验MQ发送消息时实现分布式事务,思路分析如下 消息生产者生产发送验证码的半消息 生产者执行本地事务(将验证码保存到数据库),并记录事务的ID,如果整个过程不出现异…

[点云学习] 一、点云相关知识了解

1.何谓点云? 点云是一种表示三维空间中对象的数据结构,它由许多离散的点组成。每个点都有自己的位置坐标和可能的其他属性,如颜色、法向量和强度等。点云通常由激光扫描仪、相机或其他传感器捕获,用于创建三维模型、地图或进行遥感…

three.js学习 11 - 1.threejs常用几何体 2.几何体材质自定义 3.材质的旋转与堆叠效果

1.threejs常用几何体 ①.缓冲几何体(立方体) 官网API地址:https://www.three3d.cn/docs/index.html?qgeometry#api/zh/geometries/BoxGeometry ②.圆缓冲几何体 官网地址:https://www.three3d.cn/docs/index.html?qgeometry#a…

内存一致性(Memory Consistency)模型简介

这里写自定义目录标题 1. 前言2 为什么需要内存一致性(Memory Consistency)模型3. 什么是内存一致性(Memory Consistency)模型4. 各种内存一致性(Memory Consistency)模型4.1 顺序一致性(SC: Sequential Consistency)模型4.2 完全存储定序(TSO: Total Store Order)模型4.3 部分…

外贸人如何精准开发客户?Facebook开发客户全攻略

现在做跨境的都了解的一个社媒平台就是Facebook了,因为很多人都会拿Facebook来开发客户,忙里偷闲,今天东哥就来聊聊用Facebook开发客户的一些心得。 用Facebook开发客户的心得 1、利用关键词搜索 使用行业相关的关键词、产品特定的关键词、相…

菁染料-N-羟基琥珀酰亚胺酯Cyanine7-NHS ester活性脂1432019-64-1

CY7-NHS ester是一种荧光染料,具有橙红色荧光。它的化学式为C41H48ClN3O4,分子量为733.64。CY7-NHS的荧光特性适合生物学应用,它的激发波长为750nm,发射波长为773nm,可用于近红外成像。这种标记物可以用于活细胞成像、…

案例10:Java外卖平台设计与实现开题报告

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

web开发中如何知道表单的数据是否发生了变更,后端框架又是如何响应的,都有哪些方案

前言 针对web界面开发,今天对于一些细节做了一点总结与回想,好久不做web开发了,今天竟然都忘记了以前的界面组件、后端orm映射框架的一些基础知识了,今天主要总结的内容是,当界面提交一个表单后,vue是如何…

【JavaEE】wait/notify方法 和 单例模型

目录 前言 1、 wait和notify 1.1、wait()方法 1.2、notify()方法 1.3、wait和sleep 的对比 2、单例模式 2.1、饿汉模式 2.2、懒汉模式 2.3、上述懒汉模式和饿汉模式在多线程情况下是否安全 2.3.1、解决懒汉模式多线程不安去问题 前言 这里补充…

网络安全面试题合集

以下为网络安全各个方向涉及的面试题,星数越多代表问题出现的几率越大,祝各位都能找到满意的工作。 注:本套面试题,已整理成pdf文档,但内容还在持续更新中,因为无论如何都不可能覆盖所有的面试问题&#xf…

瑞吉外卖 - 启用与禁用员工账号功能(8)

某马瑞吉外卖单体架构项目完整开发文档,基于 Spring Boot 2.7.11 JDK 11。预计 5 月 20 日前更新完成,有需要的胖友记得一键三连,关注主页 “瑞吉外卖” 专栏获取最新文章。 相关资料:https://pan.baidu.com/s/1rO1Vytcp67mcw-PD…

最新入河排污口设置论证、水质影响预测与模拟、污水处理工艺分析及典型建设项目入河排污口方案报告书

随着水资源开发利用量不断增大,全国废污水排放量与日俱增,部分河段已远远超出水域纳污能力。近年来,部分沿岸入河排污口设置不合理,超标排污、未经同意私设排污口等问题逐步显现,已威胁到供水安全、水环境安全和水生态安全&#x…

Packet Tracer – 配置 VLAN

Packet Tracer – 配置 VLAN 地址分配表 设备 接口 IP 地址 子网掩码 VLAN PC1 NIC 172.17.10.21 255.255.255.0 10 PC2 NIC 172.17.20.22 255.255.255.0 20 PC3 NIC 172.17.30.23 255.255.255.0 30 PC4 NIC 172.17.10.24 255.255.255.0 10 PC5 NI…