AI绘画Stable Diffusion必看:如何生成人物的全身照实战教程!

news2025/1/12 18:17:09

大家好,我是画画的小强

在小伙伴们私下留言中,关于如何实现人物的全身照一直有人咨询,看来这个问题还是困惑着不少小伙伴,今天我们就这个问题详细讨论一下。

一. 宽高比参数设置

在讨论如何生成图片的全身照之前,我们先来讨论一下Stable Diffusion中宽高比的参数设置。

这2个参数对于最终的出图有非常大的影响。很多小伙伴因为这2个参数的设置不合理导致出来的图片效果很奇怪。

下面是一些小伙伴使用SD1.5的大模型(如majicMIX realistic 麦橘写实_v7)设置不合理的宽高比出的图。

宽高:1080*1920(制作9:16图片)

下面我们重点看一下常用的SD V1.5和SDXL大模型下宽高比的正常设置范围。

对于SD V1.5 模型最优的宽高比:512x512。下面是常用的宽高比:

  • 1:1(正方形):512x512、768x768

  • 3:2(横向):768x512

  • 2:3(纵向):512x768

  • 4:3(横向):768x576

  • 3:4(纵向):576x768

  • 16:9(宽屏):912x512

  • 9:16 (竖屏): 512x912

对于 SDXL 模型最优的宽高比:1024*1024。下面是常用的宽高比:

  • 1:1(正方形):1024x1024、768x768

  • 3:2(横向):1152x768

  • 2:3(纵向):768x1152

  • 4:3(横向):1152x864

  • 3:4(纵向):864x1152

  • 16:9(宽屏):1360x768

  • 9:16(竖屏):768x1360

宽高比设置注意:

  • 宽度和高度最好能被 8 整除。

  • 记住常用比例:1:1, 2:3(3:2)、3:4(4:3)、9:16(16:9)

  • 如果使用基于SD1.5大模型出图分辨率小的话,可以使用后期放大处理(2倍或者4倍)的方式将图片高清放大。

重点说明: 目前最多的问题是使用基于SD1.5的大模型,将生成图片宽高参数值设置为超过1024大小导致生成的图片千奇百怪,甚至大家参照大模型的案例图片在参数设置完全一致的情况下,图片的效果仍然相差甚远。

主要是很多大模型的案例图片经过了后期放大处理,导致图片宽高超过1024,其实在他们生成图片的时候,都是在正常宽高比参数值下生成的。有些小伙伴不了解相关机制,将后期放大的图片宽高当做生成图片时的宽高参数设置,这样就最终导致生成的图片和案例图片效果相差甚远了。


二. 人物的全身照

关于人物全身图处理方式的几种思路。

(1)在正向提示词中添加关键词full body或者full body shot等

(2)如果没有效果,加大关键词的权重 (full body:1.2) 或者(full body:1.5)

(3)如果还是没有效果,适当调整一下图片的宽高设置,将图片的高度调整为图片的宽度的1-2倍,例如生成图片的宽高比设置为3:4。

(4)如果都没有效果,针对我们使用的大模型,在官网看一下详细的说明,有没有对出全身图有这样的限制,或者看一下官网放出的那几张金典的图片,是否可以作出全身图片,然后看一下提示词以及相关参数设置。

下面我们以下面的文生图为例对上面的关键点展开说明。

  • 大模型:万享XL_超写实摄影V8.2

  • 采样器:Euler a

  • 采样迭代步数:25

  • CFG:3

  • 正向提示词:1 super beautiful chinese girl,solo,(full body:1.5),

  • 反向提示词:NSFW,EasyNegative,badhandv4,

  • ng_deepnegative_v1_75t,16-token-negative-deliberate-neg,bad_prompt_version2,ugly,deformed,bad anatomy,low quality,

关于万享XL模型下载请扫描获取哦

full body(全身)关键词的理解

这里以图片宽高1024*1024来说明

一般来说,在提示词中我们使用full body关键词,可能想到的图片效果如下。
在这里插入图片描述

这种是最理想的图片效果,以人物站立姿势来展示全身图的。

由于我们并没有在提示词里面指定人物的姿势,所以使用full body关键词有时候出来的图片效果并不都是站立姿势,比如下面的图片。

坐姿的全身图

躺姿的全身图

身体向前倾的全身图

总结:

(1)关键词full body表示的全身含义,可能包含人物的多种姿势的全身,比如站立、坐姿、躺姿等。所以,如果有时候要表达更为准确的全身含义,需要补充人物姿势的关键词。

(2)关键词full body表示的全身并不一定都是从头到脚都展示。很多时候可能都是大腿以上的部分。

(3)不同的模型对于关键词full body的理解也不一样,有些模型使用full body出图都是站立的全身照,并且从头到脚。比如下面是majicMIX realistic 麦橘写实_v7版本出的图片(提示词和上面一样,宽高为512*512)。

宽高参数值对人物全身照的影响

我们仍然以上面的示例为例,我们将宽高参数值调整为1024*512。

针对万享XL_超写实摄影V8.2,我多次生成了图片,每次图片效果都只有人物的半身照。

这说明,图片的宽高设置对于人物的全身照还是有影响的,如果我们图片的宽高设置不合理,例如本示例中将图片的宽度设置为高度的2倍,出全身图的概率可能会非常小,所以为了更好的实现人物的全身图,可以适当调整图片的宽高设置,将高度调整到宽度1-2倍。

很多时候,将图片的高度设置比宽度大,出现全身照并且人物站立姿势的概率要大很多。

另外,有些摄影的角度可能也会生成人物的全身照,并不需要借助关键词full body, 大家也可以了解一下,当然这些就不在我们讨论的范围之内。

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1811036.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

关于用宽带(拨号)连接VPN无法上网,但是wifi或者热点就可以的问题

参考链接:https://zhuanlan.zhihu.com/p/580929250https://zhuanlan.zhihu.com/p/580929250 https://blog.csdn.net/Yaoyao2024/article/details/132245249文章浏览阅读10w次,点赞161次,收藏515次。很多同学在学习访问学校提供的资源时或者一…

等保一体机案例 | 黑龙江某事业单位档案管理系统借助捷云过二级等保

黑龙江某事业单位,聚焦产业发展的应用技术研究,兼顾重大技术应用的基础研究,满足广东省经济社会发展需要。 由于信创要求,也为了满足《关于加强国家电子政务工程建设项目信息安全风险评估工作的通知》(发 改高技〔2008…

[图解]企业应用架构模式2024新译本讲解13-服务层1

1 00:00:00,150 --> 00:00:05,030 接下来我们来看服务层模式 2 00:00:06,070 --> 00:00:11,740 这也是领域逻辑类型的最后一个模式 3 00:00:13,700 --> 00:00:17,110 我们前面实际上已经见过了,事务脚本 4 00:00:17,240 --> 00:00:19,900 的时候&…

citys

城市边界电子围栏 初始化摄像头、灯光等 let renderer, scene, camera, stats, gui, texture;renderer new THREE.WebGLRenderer({logarithmicDepthBuffer: true,});renderer.setPixelRatio(window.devicePixelRatio);renderer.setSize(window.innerWidth, window.innerHeigh…

如何实现单例模式及不同实现方法分析-设计模式

这是 一道面试常考题:(经常会在面试中让手写一下) 什么是单例模式 【问什么是单例模式时,不要答非所问,给出单例模式有两种类型之类的回答,要围绕单例模式的定义去展开。】 单例模式是指在内存中只会创建…

一颗万能的PD协议芯片,能芯Type-C PD协议芯片“ECP5705”, 它是如何实现PD直流风扇应用呢?

文章目录 文章目录 前言 一、PD风扇方案介绍 二、芯片介绍 三、PD风扇-供电方式 四、能芯科技 PD 协议芯片ECP5705-应用场景 总结 前言 随着USB Type-C接口的普及和PD取电芯片的出现,使得小型家电和电动工具可以通过统一的USB Type-C接口进行充电,极大地…

台灯学生用哪个牌子最好?学生台灯十大名牌排行榜分享

近年来,我们注意到儿童近视的现象呈现出增多且趋于低龄化的趋势。这一变化,部分原因可以归咎于孩子们越来越多地使用电子产品,另一部分则与他们面临的学业压力增加有关。鉴于此,家长们在挑选儿童学习用品时变得格外谨慎&#xff0…

js实现简单计算器词法解析语法解析解释器,带可视化界面

代码 Lexer是词法解析器 Parser是语法解析器 Interpreter 是ast解释器 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0&q…

【启明智显芯片应用】Model3C芯片4.3寸拼图机应用方案

数据显示&#xff0c;618前期&#xff0c;早教启智、智能玩具、科学启蒙、数字阅读类产品销量增长迅猛。当下&#xff0c;90后新生代父母对于孩子的科学启蒙教育愈发重视&#xff0c;他们在给孩子选择学习产品时&#xff0c;越来越倾向于选择寓教于乐的益智类产品&#xff0c;而…

神奇!你见过生成Prompt的Prompt?

目录 先上干货 这个Prompt是怎么来的 道路是曲折的 总结 PART/ 01 先上干货 你怎么会想到这些场景呢&#xff0c;比如健身计划、英语学习、旅游规划等等&#xff0c;其实挺不好意思的&#xff0c;大家被我骗了&#xff0c;这些都是我使用一个Prompt解决的。 对&#xf…

使用OpenLLM在AMD GPU上的分步指南

Step-by-Step Guide to Use OpenLLM on AMD GPUs — ROCm Blogs 引言 OpenLLM是一个开源平台&#xff0c;旨在促进大型语言模型&#xff08;LLMs&#xff09;的部署和使用&#xff0c;支持多种模型&#xff0c;适应不同的应用&#xff0c;无论是在云环境还是本地环境中。在本教…

何为屎山代码?

在编程界&#xff0c;有一种代码被称为"屎山代码"。这并非指某种编程语言或方法&#xff0c;而是对那些庞大而复杂的项目的一种形象称呼。屎山代码&#xff0c;也被称为"祖传代码"&#xff0c;是历史遗留问题&#xff0c;是前人留给我们的"宝藏"…

丽水职业技术学院:以太彩光网络筑基教育信息化标杆之路

丽水职业技术学院作为教育信息化的先行者,是浙江省首批“浙江省高职高水平学校”、“浙江省教育信息化试点校单位”,也是“浙江省数字校园示范校”的一员。学院紧握“十四五”规划契机,全面加速数字化转型,旨在通过基础网络的革新、数字化教学的深化、信息服务的优化、学生管理…

wma和mp3哪个音质好?让我告诉你哪个更胜一筹

在数字音频领域&#xff0c;WMA和MP3是两种常见的音频格式&#xff0c;它们在网络上的音频传输和储存中都扮演着重要的角色。然而&#xff0c;许多人可能会对这两者之间的音质差异产生疑问&#xff0c;想知道哪一个更适合他们的需求。wma和mp3哪个音质好&#xff1f;在本文中&a…

Transformer介绍

Transformer的诞生 2018年Google发出一篇论文《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》, BERT模型横空出世, 并横扫NLP领域11项任务的最佳成绩&#xff01; 而在BERT中发挥重要作用的结构就是Transformer, 之后又相继出现XLNET&a…

如何制作MapBox个性化地图

我们在《如何在QGIS中加载MapBox图源》一文中&#xff0c;为你分享了在QGIS中加载MapBox的方法。 现在为你分享如何制作MapBox个性化地图的方法&#xff0c;如果你需要最新版本的QGIS及高清图源&#xff0c;请在文末查看获取软件安装包的方法。 新建地图样式 进入Mapbox Stu…

[2024-06]-[大模型]-[Ollama]- WebUI

主要涉及要部署的前端webui是来源于:https://github.com/open-webui/open-webui 正常就使用: docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-web…

MySQL—多表查询—练习(1)

一、引言 上几篇关于多表查询的基本几个部分全部学习完了。 多表查询的基本类型的查询包括以下&#xff1a; 1、内连接&#xff08;隐式内连接、显示内连接&#xff09;&#xff1a;... [INNER] JOIN ... ON 条件; &#xff09; 2、外连接&#xff08;左外连接、右外连接&…

中国蚁剑 安装教程 2024年5月

2024/5/11 中国蚁剑 安装教程 一、下载中国蚁剑的加载器和核心源码&#xff08;两个都要用到&#xff09; github官方下载地址&#xff1a;https://github.com/AntSwordProject/ 参考文档&#xff1a;antSword/README_CN.md at master AntSwordProject/antSword GitHub 核…

iPhone - 为什么姓名和付款都变成灰色?

问题描述 为什么姓名和付款都变成灰色&#xff1f;点开订阅也显示图 2 的无法连接&#xff1f; 原因分析 联网 WIFI 没有对『设置』开放权限。 解决方案 设置 - 无线局域网 - 使用无线局域网与蜂窝网络的App - 找到『设置』应用 - 勾选『无线局域网与蜂窝数据』