干货分享|如何使用Stable Diffusion打造会说话的数字人?

news2024/11/15 5:45:21

数字人已不是什么新鲜名词了。在许多领域,尤其是媒体和娱乐领域,经常可以看到卡通形象的人物或逼真的虚拟主持人。在Stable Diffusion中,我们可以上传一段录制好的音频文件,然后使用SadTalker插件,将音频和图片相结合,让图片上的角色开口说话。

在 WebUI中单击 “SadTalker”选项卡,在 “上传图像”窗口中上传角色图片,在“上传音频或TTS”窗口中上传音频文件,如图所示。

在右侧的“设置”窗口中选择脸部模型的分辨率,勾选“使用GFPGAN增强面部” 复选框,然后单击“生成”按钮,如图所示。

提 示: 

上传的音频时 长决定了生成视频的时长,在 绘世启动器进程窗口的底部可 以查看生成进度。

视频生成完毕后,我们可以在下方的窗口中预览视频效果。单击WebUI上方的“设 置”选项卡,在左侧的列表中单击“SadTalker”,就能看到视频文件的输出路径,如图所示。

相对于其他插件来说 , SadTalker的配置较为复杂。如果配 置出现问题导致在输出路径中找不到 视频文件,则可以单击预览窗口右上 角的 按钮手动保存处理好的视频文 件,如图所示。

在“预处理”选项组中有5 个选项,其中“裁剪”和“裁剪 后扩展”选项会把上传的原图裁 剪成只留下角色的面部,让头部 运动看起来更加自然,如图所示。

“完整”选项不对参考图进行裁 剪,因此当角色的头部运动较大时, 可能出现脖子区域撕裂的问题。此时 需要勾选“静止模式”复选框,以 减少角色的头部运动。“缩放”选项 让参考图的背景和角色的身体产生缩 放和平移运动,脖子区域的撕裂问题 仍然存在,并且运动的效果也不够自 然。另外,选择“填充至完整”选项 会用参考图填充头部以外的区域,但 如果参考图的宽高比不是1:1,可能会出现严重的画面撕裂,如图所示。

本期内容就到此啦,下期讲解如何快速打造瞬息全宇宙,关注我不迷路,有机会白嫖书籍哦!

本文摘自《解密AI绘画与修图:Stable Diffusion+Photoshop》,获出版社和作者授权发布。

解密AI绘画与修图:Stable Diffusion+Photoshop——jd

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2041838.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

怎么用打印功能导出为文件为pdf格式

概述 有时候我们再打印的时候需要把文件打印出来的同时,但又想下载下来该文件为pdf格式!该怎么办接下来我来教大家解决办法! 方法一 安装WPS PDF虚拟打印机:‌首先,‌从可靠的来源下载WPS PDF虚拟打印机的安装包。‌这…

HAProxy负载均衡详细解释

目录 1、HAProxy的负载均衡 1.1socat工具的使用 1.1.1对于单进程 1.1.2对于多进程处理方法(对haproxy做热处理) 2、Haproxy的算法 2.1静态算法 <1>static-rr <2>first 2.2动态算法 <1>roundrobin <2>leastconn <3>random 2.3其他算…

基于SSM的考试管理系统---附源码16535

目录 摘要 Abstract 1 绪论 1.1课题目的及意义 1.2研究背景 1.3研究方法 1.4论文结构与章节安排 2 考试管理系统的设计与实现系统分析 2.1 可行性分析 2.2 系统功能分析 2.3 系统用例分析 2.4本章小结 3 考试管理系统的设计与实现总体设计 3.1 系统架构设计 3.2 …

C语言:基于单链表实现通讯录项目

前言 之前我们用顺序表实现了通讯录&#xff0c;这次我们使用单链表实现。我们定义五个文件&#xff0c; SingleLinkedList.h SingleLinkedList.c Contact.h Contact.c test.c SingleLinkedList.h 是包含了单链表的结构&#xff0c;及各类库文件声明&#xff0c;各个单链表接…

优思学院|六西格玛绿带重不重要?绿带的报考条件是什么?

在最原始的六西格玛管理之中&#xff0c;六西格玛的最主要角色就只有六西格玛黑带&#xff0c;这是Mikel Harry所命名的&#xff0c;意思是一个对六西格玛方法十分熟练的人。 然而&#xff0c;六西格玛黑带也要靠团队才能完成工作&#xff0c;如果团队中只有黑带了解六西格玛流…

AcWing算法提高课笔记——数字三角形

本文给出了几道数字三角形模型的题解。 数字三角形模型通常给定一个矩阵&#xff0c;从矩阵的左上角走到右下角&#xff0c;每次只能向右走或者向下走&#xff0c;求最大值或者最小值。 这种问题可以用f[i, j]来表示从[1, 1]走到[i, j]处的Max\Min&#xff0c;有状态转移方程…

minikube 实践练习4 - 滚动更新

1. 应用版本更新 #查看image kubectl describe pods#设置应用的image为新版本 v1 -> v2 kubectl set image deployments/kubernetes-bootcamp kubernetes-bootcampdocker.io/jocatalin/kubernetes-bootcamp:v2#验证更新结果 export NODE_PORT"$(kubectl get services/…

在Moodle中集成ONLYOFFICE:学习管理+文档功能全面指南

一、引言 随着在线教育的发展&#xff0c;Moodle作为领先的开源学习管理系统&#xff0c;其灵活性和可扩展性为教育工作者提供了丰富的功能。而ONLYOFFICE文档服务器的加入&#xff0c;更是为Moodle用户带来了无缝的文档处理与协作体验。本文将详细指导您如何在Moodle中深度集成…

【数据结构】二叉树篇

文章目录 1.二叉树链式结构功能的实现1.1 前置说明1.2 二叉树的遍历1.2.1 前序、中序以及后序遍历1.2.2 层序遍历 1.3 节点个数以及高度差1.3.1 二叉树的节点个数1.3.2 二叉树叶子节点个数1.3.3 二叉树第K层节点个数1.3.4 二叉树树查找值为x的节点1.3.5 二叉树的销毁 1.4 代码整…

RAG 工具和框架介绍: Haystack、 LangChain 和 LlamaIndex

Haystack、 LangChain 和 LlamaIndex&#xff0c;以及这些工具是如何让我们轻松地构建 RAG 应用程序的&#xff1f; 我们将重点关注以下内容&#xff1a; HaystackLangChainLlamaIndex 增强LLM 那么&#xff0c;为什么会有这些工具存在呢&#xff1f;如你所知&#xff0c;C…

LVS学习与练习

LVS (Linux Virtual Server) 是一种高性能的负载均衡解决方案&#xff0c;它基于 Linux 内核实现。LVS 可以用来构建高可用性和高性能的 Web 服务器集群。LVS 支持多种负载均衡算法和模式&#xff0c;可以有效地分发网络请求到多台后端服务器上。 LVS 的主要组成部分 1. Direc…

InternLM+LlamaIndex RAG 实践

本期实战训练营介绍了使用书生葡语的InternLM和LlamaIndex框架进行RAG项目的实践。内容分为三个部分&#xff1a;回顾InternLM的发展历程&#xff0c;介绍RAG的基本概念和应用&#xff0c;以及实践一个RAG项目。RAG技术结合了检索与生成&#xff0c;通过外部知识库增强大模型的…

开源Docker图形化管理工具DockerUI

DockerUI 是一个 Web 用户界面&#xff0c;它允许用户通过浏览器与 Docker 守护进程进行交互&#xff0c;而无需在命令行中执行 Docker 命令。它为 Docker 容器、镜像、网络等提供了直观的图形界面管理。然而&#xff0c;需要注意的是&#xff0c;DockerUI 已经不再是最流行的 …

领先数年!这款ERP系统已成制造业趋势!

企业数字化转型的趋势不可阻挡&#xff0c;在全球化竞争的背景下&#xff0c;市场变化迅速&#xff0c;客户需求日益多样化&#xff0c;企业需要更加敏捷地响应市场变化&#xff0c;提高生产效率和产品质量&#xff0c;以满足客户的需求。 而在这一转型过程中&#xff0c;ERP …

怎么直接在PDF上修改内容?随心编辑PDF内容

PDF(Portable Document Format)作为一种专用于阅读而非编辑的文档格式&#xff0c;其设计的核心目的是保持文档格式的一致性&#xff0c;确保文档在不同平台和设备上都能以相同的布局和格式呈现。然而&#xff0c;在实际工作和生活中&#xff0c;我们经常需要对PDF文档进行编辑…

Python编写Word文档

目录 1. 创建word文档 2. 添加标题、居中、字体16大小 3. 添加标题一 4. 添加一段话并设置字体颜色 5. 换页 6. 插入表格 1. 创建word文档 from docx import Documentdoc Document() 2. 添加标题、居中、字体16大小 from docx.shared import Pt from docx.enum.text i…

AT360-6T杭州中科微授时模块场景应用

AT360-6T是一款高性能多系统卫星定位授时模块&#xff0c;基于自主研发的北斗多系统 SOC 芯片&#xff0c;可以同时接收中国的 BDS(北斗二号和北斗三号)、美国的 GPS、俄罗斯的 GLONASS、欧盟的 GALILEO 和日本的 QZSS 等多个卫星导航系统的 GNSS 信号来实现多系统联合定位授时…

实用篇 | 服务器查看监听端口的程序

对于一些程序员最痛苦的是接手一些“二手系统“&#xff0c; 由于年久失修&#xff0c; 加上裁员离职&#xff0c;系统文档不完善等原因&#xff0c; 只留下服务器配置和代码。 接手人&#xff0c;只能对着这些仅存的代码和服务器硬刚&#xff0c; 对服务器硬刚的第一步&#x…

高盛推荐包装食品行业两大首选股票

市场动荡与食品行业的防御性 近期市场的剧烈波动、7月份疲弱的就业报告以及对美联储可能降息的预期&#xff0c;引发了人们对经济衰退的担忧。尽管市场在本周有所反弹&#xff0c;投资者们开始调整策略&#xff0c;寻求更具防御性的投资方向。在这种背景下&#xff0c;包装食品…

Vue2移动端(H5项目)项目基于vant实现select单选(支持搜索、回显、自定义下拉label展示功能)

一 最终效果 二、参数配置 1、代码示例&#xff1a; <t-selectv-model"formData.materialNo"valueKey"materialNo"showLabel"materialName"labelKey"label"label"判定品级"input-align"right"placeholder&qu…