AI 绘画Stable Diffusion 研究（十三）SD数字人制作工具SadTlaker使用教程

AI 绘画Stable Diffusion 研究（十三）SD数字人制作工具SadTlaker使用教程

news2026/2/14 16:57:41

免责声明:
本案例所用安装包免费提供，无任何盈利目的。

大家好，我是风雨无阻。

想必大家经常看到，无论是在产品营销还是品牌推广时，很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵，少则几千，多则上万。

那么如何才能免费制作属于自己的数字人视频呢？

其实很简单，只需要在stable diffusion上安装sadtalker插件就能轻松生成自己的数字人。

如果还没安装sadtalker插件的朋友，请查看我的上一篇文章AI 绘画Stable Diffusion 研究（十二）SD数字人制作工具SadTlaker插件安装教程。

今天我们就来演示如何使用SadTlaker插件制作一个会说话的数字人视频。

大家跟着我的步骤，赶紧实操起来，看看效果。

1、准备图片

图片：准备一张人物正面图片，我们可以用sd 文生图或图生图功能生成，也可以是其他的图片。

这里再演示一下，使用sd 图生图，生成一张正面图片的步骤。

（1）、去C站找一张正面图作为参考

在这里插入图片描述

（2）、下载大模型： majicMIX realistic 麦橘写实，并把它放到 models\Stable-diffusion 目录下

然后重启 Stable-diffusion 让模型生效。

\sd-webui-aki-v4.2\models\Stable-diffusion

在这里插入图片描述

（3）、下载图片，并上传到图生图，然后设置相关参数

上传图片
设置正向提示词、反向提示词
CLP 终止层数设置为：2
设置随机种子
设置采样方法
设置重绘制尺寸
开启面部修复（重要：不开启，人物面部会出现斑点或痣）

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

（4）、点击生成，可以获得一张人物正面图片

在这里插入图片描述

2、准备音频文件

音频文件格式： MP3或wav 文件。

音频文件允许的长度：由显存大小决定。

音频文件的生成：可以使用chatgpt 生成文案，再使用配音工具生成音频，保存起来。当然也可以自己录制音频，这里就不再详细演示。

这里为了演示，提前准备了一段 14s 左右的音频。

3、使用SadTlaker 合成数字人视频

（1）、功能栏区域，切换到SadTlaker 标签页

在这里插入图片描述

（2）、上传刚刚sd 生成好的人物正面图片

在这里插入图片描述

（3）、上传准备的音频文件

在这里插入图片描述

（4）、参数设置及详解

姿态样式：人脸姿态，一共47个数字，每个姿态都不一样，大家可自行测试选择喜欢的姿态。
脸部模型分辨率：根据分辨率选择自己对口型的模型，如果图片较大就选择512。
预处理：这个设置，与图生图中的设置相同。
静止模式：更少的手势，需要和完整与处理一起使用。
使用GFPGAN 增强面部：是否高清化处理

这是我的设置，如下：

在这里插入图片描述

（5）、点击“生成”按钮，合成视频

视频会在预览窗口显示视频处理状态，控制台也能看到处理进度。

只需等待处理完成即可。

在这里插入图片描述

A、使用预处理完整+静止模式的方式生成的视频：

SD插件SadTlaker制作的会说话的数人

B、使用预处理裁剪方式生成的视频：

SD插件SadTlaker制作的会说话的数人2

对比效果：

A 方式生成的视频动作幅度更小，但是图片使用的是原尺寸。

B 方式生成的视频动作幅度更大，图片被裁剪，但是效果更真实自然一些。

好了，SD数字人制作教程就到此结束。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/905420.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

spring事件监听event(默认的mq)

spring事件监听event(默认的mq)

文章目录前言一、event是什么？二、使用步骤1.事件2.事件监听3.发布事件三、测试结果总结前言项目中的业务难免是相互关联的,但是代码中我们应该尽量做到低耦合,常见的做法就是引入mq来作为松耦合的一种手段; 其实最常见的解耦和就是接口了,MVC直接通过接口(约定…

阅读更多...

反弹shell bash -i命令

反弹shell bash -i命令

目录 0x01 什么是反弹shell？ 0x02 命令拆分详解 0x03 文件描述符 0x04 shell 输入/输出重定向 0x05 输入输出结合获得shell 什么是反弹shell？ 假设有两台主机 A(控制端) B(被控端) 正向shell，就是ssh、Telnet的连接&#xf…

阅读更多...

YOLOv5源码中的参数超详细解析（4）— 推理部分detect.py

YOLOv5源码中的参数超详细解析（4）— 推理部分detect.py

前言：Hello大家好，我是小哥谈。YOLOv5是一种先进的目标检测算法，它可以实现快速和准确的目标检测。detect.py是YOLOv5项目目录结构中的一个重要的脚本文件，它用于执行目标检测任务，可以通过命令行参数指定要检测的图像…

阅读更多...

【三维重建】Factor Fields: 超越神经场的统一框架

【三维重建】Factor Fields: 超越神经场的统一框架

论文：Factor Fields: A Unified Framework for Neural Fields and Beyond 文章：https://arxiv.org/abs/2302.01226 项目：https://apchenstu.github.io/FactorFields/ 文章目录摘要一、前言二、Factor Fields2.1.字典场（DiF&#…

阅读更多...

二级MySQL（三）——数据库的增删改查

二级MySQL（三）——数据库的增删改查

创建一个新的数据库： CREATE DATABASE db_school DEFAULT CHARACTER SET GB2312 DEFAULT COLLATE GB2312_chinese_ci； 查找创建的数据库（全部）： 其他的是SQL自带的数据库查阅我们自己创建的字符集以及对应的字符集…

阅读更多...

Qt 实现 360 安全卫士

Qt 实现 360 安全卫士

作者： 一去、二三里个人微信号： iwaleon 微信公众号： 高效程序员回想起来，这也算是一个有故事的代码。虽然时间比较久远，但还是记忆犹新。那就简单说说吧，也不枉费当年的一片心血！ 说说我的…

阅读更多...

java可变字符串

java可变字符串

一、常用方法以StringBuilder为例 1、append(String str) 添加 StringBuilder str new StringBuilder("hello"); System.out.println(str);//在源字符串后添加world StringBuilder add str.append("world"); System.out.println(add);//结果helloworl…

阅读更多...

Platypus：Quick，Cheap，and Powerful Refinement of LLMs

Platypus：Quick，Cheap，and Powerful Refinement of LLMs

Platypus：Quick，Cheap，and Powerful Refinement of LLMs IntroductionMethod2.1 Curating Open- PlatypusRemoving similar&duplicate questionsContamination CheckFine-tuning & mergingResult参考Introduction 现在大模型已经取得很不错的结果，如何把大模型的能…

阅读更多...

PL 侧驱动和fpga 重加载的方法

PL 侧驱动和fpga 重加载的方法

可以解决很多的问题时钟稳定后加载特定fpga ip （要不内核崩的一塌糊涂）fpga 稳定复位软件决定fpga ip 加载的时序 dluash load /usr/local/scripts/si5512_setup.lua usleep 30 mkdir -p /lib/firmware cp -rf /usr/local/firmare/{*.bit.bin,*.dtbo} …

阅读更多...

css 实现svg动态图标效果

css 实现svg动态图标效果

效果演示： 实现思路：主要是通过css的stroke相关属性来设置实现的。 html代码: <svgt"1692441666814"class"icon"viewBox"0 0 1024 1024"version"1.1"xmlns"http://www.w3.org/2000/svg"p-id"…

阅读更多...

jps（JVM Process Status Tool）：虚拟机进程状况工具

jps（JVM Process Status Tool）：虚拟机进程状况工具

jps（JVM Process Status Tool）：虚拟机进程状况工具列出正在运行的虚拟机进程，并显示虚拟机执行主类名称（Main Class，main()函数所在的类）以及这些进程的本地虚拟机唯一ID（LVMID&am…

阅读更多...

VMware上搭建的虚拟机突然本地无法连接服务器

VMware上搭建的虚拟机突然本地无法连接服务器

长时间没有使用VMware 虚拟机了，今天突然登录上去，启动虚拟服务器后发现本地等不了了， 经过排查发现是开启了：VirtualBox Host-Only Network 关闭之后就本机就可以直连服务器了

阅读更多...

java能实现热替换而属性不丢失的原因

java能实现热替换而属性不丢失的原因

1.替换的是klass，数据在oop里面 2.这个没想通说明对java面向对象底层实现不了解。

阅读更多...

Midjourney API 申请及使用

Midjourney API 申请及使用

在人工智能绘图领域，想必大家听说过 Midjourney 的大名吧！ Midjourney 以其出色的绘图能力在业界独树一帜。无需过多复杂的操作，只要简单输入绘图指令，这个神奇的工具就能在瞬间为我们呈现出对应的图像。无论是任何物体还是任何风…

阅读更多...

linux中shell脚本——shell数组、正则表达式及文件三剑客之AWK

linux中shell脚本——shell数组、正则表达式及文件三剑客之AWK

目录一.shell数组 1.1.数组分类 1.2.定义数组方法二.正则表达式 2.1.元字符 2.2.表示次数 2.3.位置锚定 2.4.分组 2.5.扩展正则表达式三.文本三剑客之AWK 3.1.awk介绍及使用格式 3.2.处理动作 3.3.awk选项 3.4.awk处理模式 2.5.awk常见的内置变量 2.6.if条…

阅读更多...

5.5.webrtc的线程管理

5.5.webrtc的线程管理

今天呢，我们来介绍一下线程的管理与绑定，首先我们来看一下web rtc中的线程管理类，也就是thread manager。对于这个类来说呢，其实实现非常简单，对吧？ 包括了几个重要的成员，第一个成员呢就是ins…

阅读更多...

2021年12月 C/C++（三级）真题解析#中国电子学会#全国青少年软件编程等级考试

2021年12月 C/C++（三级）真题解析#中国电子学会#全国青少年软件编程等级考试

第1题：我家的门牌号我家住在一条短胡同里，这条胡同的门牌号从1开始顺序编号。若所有的门牌号之和减去我家门牌号的两倍，恰好等于n，求我家的门牌号及总共有多少家。数据保证有唯一解。时间限制：1000 内存限制：65536 输入一个正整数n。n < 100000。输出一行，包含…

阅读更多...

DTC 19服务学习2

DTC 19服务学习2

紧跟上篇 0x04 reportDTCSnapshotRecordByDTCNumber 通过DTC和快照序列来获取DTC快照记录。适用以下假设： — 服务器支持存储给定 DTC 的两个 DTCSnapshot 记录的能力。 — 此示例假定是上一个示例的延续。 — 假设服务器请求服务器存储的 DTC 编号 123456 的两个…

阅读更多...

【学会动态规划】环绕字符串中唯一的子字符串（25）

【学会动态规划】环绕字符串中唯一的子字符串（25）

目录动态规划怎么学？ 1. 题目解析 2. 算法原理 1. 状态表示 2. 状态转移方程 3. 初始化 4. 填表顺序 5. 返回值 3. 代码编写写在最后： 动态规划怎么学？ 学习一个算法没有捷径，更何况是学习动态规划， 跟我…

阅读更多...

使用 Amazon Redshift Serverless 和 Toucan 构建数据故事应用程序

使用 Amazon Redshift Serverless 和 Toucan 构建数据故事应用程序

这是由 Toucan 的解决方案工程师 Django Bouchez与亚马逊云科技共同撰写的特约文章。带有控制面板、报告和分析的商业智能（BI，Business Intelligence）仍是最受欢迎的数据和分析使用场景之一。它为业务分析师和经理提供企业的过去状态和当前状…

阅读更多...

推荐文章

最新文章