sadtalker-- 本地生成数字人

news2024/11/23 15:18:17

文章目录

    • 概要
    • 工具讲解
    • 安装流程
      • 1. 安装Python
      • 2. 安装FFmpeg
      • 3. 安装Sadtalker
      • 4. 导入模型
    • 使用流程
      • 1. 生成语音
      • 2. 上传图片跟语音
      • 3. 点击生成,漫长等待
      • 4. 虚拟内存
    • 小结

概要

sadtalker,可以根据图片以及语音,生成动态视频,跟现在的数字人直播电商差不多,制作成视频后加个推流到直播间即可。本章节,主要记录从无到有搭建sadtalker环境,期间也出现了多个问题,也做了相应的记录。

工具讲解

这里把安装包都集成了,需要的可以自行下载,也可以根据官网提示自行下载…
百度网盘:此处

  1. python-3.10.6-amd64:必须是这个版本,github官网也是这样说的
  2. Everything 64位_1.4.1.1024:用于寻找本地文件的,找到pip.ini文件,并且删除,避免其他源造成环境污染
  3. 7-Zip 64位_23.1.0.0:用于解压文件,系统自带的话可不用安装
  4. checkpoints:模型文件,解压到sadtalker 根目录即可 {{sadtalkerDir}}/checkpoints
  5. ffmpeg-release-full:用于数字人运行环境
  6. SadTalker-main:数字人运行文件

安装流程

sadtalker github:此处

官方流程简化版

  1. 安装Python 3.10.6,选中“将 Python 添加到 PATH”。
  2. ffmpeg按照此说明安装。
  3. 下载我们的 SadTalker 存储库。.
  4. 下载checkpoint以下gfpgan ↓。
  5. 进入根目录,执行 webui.bat 文件。

1. 安装Python

下载地址:Python 3.10.6
需要选中下方复选框,将环境添加到系统中...
在这里插入图片描述

2. 安装FFmpeg

官方下载地址:FFmpeg
官方傻瓜式教程:此处
太多步骤了,简单来说就是下载后,添加到环境变量...
略…

3. 安装Sadtalker

下载

在这里插入图片描述

解压

在这里插入图片描述

运行webui.bat

在这里插入图片描述
这里报错了
ERROR: Could not find a version that satisfies the reguirement torch==1.12.1+cu113 (from versions: 2.0.0, 2.0.1)
ERROR: No matching distribution found for torch==1.12.1+cu113

检测后发现是其他python版本3.11.x 问题,重新安装python3.10.6即可…

  1. 卸载其他版本,并且删除遗留的配置文件
  2. 安装python3.10.6
  3. 重启电脑
  4. 删除sadtalker文件夹
  5. 重新解压运行webui.bat

在这里插入图片描述
再次运行webui.bat
好家伙,又失败了…
在这里插入图片描述

这边用everything,清空了其他的python环境,并且将之前设置的清华源配置文件删除了,删了SadTalker-main 文件夹,重新来一遍。
并且在上面那个步骤,用了科学上网然后就可以了…

删除配置文件

在这里插入图片描述

效果如下:

在这里插入图片描述

又报错了...到这里就可以正常打开了,但是呢,不可以生成,因为还没有导入模型...

在这里插入图片描述

打开命令行CMD,看看报错信息
在这里插入图片描述

4. 导入模型

官网上也可以找到,这边直接放在网盘了,解压即可

在这里插入图片描述

使用流程

1. 生成语音

在这里插入图片描述

2. 上传图片跟语音

在这里插入图片描述

3. 点击生成,漫长等待

在这里插入图片描述

等不了了,太慢了,还是手动下载 (缺啥下啥就好了)

在这里插入图片描述

ctrl+鼠标左键,然后科学上网下载。。。

在这里插入图片描述
在把科学上网关闭,重新打开 webui.bat,重新生成视频,如下:

在这里插入图片描述
短一点的语音没问题,我放了30s的语音就报错了,可能是内存原因,如果你报错了,可以继续执行第四步…

4. 虚拟内存

系统设置-
在这里插入图片描述
在这里插入图片描述


终于可以了~~~
在这里插入图片描述

小结

本章节到这里就结束了,下一步尝试接入opengpt,干就完事了…

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/766578.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

怎么将拼接的字符串element组件通过“v-html“渲染到页面

如上图所示&#xff0c;没那么多废话&#xff0c;直接上代码 html中 <div id"app"><div :html"tempHtml"></div> </div>vue中 new Vue({el: #app,data() {return {tempHtml: }},created() {this.getHtml()},mounted() {window.…

Java学到什么程度可以在当下面试找工作?

今年的面试主打一个字&#xff1a;卷&#xff01; 随着经济环境下行&#xff0c;大厂降本增效、筛除了一部分冗余岗位&#xff0c;原本荒蛮的IT行业发展正在逐步进入正轨中。虽说今年就业环境不容乐观&#xff0c;但数据不会骗人&#xff0c;以Java为例&#xff0c;在职友集上…

gd32f103vbt6 串口OTA升级3-linux端的部分

一. 简介 本文主要是对linux端升级单片机程序的功能部分做一些介绍&#xff0c;包括一些软件流程。 二.硬件部分 2.1 rk3399cpugd32f103 2.2 连接方式&#xff1a;串口&#xff08;115200&#xff0c;8N1&#xff09;或者iic&#xff08;本文没有介绍iic&#xff09; 三、其…

[nlp] GPT

一、联合训练任务 1.1 NTP(Next Token Prediction) gpt预训练的一个目标函数有两个,第一个是基础的下一个词预测任务,选择一个K窗口,将窗口中的K个词的embedding作为条件去预测下一个词。 1.2 TC(Text Classification) 第二个是一个分类任务,一段话给一个标签,然后去预…

Qt 获得QTableview所选中的行的某一列数据

1、点击QtableView控件-》右键-》跳到槽-》选择 2、编写槽函数信息 void XXX::on_tableView_CalTable_clicked(const QModelIndex &index) {int rowindex.row();//获得当前行索引int colindex.column();//获得当前列索引QModelIndex index1 CalViewModel->index(row,2)…

开鸿智谷与华秋达成生态共创合作,共同打造OpenHarmony硬件生态

7月11日&#xff0c;在2023慕尼黑上海电子展现场&#xff0c;开鸿智谷数字产业发展有限公司(以下简称“开鸿智谷”)与深圳华秋电子有限公司(以下简称“华秋”)签署了生态共创战略合作协议&#xff0c;共同推动开源鸿蒙OpenAtom OpenHarmony(以下简称“OpenHarmony”)硬件生态繁…

在线图片处理工具:让您的图片处理更加轻松

在我们日常生活和工作中&#xff0c;图片已经成为了一种非常常见的媒介。然而&#xff0c;有时候我们会遇到一些问题&#xff0c;例如图片过大不能上传或下载等等。在这种情况下&#xff0c;我们需要一个功能强大的图片处理工具&#xff0c;来解决这些问题。今天&#xff0c;我…

Visual Studio 向工程中添加现有文件夹

前言&#xff1a; 在创建C#类库&#xff08;dll&#xff09;工程后&#xff0c;需要把现有的C#文件添加进工程中 步骤1.将所有文件夹复制到工程中 步骤2. 点击这个图标&#xff0c;显示所有文件夹 工程目录下的所有文件夹都会被显示出来 选中需要添加的文件夹&#xff0c;右…

Ceph 应用(CephFS文件存储、块存储、对象存储)

目录 一&#xff1a;创建 CephFS 文件系统 MDS 接口 1、服务端操作 &#xff08;1&#xff09;在管理节点创建 mds 服务 &#xff08;2&#xff09;查看各个节点的 mds 服务 &#xff08;3&#xff09;创建存储池&#xff0c;启用 ceph 文件系统 &#xff08;4&#xff09;…

C#(六十二)之泛型的约束

类型约束 基类约束有两个重要的目的。 1&#xff1a;它允许在泛型类中使用有约束指定的基类成员。 2&#xff1a;确保只能使用支持指定基类或派生类的类型实例。 约束是使用 where 上下文关键字指定的。 下表列出了五种类型的约束&#xff1a; 约束 说明 T&#xff1a;str…

C++初阶 - 2.类和对象(上)

目录 1.面向过程和面向对象初步认识 2.类的引入 3.类的定义 4.类的访问限定符及封装 4.1 访问限定符 4.2 封装 5.类的作用域 6. 类的实例化 7.类对象模型 7.1 如何计算类对象的大小 7.2 类对象的存储方式猜测 7.3 结构体内存对齐规则 8. this指针 8.1 this指针的…

网络--练习错题笔记

1、SNMP是简单网络管理协议&#xff0c;与邮件发送无关 发送邮件&#xff1a;SMTP协议&#xff0c;简单邮件管理协议 用户发送邮件是利用SMTP协议将编辑好的邮件送往发送端的邮件服务器 2、mac地址前24位是厂商编号 来自IEEE&#xff0c;后24位来自厂商&#xff0c;区别每一个…

5.0蓝牙模块助力车联网实现简便、安全连接-车载蓝牙模块SKB501参考设计

车载电子系统正向智能化、信息化和网络化方向发展&#xff0c;无线通信技术在汽车等移动系统中有着广泛的应用前景。车联网通过蓝牙技术可以实现与各种设备进行无缝、快速的连接&#xff0c;针对这部分应用需求&#xff0c;SKYLAB研发推出的5.0蓝牙模块SKB501&#xff0c;该模块…

Linux调试器------gdb的使用【Linux系统编程】

目录 背景&#xff1a; 指令&#xff1a; 背景&#xff1a; &#xff08;1&#xff09;debug和release&#xff1a;debug可以调试&#xff08;形成可执行程序时会有调试信息&#xff09;&#xff0c;release不可以。Linux下默认是release版本。如果要以debug版本发布&#…

Spring Boot 3.x 自动配置详解

基于Spring Boot 3.1.0 系列文章 Spring Boot 源码阅读初始化环境搭建Spring Boot 框架整体启动流程详解Spring Boot 系统初始化器详解Spring Boot 监听器详解Spring Boot banner详解Spring Boot 属性配置解析Spring Boot 属性加载原理解析Spring Boot 异常报告器解析Spring Bo…

《爆肝整理》保姆级系列教程-玩转Charles抓包神器教程(3)-再识Charles

1.简介 上一篇通过宏哥的介绍想必各位小伙伴或者童鞋们对Charles已经有了一个理性地认识&#xff0c;今天宏哥在从Charles的外貌介绍和分享一下&#xff0c;让小伙伴们或者童鞋们再对Charles有一个感性的认识&#xff0c;今天主要是对Charles的界面进行一个详细的介绍。 2.Ch…

CSS:给子元素设置了浮动,页面缩放的时候,子元素往下掉

前言 给子元素设置了浮动&#xff0c;页面缩放的时候&#xff0c;子元素往下掉 html代码&#xff1a; <div class"father"><div class"child1"></div><div class"child2"></div> </div>css代码 .child1…

SSD 读写擦相关知识

1. 简述闪存的工作原理及存储和记录数据 每个闪存芯片中有海量的存储单元&#xff08;Cell&#xff09;&#xff0c;下图是一个闪存存储单元的示意图&#xff0c;从上到下包括控制栅极、氧化层、浮栅层、隧道氧化层和衬底&#xff1b;左侧是源极&#xff0c;右侧是漏极。电流只…

【如何将无序知识库构建为结构化的语义知识库?《知识图谱:方法、工具与案例》将带你进入崭新的世界】

知识图谱开创了人工智能的新范式&#xff0c;以数据驱动和知识驱动相结合&#xff0c;开启了下一代人工智能&#xff0c;实现了人与人、人与机器、机器与机器的协同协作。此外&#xff0c;知识图谱突破了传统的人工智能研究领域&#xff0c;从广泛的文本、结构化、视觉和时序等…

WMS仓储管理系统项目实施,该如何调研

随着企业业务的不断发展&#xff0c;仓储管理逐渐成为企业竞争力的重要因素之一。为了提高仓储管理的效率和准确性&#xff0c;越来越多的企业选择引入WMS仓储管理系统解决方案。本文将探讨在WMS系统项目实施过程中&#xff0c;如何进行调研以确保项目的成功实施。 一、项目调研…