一、 MuseTalk 简介
MuseTalk 是由腾讯团队开发的先进技术,它是一个实时的音频驱动唇部同步模型。该模型能够根据输入的音频信号,自动调整数字人物的面部图像,使其唇形与音频内容高度同步。
二、 MuseTalk 一键使用
基础环境最低要求说明:
环境名称 | 版本信息1 |
---|---|
Ubuntu | 22.04.4 LTS |
Cuda | V12.1.105 |
Python | 3.10.8 |
NVIDIA Corporation | RTX 3090 |
1. 选择主机和镜像,一键创建实例
在租用实例页面,通过一键使用进入应用社区
搜索并选择 MuseTalk 大模型
选择 RTX 3090 GPU,点击“立即创建”即可创建实例
2. 进入网页端命令行
在项目实例页面,点击 “WebShell”,进入终端操作页面
- 进入 WebShell 页面,运行后续的功能代码
3. 启动 web 页面
# 切换到 MuseTalk 项目目录中
cd MuseTalk
# 激活 musetalk 的虚拟环境
conda activate musetalk
# 运行 app.py 文件
python app.py
4. 获取端口号
- 第一次使用需要进行实名认证(通过实名认证可跳过此步骤)
- 实名认证之后进行开发对外端口
- 获取访问地址
5. 进入 web 页面
将获取到的链接复制到本地浏览器:
# 比如当前获取的地址如下:
http://hn-a.suanjiayun.com:30758
以上就是在算家云搭建MuseTalk的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。
点击应用社区(suanjiayun.com) ,选择模型,一键开启 AI 之旅!