Wav2lip-GAN 环境配置

news2026/2/11 12:35:18

首先使用 conda 创建新的虚拟环境，然后激活这个环境

conda create -n myenv python=3.8
activate myenv

使用 git 克隆代码，或者直接下载源码压缩包解压，安装依赖（我使用的豆瓣源）

git clone https://github.com/Rudrabha/Wav2Lip.git
cd Wav2Lip
pip install -r requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

我修改过后的 requirements.txt 依赖如下：

librosa==0.7.0
numpy==1.17.3
opencv-contrib-python>=4.2.0.34
opencv-python==4.1.2.30
torch==1.8.0
torchvision==0.9.0
tqdm==4.45.0
numba==0.48

接下来需要安装 ffmpeg，这是音视频处理的神器，ubuntu 版本使用 apt 安装

sudo apt install ffmpeg

我是 windows 版本，需手动下载安装，安装地址：ffmpeg

在这里插入图片描述

我这里下载的是 6.0 版本。

解压后将 bin 对应的路径添加到系统环境变量 PATH 中。添加过后需重启电脑使 ffmpeg 生效。

然后下载视频材料：game.mp4

音频材料我是自己找的2s的 mp3文件，命名为 2s.mp3

然后准备模型文件：
（1）脸部检测预训练模型，下载地址：脸部检测模型
放到 Wav2Lip下的 face_detection/detection/sfd 目录下，并重命名为 s3fd.pth。
（2）下载模型文件，我使用的是 Wav2Lip + GAN，下载地址：Wav2Lip + GAN
下载后放在项目根目录。

以上都配好后，执行命令：

python inference.py --checkpoint_path wav2lip_gan.pth --face game.mp4 --audio 2s.mp3

结果出现报错如下：
AttributeError: partially initialized module ‘cv2‘ has no attribute ‘gapi_wip_gst_GStreamerPipeli

解决办法：（这里安装我带上了本机代理、不带安装失败）

pip install opencv-python install "opencv-python-headless<4.3" --proxy http://127.0.0.1:7890

以上问题解决过之后，查看日志输出：

在这里插入图片描述

合成结果输出在 Wav2Lip 中的 results 下。

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/517549.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Wav2lip-GAN 环境配置

相关文章

2022年美国大学生数学建模竞赛A题自行车运动员的能量特征解题全过程文档及程序

js代码执行过程、调用栈、执行上下文

高等数学下册之梯度的笔记

01.LLaMA

判断浏览器是否支持webp图片

windows下升级nodejs

IoT -- 解读物联网四层架构

VMware Aria Automation 8.12 - 现代基础架构自动化平台

python 调用c语言方法详解

(转)雪花算法（SnowFlake）

优化if-else代码的八种方案！

【花雕学AI】多方评测：有没有ChatGPT开发者模式？ChatGPT有可能被“越狱”吗？

HTTPS传输过程中做了哪些事？

JUC并发编程17 | synchronized锁升级

【AI大模型】讯飞版大模型来了！首发通用人工智能评测体系，现场发布四大行业应用成果

SoapUI简易使用

python操作list

进程信号（Linux）

亚马逊云科技工业数据湖x创新应用，助您释放全新生产力

shell脚本之数组，冒泡排序算法