论文http://openaccess.thecvf.com//content/CVPR2023/papers/Zhang_SadTalker_Learning_Realistic_3D_Motion_Coefficients_for_Stylized_Audio-Driven_Single_CVPR_2023_paper.pdf
github
GitHub - OpenTalker/SadTalker: [CVPR 2023] SadTalker:Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation
这篇东西也算是出来有一段时间了。一直在等训练代码,但是好像遥遥无期,先做个简单的环境记录,等后面训练代码出来连同论文一起记录一下
一.体验
git clone https://github.com/Winfredy/SadTalker.git
cd SadTalker
conda create -n sadtalker python=3.8
conda activate sadtalker
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
conda install ffmpeg
pip install -r requirements.txt
### tts is optional for gradio demo.
### pip install TTS
很顺利,基本上也没啥问题,就是下载checkpoint 有点久
这两个权重我全部丢在百度网盘了
链接: https://pan.baidu.com/s/18ssIL7vrRg_mcov5H6hEQA?pwd=9xkm 提取码: 9xkm
--来自百度网盘超级会员v2的分享
二.训练
等训练代码....