AI表情神同步!LivePortrait安装配置,一键包,使用教程

news2025/1/13 10:04:06

快手在AI视频这领域还真有点东西,视频生成工具“可灵”让大家玩得不亦乐乎。

现在又开源了一款超好玩的表情同步(表情控制)项目。

一看这图片,就知道是小视频平台出的,充满了娱乐性。发布没几天就已经有8000+Star。

项目简介

LivePortrait 是一款由快手团队开发的高效肖像动画工具,通过隐式关键点框架,从静态图像生成动态视频。该工具可以让用户通过驱动视频生成逼真的面部表情和头部动作。这款工具不仅可以用于人脸动画,还能扩展到动物肖像,提供了广泛的应用场景。

该项目主页核心介绍其实就一句话“Bring portraits to life!” 可以理解为让“ 将肖像变得栩栩如生!”。

下面先简单说一下这个项目的特点,然后分享一下本地安装方法,最后是一件包和使用方法!

项目特点

表情神同步

这个项目的表情同步非常传神,这也是这个项目最大的特点。

嘴巴和眼神的同步,比较惊艳。

可以驱动图片和视频

可以用一段带有人物脸部表情的视频去驱动一张图片,同时也可以用视频驱动视频。

前者高效,只要你能拿到一张脸部照片,就可以让这张照片开口说话,做出各种表情。

后者高能,用视频驱动视频,会显得效果更加自然。

素材支持广泛

只要是带脸和五官的东西,基本都能玩。

“肖像”可以包括 真人照,动漫人物,名画中的人物,甚至是兵马俑和动物。

单独修改眼睛和嘴巴

除了视频生成之外,还可以“一键P图”。

就是那种一键闭眼一键睁眼。一键闭嘴一键张嘴那种。当然也可以,闭上眼张开嘴。有一定的可玩性。

电脑配置要求低

AI视频和AI绘画是非常消耗配置的项目,比如很多基于SDXL的AI绘画类项目,模型动不动就是10G+,显存需求动不动就是16G+甚至24G。但是这个项目好很多,预训练模型才600M+。模型小就意味着显存需求也很低!

安装配置比较简单

这个项目配置起来非常简单。只需要根据项目主页的命令一行一行复制、粘贴、运行即可。Windows下安装依赖无需踩坑,直接装就可以了。除了Windows之外也支持基于M系列的macOS系统。

本地安装

云端的都是别人的,本地的才是自己的。下面来说一说如何本地安装,如果看过我之前的安装配置的文章,这个项目的安装会非常简单。

先保证本地电脑已经具备如下软硬件:

  • NVIDIA中高端显卡
  • Windows11系统
  • Python环境
  • Git工具

外加,懂一点CMD命令。就可以立马开干了。

克隆代码

使用git命令克隆源代码。

git clone https://github.com/KwaiVGI/LivePortrait
cd LivePortrait

克隆源代码之后,使用cd命令,进入到项目文件夹。

创建虚拟环境

使用conda工具创建一个虚拟环境,做本地隔离。


conda create -n LivePortrait python=3.10
conda activate LivePortrait

创建一个名为LivePortrait的基于Python3.10的虚拟环境,并且激活这个虚拟环境。

安装依赖

Python环境创建之后之后,通过req依赖文件,一键安装依赖

# 针对 Linux and Windows 用户
pip install -r requirements.txt

# 针对macOS M系列
pip install -r requirements_macOS.txt

注意,Windows和Linux用户用上面的命令,使用requirements.txt里的依赖列表来安装。Macos的用户使用专属的macOS.txt文件来安装。

安装之前要保证网络通畅,或者设置好了pip镜像。

下载模型

经过上面的步骤,安装配置就已经完成了。接下来是要获取模型。

通过命令获取:

#安装lfs,已经装过可以忽略
git lfs install

#下载模型
git clone https://huggingface.co/KwaiVGI/LivePortrait temp_pretrained_weights
mv temp_pretrained_weights/* pretrained_weights/
rm -rf temp_pretrained_weights

这些命令会从huggingface上下载模型,并放置到pretrained_weights文件中,由于HF已经被嗝屁了,所以局域网用户可能不是太方便。

通过网盘获取:

项目主页给出了百度盘,谷歌盘,我也会整理好放在我的网盘,见文末。

模型的文件的目录结构如下:

pretrained_weights
├── insightface
│   └── models
│       └── buffalo_l
│           ├── 2d106det.onnx
│           └── det_10g.onnx
└── liveportrait
    ├── base_models
    │   ├── appearance_feature_extractor.pth
    │   ├── motion_extractor.pth
    │   ├── spade_generator.pth
    │   └── warping_module.pth
    ├── landmark.onnx
    └── retargeting_models
        └── stitching_retargeting_module.pth

模型并不是很大,网络好的话,下载起来很轻松。

快速运行推理

模型下载完成,并放置到指定路径之后,就可以运行了。

无界面运行:

# Linux and Windows
python inference.py

# For macOS with Apple Silicon, Intel not supported, this maybe 20x slower than RTX 4090
PYTORCH_ENABLE_MPS_FALLBACK=1 python inference.py

直接用Python运行推理文件,这样软件会自动找演示素材,自动合成视频。

这种方式适合开发者快速验证环境,但是使用起来不是很方便。所以推荐第二种运行式。

使用网页版:

# For Linux and Windows users (and macOS with Intel??)
python app.py

# For macOS with Apple Silicon users, Intel not supported, this maybe 20x slower than RTX 4090
PYTORCH_ENABLE_MPS_FALLBACK=1 python app.py

运行上述命令之后,就会使用基于Gradio的WEBUI了。

安装配置运行完成之后,下次要再次使用,输入如下命令即可。

切换到项目文件夹所在盘,比如E盘,

然后使用CD命令进入文件夹,

然后激活虚拟环境,

然后运行app.py。

网页版使用说明

运行成之后,复制URL地址到浏览器打开,就可以看到界面了。

①左边上传源(Source)素材

②右边上传驱动(Driving Video)视频

③点击动画按钮(Animate)开始合成

这里的源素材,可以是图片,也可以是视频。而驱动视频自然自能是视频。界面上有一些参数,默认即可。

视频处理完成之后,就会显示在下面了。

左边是被驱动的图片,右边的是效果对比图。界面上只有三个头像的对比视频。

如果需要合成的最终视频,就是包含整个人物的完整视频,可以在文件夹中找到。

文件夹路径为:LivePortrait\animations

RTX3060上面,整个过程消耗了5.8G显存,125秒时间。

除了视频功能,还有一个改变图片表情的功能。

网页往下滚动,找到Retargeting功能。

通过调整target eyes-open ratiotarget lip-open ratio这两参数,可以得到不同程度的表情。

0为闭合,0.8为张开,可以取一个极端值,或者中间值。

①左边的Retargeting Input里面选择或者上传一张图片。

②然后修改一下参数,比如把眼睛和嘴巴的参数设置为0.8。

③最后点击Retargeting运行

最后就可以获得一张传世名作《蒙娜丽莎的惊讶》了。

另外通过相对俯仰(Relative Pitch)、相对偏航(Relative Yaw)和相对翻滚(Relative Roll)等参数可以改变 人脸的朝向。

这么一来,蒙娜丽莎就惊掉下巴了。

一键运行包

安装配置使用都说完了,最后简单说一下一键运行包。

一键运行包就是把上面的所有命令,模型,环境全部放在一起,省去了配置下载的过程。

只需要下载,解压,双击运行即可。

通过网盘可以下载到一个叫tonyhub-liveportrait-v1.0.0.7z的压缩包文件。

解压这个文件,在解压后的文件夹中找到run.exe。

双击exe文件启动软件。

看到Runing on local URL 表示启动成功,同时浏览器会自动打开,并显示表情同步生成的界面。然后根据上面操作来,就可以轻松制作一个表情同步的视频了。

这个项目是比较适合做搞笑短视频的,也可以用自己的表情嘴型去控制别人的表情和嘴型,配合上AI变声器,也是有非常大的可玩性。

给公众发送“LivePortrait”获取软件包!

博客:https://www.tonyisstark.com/2815.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1968555.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

7月Langchain-Chatchat 0.3.1最新 win系统-安装教程,踩坑2小时,5分钟拿去!

Win11安装 langchain-chatchat 0.3.1最新版 1. 虚拟环境安装和python包安装 conda create -n chat310 python3.10#这里很重要 需要先安装cuda版本的torch pip install torch2.3.1 torchvision0.18.1 torchaudio2.3.1 --index-url https://download.pytorch.org/whl/cu121pip…

六种方法实现Python文件之间的互动!

一、exec() 首先,我们生成一个名为**“file1.py”的python文件**: # file1.py print("Hello from file1!")然后,再生成一个名为“main.py”的python文件: # main.py filename file1.py with open(filename) a…

vlunstack-1(横向,phpmyadmin拿shell,xycms拿shell,cs和msf联动)

Vulnstack-1 内网环境搭建 环境配置: 靶机介绍 包括win7的web端,还有win2003为域成员,域控为win2008 win7内网ip:192.168.157.153 外网ip:192.168.52.143 域成员 win2003 ip 192.168.52.141 域控 win2008 ip 192.168…

基于WEB的仓库管理系统的设计与实现

点击下载源码 基于WEB的仓库管理系统的设计与实现 摘 要 仓库物品的管理是与我们的日常生活息息相关的一个重大问题。随着我国经济飞速的发展,改革开放的不断深入,企业要想在激烈的市场竞争中立于不败之地,要想继续的发展与生存&#xff0…

IDEA报错无效的目标发行版:17

问题描述:由于要接手另外一个项目,之前项目用的jdk17,新项目用的jdk8。需要切换jdk,idea切换之后启动报错 检查之后发现是没切换完全,一共需要切换如下几个地方: 切换前提:电脑上安装了多个版本…

八戒会修特斯拉 气囊电脑 rcm故障代码RCM2_a442_presFrntRDoorOpen

--------------------------------------------------------------------------------------------------------------------------------- -------------------------------------- 作者: 八戒会修特斯拉 -------------------------…

手机在网状态接口如何对接?(一)

一、什么是手机在网状态? 传入手机号码,查询该手机号的在网状态,返回内容有正常使用、停机、在网但不可用、不在网(销号/未启用/异常)、预销户等多种状态。 二、手机在网状态使用场景? 1.信贷审核&#…

MySQL是怎样运行的——第2章 启动选项和系统变量

文章目录 2.1 在命令行上使用选项2.1.1 选项的长形式和短形式 2.2 配置文件中使用选项2.2.1 配置文件的路径2.2.2 配置文件的内容2.2.3 配置文件的优先级 2.3 命令行和配置文件中启动选项的区别2.4 系统变量2.4.1 简介2.4.2 查看系统变量2.4.3 设置系统变量2.4.4 启动选项和系统…

Java原生序列化与反序列化、URLDNS

配套课件地址:https://blog.csdn.net/mocas_wang/article/details/10762101 1. 概述 1.1 序列化与反序列化 序列化是指把Java代码转化为字节序列的过程;而反序列化时指把字节序列恢复为Java对象的过程。序列化分为两大部分:序列化和反序列化…

mindspore框架实现ckpt模型导出ONNX格式

mindspore框架保存及加载模型 详细流程:昇思-保存及加载模型 关键步骤 关键代码 from mindspore import export, load_checkpoint, load_param_into_net from mindspore import Tensor import numpy as np from MobileNet2GarbageCls.MobileNetv2 import *# 有…

第二证券:商业航天概念再活跃,航天晨光5连板,航新科技等涨停

商业航天概念1日盘中再度活跃,到发稿,航新科技、春晖智控“20cm”涨停,航天雄图涨超10%,航天长峰、航天晨光、星网宇达、航天科技、航天展开等均涨停,航宇微涨近10%。 值得注意的是,航天晨光已接连5个交易…

如何对同一个项目,不同分支,开两个IDEA窗口?

问题:有次我想参考(fu zhi)某个分支的代码,来写代码,但是打开双击项目的pom文件,会自动打开现在的IDEA窗口,如下: 解决:后面我用Open的方式打开,也是一样的。…

免费【2024】springboot 大棚蔬菜管理系统的设计与实现

博主介绍:✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌ 技术范围:SpringBoot、Vue、SSM、HTML、Jsp、PHP、Nodejs、Python、爬虫、数据可视化…

【漏洞复现】万户 ezOFFICE协同管理平台 getAutoCode SQL注入

文章目录 0x00 漏洞描述影响范围 0x01 测绘工具0x02 漏洞复现0x03 Nuclei检测脚本0x04 修复建议0x05 免责声明 0x00 漏洞描述 万户OA ezofice是万户网络协同办公产品多年来一直将主要精力致力于中高端市场的一款OA协同办公软件产品,统一的基础管理平台,实现用户数据…

Thread-Caching Malloc 简介

文章目录 Google的tcmalloc(Thread-Caching Malloc)简介主要特点工作原理应用场景安装与配置 总结 🎖 博主的CSDN主页:Ryan.Alaskan Malamute 📜 博主的代码仓库主页 [ Gitee ]:ryanala [GitHub]&…

第十三章 数据质量

本章重点内容: 1.重要的数据先开始处理 2.要知道PDCA(计划-执行-检查-行动) 3.知道数据质量的评估维度 4.进行根因分析以找出数据质量问题的根源 5.数据质量报告 1. 概述 与数据治理和整体数据管理一样,数据质量管理不是一个…

031-GeoGebra中级篇-GeoGebra的布尔值

在 GeoGebra 中,布尔值和条件判断是实现动态数学模型和交互式几何图形的重要工具。布尔值,即逻辑值,只有两个可能的取值:真(True)或假(False)。通过使用布尔值,我们可以创…

css揭秘-学习小结

0 引言-编码技巧 尽量用相对单位,比如字体大小和行高,如果是绝对值每次两个都要改,如果是相对值则只要改一个。 0.1 代码易维护和代码量不可兼得 为一个元素添加宽10px的边框,左侧不带边框,有两种方案 border-widt…

中科大保卫处招聘要求硕士学历:考研还有用吗?

希望同学们在看到类似这样的新闻或者热搜的时候,首先要明白很多事情都存在“幸存者偏差”。 我们不能“管中窥豹”,用特例去认识整体,当然,特例的出现或者存在也是有一定道理的,我们也不能完全忽视特例的存在。 所以…

QPieSeries-饼状图

void Widget::initWindowQPie() {//[1] 创建饼图QPieSeries* pSeries new QPieSeries();pSeries->append("苹果", 15);pSeries->append("西瓜", 30);pSeries->append("香蕉", 10);pSeries->append("葡萄", 25);pSeries-&…