视频驱动数字人形象,LivePortrait最新模型分享

news2024/12/26 11:56:53

LivePortrait是一个由快手可灵团队开发的高级人工智能肖像动画框架,其主要功能是使静态照片中的面部能够模仿动态视频中的表情变化,从而让照片看起来像是活生生的人在做表情。

LivePortrait采用了基于隐式关键点的方法,而不是传统的扩散方法,来从单一的源图像生成高质量且生动的视频动画,平衡了计算效率和可控性。

LivePortrait在 NVIDIA RTX 4090 GPU 上使用 PyTorch 可以达到每帧 12.8 毫秒的处理速度,这使得它非常适合实时应用。

LivePortrait支持多种风格,包括现实主义、油画、雕塑和 3D 渲染,适用于从创意内容到专业视频制作的不同应用场景。

LivePortrait的github项目地址:https://github.com/KwaiVGI/LivePortrait。

一、环境安装

1、python环境

建议安装python版本在3.10以上。

2、pip库安装

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

3、模型下载

git lfs install

git clone https://huggingface.co/KwaiVGI/LivePortrait

、功能测试

1、命令行运行测试

(1)python代码调用测试

# coding: utf-8

import os.path as osp
import tyro
import subprocess
from src.config.argument_config import ArgumentConfig
from src.config.inference_config import InferenceConfig
from src.config.crop_config import CropConfig
from src.live_portrait_pipeline import LivePortraitPipeline

def partial_fields(target_class, kwargs):
    """Create an instance of target_class with kwargs filtered to only those attributes that exist in target_class."""
    return target_class(**{k: v for k, v in kwargs.items() if hasattr(target_class, k)})

def fast_check_ffmpeg():
    """Check if FFmpeg is installed by attempting to run 'ffmpeg -version' command."""
    try:
        subprocess.run(["ffmpeg", "-version"], capture_output=True, check=True)
        return True
    except subprocess.CalledProcessError:
        return False
    except FileNotFoundError:  # FFmpeg binary not found
        return False

def fast_check_args(args: ArgumentConfig):
    """Perform quick checks on the provided arguments to ensure required files exist."""
    if not osp.exists(args.source_image):
        raise FileNotFoundError(f"source image not found: {args.source_image}")
    if not osp.exists(args.driving_info):
        raise FileNotFoundError(f"driving info not found: {args.driving_info}")

def main():
    # Set tyro theme
    tyro.extras.set_accent_color("bright_cyan")

    # Parse command-line arguments
    args = tyro.cli(ArgumentConfig)

    # Provide default values for source_image and driving_info if they aren't set by command-line arguments
    args.source_image = args.source_image or "assets/examples/source/s0.jpg"
    args.driving_info = args.driving_info or "assets/examples/driving/d0.mp4"

    # Check if FFmpeg is installed
    if not fast_check_ffmpeg():
        raise ImportError(
            "FFmpeg is not installed. Please install FFmpeg before running this script. https://ffmpeg.org/download.html"
        )

    # Perform quick argument checks
    fast_check_args(args)

    # Configure inference and cropping
    inference_cfg = partial_fields(InferenceConfig, args.__dict__)
    crop_cfg = partial_fields(CropConfig, args.__dict__)

    # Initialize LivePortraitPipeline with the specified configurations
    live_portrait_pipeline = LivePortraitPipeline(
        inference_cfg=inference_cfg,
        crop_cfg=crop_cfg
    )

    # Run the live portrait pipeline
    live_portrait_pipeline.execute(args)

if __name__ == "__main__":
    main()

 (2)web端测试

未完......

更多详细的内容欢迎关注:杰哥新技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1969810.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

报表系统之Cube.js

Cube.js 是一个开源的分析框架,专为构建数据应用和分析工具而设计。它的主要目的是简化和加速构建复杂的分析和数据可视化应用。以下是对 Cube.js 的详细介绍: 核心功能和特点 1. 多数据源支持 Cube.js 支持从多个数据源中提取数据,包括 SQ…

怎么给USER新增表空间文件

今天介绍一下docker部署的oralce19c,怎么增加表空间 docker exec -it orcl19c bash 管理员方式登录 sqlplus / as sysdba 增加表空间脚本 ALTER TABLESPACE USERS ADD DATAFILE /opt/oracle/oradata/newdatafile6.dbf SIZE 30720M AUTOEXTEND ON NEXT 10M MAXSIZE…

Linux内核:哈希表hlist_head和hlist_node

linux内核中哈希表使用链接法实现哈希表, 结构体有hlist_head和hlist_node,hlist指向hlist_node。 哈希表具体如下: 以哈希表删除为例: 为什么要使用二级指针?

基于双PI控制器结构的六步逆变器供电无刷直流电机调速simulink仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 4.1 无刷直流电机(BLDCM)原理 4.2 六步换相逆变器 4.3 双PI控制器设计 5.完整工程文件 1.课题概述 基于双PI控制器结构的六步逆变器供电无刷直流电机调速simulink仿真。双PI控制…

作为架构师的你,NoSQL如何选型

什么是 NoSQL? NoSQL数据库是一种非关系型数据库管理系统它和我们传统的关系型数据库(如MySQL、Oracle)不一样。传统数据库要求你在存储数据之前,先定义好数据的结构(称为“schema”),而且数据…

一刷代码随想录(贪心5)

56. 合并区间 题意: 给出一个区间的集合,请合并所有重叠的区间。 示例 1: 输入: intervals [[1,3],[2,6],[8,10],[15,18]]输出: [[1,6],[8,10],[15,18]]解释: 区间 [1,3] 和 [2,6] 重叠, 将它们合并为 [1,6]. 示例 2: 输入: intervals [[1,4],[4…

用户画像系列——Spark任务调优实践

在画像标签的加工和写入hbase中,我们采用了spark来快速进行处理和写入。但是在实际线上运行的过程中,仍然遇到了不少问题,下面来总结下遇到的一些问题 1.数据倾斜问题 其实spark 数据倾斜思路和hive、mapreduce 数据倾斜思路处理类似&…

LED点阵屏(51单片机)

一、LED点阵屏介绍 1.点阵屏介绍及显示原理 2.开发板对应引脚 单片机工作是弱上拉,低电平强,高电平弱。 操作硬件电路是通过操作寄存器实现的 行:D0~D7 列:P0~P7 用P3口的三根线控制D0~D7,使能端OE,OE…

【Android】kotlin RecyclerView遍历json实现列表数据

需求 效果图如下 : 这个ui看起来简单, 其实要实现几个功能点 1. json数据的遍历 2. RecyclerView实现循环的列表 3. 每块元素里的元素点击 : 未选中的话, 首次点击显示"selected", 点击"selected"则进行下一步数据处理 4. 设置默认的选择的元素, 显示sel…

增加一个按钮,批量获取凭证号

create PROCEDURE Cux_Ar_ServiceLedger_Voucher_ProcOrgId Int ,result Int output AS BEGIN SET NOCOUNT ONDECLARE Date DATETIME IF OrgId 0 or OrgIdBEGIN RAISERROR(N获取当前组织ID失败!, 16, 1) RETURNEND SET Date GETDATE()BEGIN TRANSACTION BEGIN…

职场中这三大效应,读懂受用终身

01 霍桑效应 “霍桑效应”也称“宣泄效应”。 霍桑工厂是一家电器公司的分厂。为了提高员工的工作效率,工厂增设了许多娱乐设施,改善工作环境,提高各项福利,但奇怪的是,成效并不理想。 工厂为此又做了许多尝试&…

zabbix应用教程:基于Nginx页面响应的日志监控用例

作者 乐维社区(forum.lwops.cn)许远 背景:某公司基于 Nginx 服务器搭建的网站,需要监控页面响应耗时的数据,因此该公司搭建了zabbix开源监控系统,当监控到页面响应时间超过3000ms阈值时,就进行告…

C语言 | Leetcode C语言题解之第313题超级丑数

题目&#xff1a; 题解&#xff1a; int nthSuperUglyNumber(int n, int* primes, int primesSize) {long dp[n 1];int pointers[primesSize];for (int i 0; i < primesSize; i) {pointers[i] 0;}long nums[primesSize];for (int i 0; i < primesSize; i) {nums[i] …

Mosh|SQL教程第六弹

一、视图 1、创建视图CREATE VIEW viewname AS 这样就可以在左侧导航栏看到新增的view了&#xff0c;如果没有的话刷新一下就好了 可以把视图当表格使用 或者 注意&#xff1a;视图不存储数据&#xff0c;数据存储在表中 练习&#xff1a;创建一个视图&#xff0c;叫做客户结…

2023华为od机试C卷【掌握单词的个数】Python

2023华为od机试C卷【掌握单词的个数】 问题分析 输入内容&#xff1a; 具体的单词数量和单词列表。一个包含字母和 ? 的字符串&#xff0c;该字符串表示可以用来构词的字符。 目标&#xff1a; 计算哪些单词可以由给定字符以及 ?&#xff08;作为通配符&#xff09;构成。 …

政安晨:【Keras机器学习示例演绎】(五十七)—— 基于Transformer的推荐系统

目录 介绍 数据集 设置 准备数据 将电影评分数据转换为序列 定义元数据 创建用于训练和评估的 tf.data.Dataset 创建模型输入 输入特征编码 创建 BST 模型 开展培训和评估实验 政安晨的个人主页&#xff1a;政安晨 欢迎 &#x1f44d;点赞✍评论⭐收藏 希望政安晨的…

Python 中的 “私有”(实现)类

在 Python 中&#xff0c;尽管没有严格意义上的私有类&#xff08;private class&#xff09;&#xff0c;但可以通过命名约定和语言特性来模拟实现类似的访问控制。Python 的私有类的概念通常是通过以下几种方式来实现&#xff1a; 1、问题背景 我正在编码一个由两部分组成的…

数值分析——分段低次插值

关键字&#xff1a;Matalb&#xff1b;曲线拟合&#xff1b;高次病态特性&#xff1b;分段低次插值 系列文章目录 数值分析——拉格朗日插值 数值分析——牛顿插值多项式 数值分析——埃尔米特&#xff08;Hermit&#xff09;插值 文章目录 系列文章目录前言一、理论推导1.高次…

Python面试宝典第25题:括号生成

题目 数字n代表生成括号的对数&#xff0c;请设计一个函数&#xff0c;用于能够生成所有可能的并且有效的括号组合。 备注&#xff1a;1 < n < 8。 示例 1&#xff1a; 输入&#xff1a;n 3 输出&#xff1a;["((()))","(()())","(())()"…

泛化的最近点迭代法(Generalized-ICP)

Generalized-ICP算法是由斯坦福大学的Aleksandr V. Segal、Dirk Haehnel和Sebastian Thrun提出的&#xff0c;于2009年在Robotics science and system会议上发表。 GICP是一种ICP算法的变体&#xff0c;其原理与ICP算法相同&#xff0c;之所以称为泛化的ICP算法是因为大多数ICP…