使用ffmpeg在视频中绘制矩形区域

news2025/1/10 5:48:11

由于项目需要对视频中的人脸做定位跟踪,

我先使用了人脸识别算法,对视频中的每个帧识别人脸、通过人脸库比对,最终记录坐标等信息。

然后使用ffmpeg中的 drawbox 滤镜功能,选择性的绘制区域。从而实现人脸定位跟踪

1、drawbox

在FFmpeg中,drawbox 滤镜的 enable 参数用于控制矩形框绘制的条件和时机。通过这个参数,你可以指定在何时或者在哪些帧上启用 drawbox 滤镜。

enable 参数的语法

drawbox=enable='条件表达式':x=...:y=...:w=...:h=...:color=...:t=...

1.1、常用条件表达式

条件表达式通常是一个布尔表达式,当表达式的值为 true 时,drawbox 滤镜将会被应用。

注意在eq函数中的 反斜杠 \

1.1.1、基于帧编号 (n)

n 表示当前帧的编号,从 0 开始计数。

  • 示例: 仅在第50帧绘制矩形框:
     
    enable='eq(n\,50)'
    解释: eq(n\,50) 表示当帧编号等于50时启用。

1.1.2、基于时间 (t)

t 表示视频当前的时间(单位:秒)。

  • 示例: 在视频的第1秒到第2秒之间绘制矩形框:
     
    enable='between(t,1,2)'

1.1.3、基于帧间隔 (mod)

你可以使用 mod 函数来基于帧间隔绘制矩形框,例如每隔 10 帧绘制一次。

  • 示例: 每10帧绘制一次矩形框:
     
    enable='mod(n\,10)'
    解释: mod(n\,10) 表示 n 除以 10 的余数为 0 时启用滤镜,即每 10 帧启用一次。

1.1.4、基于帧关键帧 (key)

key 表示关键帧的布尔值,1 表示关键帧,0 表示非关键帧。

  • 示例: 仅在关键帧上绘制矩形框:
     
    enable='key'
    解释: 当帧是关键帧时启用滤镜。

1.2、组合条件表达式

你可以通过逻辑操作符(如 and, or, not 等)组合多个条件。

示例:在关键帧中且时间在第1秒到第2秒之间绘制矩形框

enable='key*between(t,1,2)'

示例:从第50帧到第100帧之间,且帧编号是5的倍数时绘制矩形框

enable='between(n,50,100)*eq(mod(n,5),0)'

1.3、完整脚本

ffmpeg -i input.mp4 -vf "drawbox=enable='between(n,50,150)':x=100:y=50:w=200:h=100:color=red@0.5:t=5" output.mp4

参数说明

  • x=100: 矩形框的左上角 x 坐标。
  • y=50: 矩形框的左上角 y 坐标。
  • w=200: 矩形框的宽度。
  • h=100: 矩形框的高度。
  • color=red@0.5: 矩形框的颜色和透明度(0.5 表示半透明)。
  • t=5: 边框的厚度。设置为 t=fill 时表示填充整个矩形。
  • -frames:v 1: 提取第1帧的结果。

上述命令表示 选择帧在50,100之间,绘制(100,50) 到(300,150)的红色区域

注:

如果需要截取某一帧的图片,并保存,使用如下命令

ffmpeg -i input.mp4 -vf "drawbox=x=100:y=50:w=200:h=100:color=red@0.5:t=5" -frames:v 1 output.png

2、批量绘制

需要针对一个视频,进行大批量自定义帧,自定义区域绘制

2.1、使用concat组合多个drawbox

如果需要处理的帧较多,可以使用FFmpeg的滤镜链来组合多个 drawbox 滤镜。这里需要定义每个 drawbox 的启用条件和对应的矩形参数。

假设你需要在第1到第5帧上绘制不同大小的矩形框:

ffmpeg -i input.mp4 -vf "
[0:v]drawbox=enable='eq(n\,1)':x=10:y=10:w=100:h=50:color=red@0.8:t=2,
drawbox=enable='eq(n\,2)':x=20:y=20:w=150:h=75:color=blue@0.8:t=2,
drawbox=enable='eq(n\,3)':x=30:y=30:w=200:h=100:color=green@0.8:t=2,
drawbox=enable='eq(n\,4)':x=40:y=40:w=250:h=125:color=yellow@0.8:t=2,
drawbox=enable='eq(n\,5)':x=50:y=50:w=300:h=150:color=purple@0.8:t=2
" output.mp4

解释

  • 在第1帧(n=1)绘制一个红色的矩形框。
  • 在第2帧(n=2)绘制一个蓝色的矩形框,依此类推。

这种方法适合帧数量较少的情况,随着帧数的增加,命令行也会变得更复杂。

2.2、使用编程语言生成滤镜链

对于100多帧,手动编写每个滤镜配置可能非常繁琐。你可以使用Python等编程语言生成FFmpeg的滤镜配置脚本。

Python 代码生成滤镜链

以下是一个简单的Python脚本,它可以根据输入生成相应的FFmpeg命令:

frames = [
    {"n": 1, "x": 10, "y": 10, "w": 100, "h": 50, "color": "red@0.8"},
    {"n": 2, "x": 20, "y": 20, "w": 150, "h": 75, "color": "blue@0.8"},
    {"n": 3, "x": 30, "y": 30, "w": 200, "h": 100, "color": "green@0.8"},
    # 继续添加帧的配置...
]

filters = []
for frame in frames:
    filters.append(
        "drawbox=enable='eq(n\,{n})':x={x}:y={y}:w={w}:h={h}:color={color}:t=2".format(
            n=frame["n"], x=frame["x"], y=frame["y"], w=frame["w"], h=frame["h"], color=frame["color"]
        )
    )

ffmpeg_command = "ffmpeg -i input.mp4 -vf \"{}\" output.mp4".format(",".join(filters))
print(ffmpeg_command)

这个脚本将生成一个适用于FFmpeg的命令,可以根据需要调整帧号和矩形框的参数。

3、Java完整代码

在下面的代码中,进行转码时,只保留视频部分,音频部分被移除

如果需要可以使用 

-c:a copy 代替 -an

  
import lombok.Data;
import lombok.extern.slf4j.Slf4j;

import java.io.BufferedReader;
import java.io.File;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.List;
import java.util.concurrent.TimeUnit;

/***
 * ffmpeg 命令工具,要求主机必须已安装ffmpeg命令
 * @author xuancg
 * @date 2024/8/19
 */
@Slf4j
public class FfmpegUtil {
 

    /**进行视频区域绘制并进行视频截取 只提取视频,忽略声音 */
    private static final String RECT_CUT_FORMAT = "ffmpeg -i %s -vf \"[0:v]%s\" -ss %s -to %s -an -y %s";

    private static final String RECT_FORMAT = "drawbox=enable='eq(n\\,%d)':x=%d:y=%d:w=%d:h=%d:color=red@0.8:t=2";

     
    /**
     * 先经过批量的视频帧区域绘制,然后在进行视频剪裁
     * @param src 输入文件
     * @param rectList 区域绘制
     * @param startTime 剪裁开始时间00:00:03
     * @param endTime 剪裁结束时间 00:00:23
     * @param dest 目标文件
     * @return
     */
    public static boolean drawRectByBatchFrame(File src, List<FrameRect> rectList, String startTime, String endTime, File dest) {
        String source = src.getAbsolutePath();
        String output = dest.getAbsolutePath();
        if(!src.isFile()){
            log.error("源文件不存在source=" + source);
            return false;
        }
        if(dest.exists()){
            log.error("目标文件已存在dest=" + output);
        }
        long start = System.currentTimeMillis();
        Process process = null;
        BufferedReader reader = null;
        try {
            int size = rectList.size();
            StringBuilder builder = new StringBuilder();
            for (int i = 0; i < rectList.size(); i++) {
                FrameRect rect = rectList.get(i);
                builder.append(String.format(RECT_FORMAT,
                        rect.getFrameIdx(), rect.getX(), rect.getY(), rect.getWidth(), rect.getHeight()));
                if(i < size - 1){
                    builder.append(",");
                }
            }

            String cmd = String.format(RECT_CUT_FORMAT,source.replace("\\","/"), builder.toString(),
                    startTime, endTime,  output.replace("\\","/"));
            log.info("ffmpeg执行命令=" + cmd);
            // 执行命令
            process = Runtime.getRuntime().exec(cmd);

            // 获取命令输出结果
            reader = new BufferedReader(new InputStreamReader(process.getErrorStream()));
            String line;
            while ((line = reader.readLine()) != null) {
                log.debug(line);
            }
            process.waitFor(120, TimeUnit.SECONDS);
            return  dest.isFile() && dest.length() > 100;
        } catch (IOException e) {
            e.printStackTrace();
        } catch (InterruptedException e) {
            log.error("剪裁视频超时source=" + source);
        } finally {
            if(null != process){
                process.destroy();
            }
            if(null != reader){
                try {
                    reader.close();
                } catch (IOException e) {
                    log.error("关闭流失败" + e.getMessage());
                }
            }
            log.info("耗时ms=" + (System.currentTimeMillis() - start));
        }
        return false;
    }


    @Data
    public static class FrameRect {
        private int frameIdx;
        private int x;
        private int y;
        private int width;
        private int height;

        /**
         * 区域外扩10像素
         * @param detail
         */
        public FrameRect(VideoDetail detail){
            this.frameIdx = detail.getFrameIdx();
            this.x = detail.getLeftX() - 10;
            this.y = detail.getTop() - 10;
            this.width = detail.getRightX() - detail.getLeftX() + 20;
            this.height = detail.getBottom() - detail.getTop() + 20;
        }

    }

}

ffmpeg部分脚本命令如下

ffmpeg -i G:/download/20240618121820-video.mp4 -vf "[0:v]drawbox=enable='eq(n\,102)':x=1141:y=158:w=90:h=90:color=red@0.8:t=2,

drawbox=enable='eq(n\,104)':x=1165:y=167:w=94:h=94:color=red@0.8:t=2,

drawbox=enable='eq(n\,105)':x=1179:y=169:w=94:h=94:color=red@0.8:t=2"

-ss 00:00:02 -to 00:00:08 -an -y G:/download/20240618121820.mp4 

视频效果如下图

 

使用eq单独帧,任务较多,

后续可以使用between 范围帧 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2108925.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++项目引入开源库bit7z

摘要&#xff1a; 公司C项目需要能解压缩.tar文件&#xff0c;关键是要在Windows环境下&#xff0c;tar格式主要是Linux中用的压缩文件&#xff0c;还要考虑到用户可能没有Windows自带的tar命令&#xff0c;最终解决方案就是一步到位&#xff0c;考虑到后续的功能拓展引入第三方…

尚品汇-延迟插件实现订单超时取消(四十五)

目录&#xff1a; &#xff08;1&#xff09;延迟插件封装 &#xff08;2&#xff09;基于延迟插件测试 如何保证消息幂等性&#xff1f; &#xff08;3&#xff09;改造订单service-order模块-实现订单超时取消 &#xff08;1&#xff09;延迟插件封装 把消息带过去&#…

computed计算属性及方法对比和循环遍历统计以及watch和watchEect监听的用法

1.computed计算属性及方法对比 1.了解computed计算属性和用法 在我们的一些应用中可以看的应用会给我们提供一些计算类的功能比如取名&#xff0c;它会给你提供两个输入框&#xff0c;然后在你给这两个输入框输入值的时候会在下方生成你输入这个两个值的结合值&#xff0c;就…

Java使用类加载器解决类冲突,多版本jar共存

Java使用类加载器解决类冲突 1、案例说明2、打包新版本POI并将要调用的方法封装2.1、POM文件2.2、封装的方法 3、要使用多个POI版本的项目3.1、打包前面的项目生成一个jar包3.1、POM文件3.2、类加载器代码3.3、Jar加载工具3.4、最终调用 1、案例说明 项目中已经有了一个旧版本…

【后端开发】PHP、go语言、Java、C++、Linux开发等急招中......

本周高薪急招后端开发岗位推荐&#xff0c;PHP、go语言、Java、C、Linux开发等岗位都在热招&#xff0c;月薪最高35K&#xff0c;还不快来&#xff01;&#xff01; 抓紧投递&#xff0c;早投早入职&#xff01; &#x1f447;点击职位名称查看详情&#x1f447; PHP 薪资&…

Leetcode每日刷题之102.二叉树的层序遍历

1.题目解析 本题是关于二叉树的层序遍历&#xff0c;不过这里的难点是如何将每一层的数据存储在数组并将整体存储在一个二维数组中&#xff0c;具体的算法原理我们在下面给出 2.算法原理 关于将每层数据分别存储在不同数组中&#xff0c;我们可以定义一个levelSize变量来存储栈…

网络编程(TCP+网络模型)

【1】TCP 初版服务器 #include <stdio.h> #include <sys/types.h> /* See NOTES */ #include <sys/socket.h> #include <netinet/in.h> #include <netinet/ip.h> #include <unistd.h> #include <arpa/inet.h> #include <string.h…

【学习笔记】SSL/TLS如何运用加密工具

一、前文回顾&#xff1a; 1、SSL/TLS有3个目的&#xff0c;分别由不同密码学工具提供 Confidentiality&#xff08;保密性&#xff09;&#xff1a;数据只有Client和Server才能访问&#xff0c;由Encryption&#xff08;加密&#xff09;所提供Integrity&#xff08;完整性&…

【话题讨论】VS Code:倍增编程动力,实现效率飞跃

目录 引言 一、详情介绍 功能特点 使用场景 提高工作效率 二、效率对比 2.1 高度可定制性与丰富的插件生态 2.2 智能的代码补全与导航 2.3 内置的调试器与版本控制集成 2.4 轻量级与跨平台 2.5 选择合适工具的重要性 2.6 实际案例或数据展示 三、未来趋势 3.1 编…

iOS——Block与内存管理

需要内存管理的情况 1、对象类型的auto变量。 2、引用了 __block 修饰符的变量。 三种block类型 全局类型 &#xff08;NSGlobalBlock&#xff09; 如果一个block里面没有访问普通局部变量(也就是说block里面没有访问任何外部变量或者访问的是静态局部变量或者访问的是全局…

FPGA开发:可编程逻辑器件概述

PLD 1、什么是PLD&#xff1f; PLD指Programmable Logic Device&#xff0c;翻译为"可编程逻辑器件"。是20世纪70年代发展起来的一种新的集成电路&#xff0c;是一种半定制的集成电路。 PLD具有逻辑功能实现灵活。集成度高、处理速度快的特点。 PLD就像是一个可定…

【Vue】pnpm创建Vue3+Vite项目

初始化项目 &#xff08;1&#xff09;cmd切换到指定工作目录&#xff0c;运行pnpm create vue命令&#xff0c;输入项目名称后按需安装组件 &#xff08;2&#xff09;使用vs code打开所创建的项目目录&#xff0c;Ctrl~快捷键打开终端&#xff0c;输入pnpm install下载项目…

IDEA运行Java程序提示“java: 警告: 源发行版 11 需要目标发行版 11”

遇到这个提示一般是在pom.xml中已经指定了构建的Java版本环境是11例如(此时添加了build插件的情况下虽然不能直接运行代码但是maven是可以正常打包构建)&#xff1a; <build><plugins><plugin><groupId>org.apache.maven.plugins</groupId><…

Vue初学-简易计算器

最近在学习Vue的指令&#xff0c;做了一个简易计算器&#xff0c;比较适合刚入门的人参考学习。用到的知识点有&#xff1a; 1.插值表达式 2.v-model&#xff0c;双向绑定、-、*、/、**等操作符 3.v-show&#xff0c;控制操作数2是否显示&#xff0c;乘方时不显示操作数2 4.met…

‌软媒市场—‌软媒市场自助发布平台引领数字营销新风尚

在当今这个信息爆炸的时代,数字营销已经成为企业推广品牌、提升知名度的关键手段。而在众多数字营销工具中,‌软媒市场自助发布平台以其独特的优势脱颖而出,成为众多企业的首选。今天,我们就来深入探讨一下软文媒体自助发布平台如何在软媒市场中发挥重要作用,以及其背后的5万家…

FRP代理(TCP通信)实验

攻击机器---公网机器&#xff08;FRP服务端&#xff09;-TCP传输rdp内容--内网机器&#xff08;FRP客户端&#xff09;--内网本地&#xff08;RDP服务&#xff09; FRP版本&#xff1a;0.49.0 公网IP&#xff08;FRP服务端&#xff09;&#xff1a;192.168.254.131 内网&…

Mindspore 初学教程 - 4. 数据集 Dataset

数据是深度学习的基础&#xff0c;MindSpore 提供基于 Pipeline 的 数据引擎&#xff0c;通过数据集 数据集&#xff08;Dataset&#xff09; 和 数据变换&#xff08;Transforms&#xff09; 实现高效的数据预处理。其中 Dataset 是 Pipeline 的起始&#xff0c;用于加载原始数…

# centos7 安装 mysql

centos7安装mysql 1、添加 mysql 官方 yum 存储库 wget https://dev.mysql.com/get/mysql80-community-release-el7-3.noarch.rpmrpm -ivh mysql80-community-release-el7-3.noarch.rpm2、使用Yum安装MySQL服务器&#xff1a; sudo yum install mysql-server3、启动MySQL服务…

Redis集群技术2——redis基础

Redis安装 Redis 的安装相对简单&#xff0c;无论是 Windows、Linux 还是 macOS 系统&#xff0c;都有相应的安装方法。以下是针对不同操作系统的 Redis 安装简述。 1. Linux 系统安装 Redis 在 Linux 系统中安装 Redis 通常有多种方式&#xff0c;这里以 Ubuntu 和 CentOS 为…

配置阿里云千问大模型--环境变量dashscope

1 开通百炼 首先要进入到阿里云平台&#xff0c;然后进入百炼平台。 2 获取API-KEY 进入之后再右上角可以查看到自己的API-KEY&#xff0c;这个东西就是需要配置在环境变量里的。 点击查看就可以获取 3 配置DASHSCOPE环境变量 如果使用dashscope来进行千问大模型的API对…