音视频-ffplay的音视频同步

news2025/1/11 5:08:20

最近自己在做一个视频播放器,渲染视频帧时有些疑惑,所以特意来学习一下ffplay中是如何处理视频帧的渲染的!😊

我自己最初的理解是这样

1、只关心视频本身的时间戳,不考虑音视频同步以及其他的同步时钟,或者说以视频帧的时钟为主时钟,那就是渲染一帧视频,然后渲染线程休眠duration时长,再渲染下一帧。

2、视频帧的时钟需要和音频时钟或者其他的主时钟对其,这种情况就会比较复杂一点,每一次渲染都需要和主时钟来检测,当前帧应该立即渲染,延迟还是跳过等等。大致的思路如下:

        获取当前帧的时长,duration;

        然后获取视频时钟与主时钟的差值diff;

        不需要调整的最小阈值sync_min;不需要调整的最大阈值sync_max;小于sync_min时,不需要同步调整,位于sync_min和sync_max之间,需要做调整,大于sync_max时,可能需要跳帧。这个比较还需要考虑本身视频帧的duration,同时还需要从diff的

正负,也就是当前视频始终比主时钟提前还是滞后来判断。

现在来看看ffplay中,是如何来实现这个逻辑的。

ffplay定义了几个阈值如下:

/* no AV sync correction is done if below the minimum AV sync threshold */
#define AV_SYNC_THRESHOLD_MIN 0.04
/* AV sync correction is done if above the maximum AV sync threshold */
#define AV_SYNC_THRESHOLD_MAX 0.1
/* If a frame duration is longer than this, it will not be duplicated to compensate AV sync */
#define AV_SYNC_FRAMEDUP_THRESHOLD 0.1
/* no AV correction is done if too big error */
#define AV_NOSYNC_THRESHOLD 10.0

 比较清晰,从注释就可以看出来含义,不用过多说明。

现在从代码来进入正题,在ffplay.c中有个video_refresh(void *opaque, double *remaining_time),第一个参数就是VideoState,里面保存了播放中的所有数据和状态,第二个可以看到,传入的是一个double指针,这个值在当前修改之后,其值会保留,就是渲染下一帧之前的休眠时长。

static void video_refresh(void *opaque, double *remaining_time) {
    VideoState *is = opaque;
    ...

    // lastvp和vp都是AVFrame;
    // lastvp是上一次展示的视频帧,vp是当前即将展示的视频帧;
    if (lastvp->serial != vp->serial) {
        is->frame_timer = av_gettime_relative() / 1000000.0;
    }

    ...
    // 计算当前帧的时长;
    last_duration = vp_duration(is, lastvp, vp);
    // 计算当前帧的实际展示时长,这个里面是时钟对齐的主要逻辑;
    delay = compute_target_delay(last_duration, is);

    // 这之后就是记录视频展示的时间戳以及需要的休眠时间;
    time = av_gettime_relative() / 1000000.0;
    if (time < is->frame_timer + delay) {
        *remaining_time = FFMIN(is->frame_timer + delay - time, *remaining_time);
        goto display;
    }

    is->frame_timer += delay;
    if (delay > 0 && time - is->frame_timer > AV_SYNC_THRESHOLD_MAX) {
        is->frame_timer = time;
    }

    ...
    // display picture;
    video_display(is);
    ...
}

正常情况下的主要流程就是以上,重点看看vp_duration和compute_target_delay这两个函数的细节。

首先是vp_duration:

static double vp_duration(VideoState *is, Frame *vp, Frame *nextvp) {
    if (vp->serial == nextvp->serial) {
        double duration = nextvp->pts - vp->pts;
        if (isnan(duration) || duration <= 0 || duration > is->max_frame_duration)
            return vp->duration;
        else
            return duration;
    } else {
        return 0.0;
    }
}

这个函数比较简单,两个Frame的serial正常情况下都是相等的,所以这个条件先跳过。使用当前帧与后一帧的差值来作为当前帧的展示时长,如果这个差值异常,就是用当前帧的duration。由于当前帧的duration是在解码之后算出来的,所以在能获取下一帧的情况下,优先使用这个差值。

接下来是compute_target_delay:

static double compute_target_delay(double delay, VideoState *is) {
    double sync_threshold, diff = 0;

    /* update delay to follow master synchronisation source */
    if (get_master_sync_type(is) != AV_SYNC_VIDEO_MASTER) {
        /* if video is slave, we try to correct big delays by
           duplicating or deleting a frame */
        diff = get_clock(&is->vidclk) - get_master_clock(is);

        /* skip or repeat frame. We take into account the
           delay to compute the threshold. I still don't know
           if it is the best guess */
        sync_threshold = FFMAX(AV_SYNC_THRESHOLD_MIN, FFMIN(AV_SYNC_THRESHOLD_MAX, delay));
        if (!isnan(diff) && fabs(diff) < is->max_frame_duration) {
            if (diff <= -sync_threshold)
                delay = FFMAX(0, delay + diff);
            else if (diff >= sync_threshold && delay > AV_SYNC_FRAMEDUP_THRESHOLD)
                delay = delay + diff;
            else if (diff >= sync_threshold)
                delay = 2 * delay;
        }
    }

    av_log(NULL, AV_LOG_TRACE, "video: delay=%0.3f A-V=%f\n",
            delay, -diff);

    return delay;
}

第一个参数delay实际上是前一步得到的当前帧的展示时长,以此为基础来计算具体的实际展示时长。 

1、如果视频时钟作为主时钟时,就直接返回当前delay;

2、视频时钟不是主时钟,就算当前时钟与主时钟的差值diff,然后开始来判断如何同步;

3、以已经定义同步调整上下限为区域,来确定当前要进行同步的阈值,sync_threshold;

4、max_frame_duration是当前视频帧连续的时长阈值,如果diff超过了这个范围,说明此时已经的时间戳已经不连续,此时不属于连续播放,所以不考虑这个情况。接下来的判断可以用下图来表示了:

 

 1、第一个判断,diff属于上图中1的范围,此时,diff+delay应该是在图中3和4的范围,在3范围时,说明当前视频时钟加上当前帧的展示时长仍后落后于主时钟,所以当前帧应该立即展示;如果在4范围,则说明当前帧的展示需要延长一段时间。

2、第一个条件不满足时,diff落在图中2的范围,并且当前帧的展示时长大于AV_SYNC_FRAMEDUP_THRESHOLD,表示此时不会通过复制当前帧来做同步操作,所以直接将diff+delay作为当前帧的实际展示时长。

3、最后一种情况,是当前帧的展示时长不大于AV_SYNC_FRAMEDUP_THRESHOLD,将展示时长的2倍作为延迟,这种情况相当于是复制了当前帧吧。

上面这个方法,主要是将视频时钟与当前主时钟的同步操作,然后还需要计算与前一次视频帧的渲染时间来确定当前帧的渲染已经线程需要需要休眠的时间。

time = av_gettime_relative() / 1000000.0;
if (time < is->frame_timer + delay) {
    *remaining_time = FFMIN(is->frame_timer + delay - time, *remaining_time);
    goto display;
}

is->frame_timer += delay;
if (delay > 0 && time - is->frame_timer > AV_SYNC_THRESHOLD_MAX) {
    is->frame_timer = time;
}

SDL_LockMutex(is->pictq.mutex);
if (!isnan(vp->pts))
    update_video_pts(is, vp->pts, vp->serial);
SDL_UnlockMutex(is->pictq.mutex);

...

frame_queue_next(&is->pictq);

再回头来看以上代码,已知delay是前面计算完成的当前帧实际展示时长,首先time,是获取当的相对时间,is->frame_timer是上一次画面更新的相对时间。

所以第一个判断的逻辑的意义就是,上一次画面更新时间+当前帧时长超过了这个当前时间,表示当前应该展示当前帧,所以调用了直接展示当前帧的逻辑,同时也更新了线程的休眠时长。

如果以上判断不成立,就把当前帧的展示时长累加到frame_timer中,接下来的判断就是,累加当前帧时长之后,仍然没有达到当前时间,并且差值大于同步调整的最大阈值,就将当前的时间作为frame_timer,然后展示当前帧。

然后更新视频帧展示的时钟数据,并且将视频帧队列往后推进,绘制画面。

另外,看一下上面代码中vp和lastvp的来历。

lastvp = frame_queue_peek_last(&is->pictq);
vp = frame_queue_peek(&is->pictq);

// function implementations;
static Frame *frame_queue_peek_last(FrameQueue *f) {
    return &f->queue[f->rindex];
}

static Frame *frame_queue_peek(FrameQueue *f) {
    return &f->queue[(f->rindex + f->rindex_shown) % f->max_size];
}

可以看到,在rindex_shown为0的时候,vp和lastvp其实是同一个位置,在ffplay中这个rindex_shown在队列执行第一次next的时候,会被置为1,并且一直保持这个值。代码中也有使用lastvp、vp、nextvp(索引位置是(f->rindex + f->rindex_shown) + 1)来判断的逻辑,我个人的理解,这样来判断帧与帧之间的关系应该会更可靠一点吧。

以上方法是ffplay作者的思路,也给了我一些启发,从注释里面可以看出来作者其实也有一些疑惑的地方,当然我的疑惑可能比作者更多一点,但大体思路应该是类似,所以我要准备自己去实现一下这个东西,不知道会遇到点什么东西🤔。

如果有幸被大佬们看到,也希望指点一二,感激不尽🫡。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/430809.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

写了那么久的文章,现在才改回来!

大家好&#xff0c;我是即兴小索奇&#xff0c;最近在阅读文章时发现了自己文章的一个缺陷&#xff0c;就记录下来并分享给大家&#xff0c;大家写文章时也可以借鉴。 这是我以前写的的文章&#xff0c;light亮色下显示正常 -当我不经意间把手机调成深色模式阅读文章时&#xf…

Leetcode912.排序数组(三路划分)

文章目录 一、三路划分二、Leetcode912.排序数组 一、三路划分 为何还会有三路划分&#xff1f; 快速排序算法在某个数据大量重复时效率极低&#xff0c;在运行程序时会超出时间限制&#xff0c;为了解决数据大量重复的情况下&#xff0c;三路划分诞生了。三路划分是基于快速排…

第五回:如何使用ListView Widget

文章目录概念介绍使用方法示例代码我们在上一章回中介绍了Container Widget,本章回中将介绍 ListView这种Widget&#xff0c;闲话休提&#xff0c;让我们一起Talk Flutter吧。概念介绍 ListView就是一个滚动的列表&#xff0c;它可以看作是在Column的基础上添加了滚动功能&…

WPS表格查找替换技巧:让你的工作效率翻倍

WPS表格中查找和替换是最基础的操作&#xff0c;看似简单&#xff0c;但是还有很多人在工作中不会熟练使用&#xff0c;其实掌握一些小技巧可以快速提高工作效率&#xff0c;本节课就来介绍几种比较有效的“查找和替换技巧”。 本节课目录&#xff1a; 1、常规的查找和替换 2…

AIGC市场群雄逐鹿,阿里云发出了什么大招?

如果要评选当下IT圈最火爆的话题&#xff0c;相信就算生成式AI&#xff08;Artificial Intelligence Generated Content&#xff0c;简称AIGC&#xff09;甘认第二&#xff0c;也没有人敢认第一。于是我们看到&#xff0c;在ChatGPT快速升级迭代的同时&#xff0c;百度、360、商…

基于树莓派的智能家居控制系统设计论文参考

完整论文咨询可WX联系&#xff1a;gyf1842965496 智能家居控制系统功能实现详细介绍&#xff1a;基于树莓派的智能家居控制系统设计https://blog.csdn.net/G1842965496/article/details/125491350#comments_26030679 目录 论文简述 摘要 随着科技的进步&#xff0c;人们生活水…

DAY 37 shell免交互

Here Document 概述 常用的交互程序&#xff1a;read&#xff0c;ftp&#xff0c;passwd&#xff0c;su&#xff0c;sudo cat也可配合免交互的方式重定向输出到文件 Here Document 的作用 使用I/O重定向的方式将命令列表提供给交互式程序标准输入的一种替代品 格式 命令 &…

创建部署你的第一个智能合约

原文参考地址 【Web3 开发系列教程—创建你的第一个智能合约&#xff08;2&#xff09;】部署第一个智能合约&#xff0c;增加自己的内容 如果你是区块链开发的新手并且不知道从哪里开始&#xff0c;或者你只是想了解如何部署智能合约并与之交互&#xff0c;那么本指南适合你。…

大数据技术(入门篇)--- 使用Spring Boot 操作 CDH6.2.0 Spark SQL进行离线计算

前言 CDH 6.2.0 搭建的环境&#xff0c;并不能直接使用 spark 相关资源&#xff0c;需要对此服务端环境进行一些修改Spark 目前仅支持 JDK1.8, Java项目运行环境只能使用JDK 1.8我这里使用的是 CDH6.2.0集群&#xff0c;因此使用的依赖为CDH专用依赖&#xff0c;需要先添加仓库…

跨平台开发工具怎么选?IDE工具推荐

软件开发工具链的价值&#xff0c;越来越多企业看到了它。近年来&#xff0c;国内也迎来了软件开发工具的自主化浪潮&#xff0c;今天就来跟大家盘点一下2023年十大移动开发IDE工具。 一、Android Studio 作为Android开发IDE工具的首选&#xff0c;Android Studio提供了一个全…

API7 助力头部券商实现数字化转型

背景 随着中国经济步入高质量发展阶段&#xff0c;数字化转型正在被更多的企业提上议程。2021 年证监会出台的《证券期货行业科技发展“十四五”规划》中指出&#xff0c;需“提升证券期货业数据治理水平”&#xff0c;“深化数字化转型标准建设&#xff0c;推动行业数据接口的…

涨点神器:Yolov8引入CVPR2023 InternImage:注入新机制,扩展DCNv3,助力涨点,COCO新纪录65.4mAP!

1.InternImage介绍 论文:https://arxiv.org/abs/2211.05778 代码:GitHub - OpenGVLab/InternImage: [CVPR 2023 Highlight] InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions 理论部分参考知乎:CVPR2023 Highlight | 书生模型霸…

机器学习:LightGBM算法原理(附案例实战)

机器学习&#xff1a;LightGBM算法原理&#xff08;附案例实战&#xff09; 作者&#xff1a;i阿极 作者简介&#xff1a;Python领域新星作者、多项比赛获奖者&#xff1a;博主个人首页 &#x1f60a;&#x1f60a;&#x1f60a;如果觉得文章不错或能帮助到你学习&#xff0c;可…

Python结合Qt实现点击按钮保存并生成自定义word详细讲解(相信我,耐心看完,一定会有收获的)

一、需求介绍 因为我的毕设需要设计一个系统&#xff0c;然后把结果生成检测报告供企业下载。模型大概已经训练好了&#xff0c;也就差个导出word功能&#xff0c;把模型识别的数据结果输入到word导出即可。 二、最终实现效果 这里随便整个模板来对所需要的函数进行说明&…

嵌入式 QT Creator使用

目录 1、QT Creator界面 2、QT Creator设置 3、第一个程序 3.1 新建一个项目 3.2 项目的文件组成和管理 3.3 项目的编译、调试与运行 1、QT Creator界面 启动 Qt Creator &#xff0c;出现如图 1 所示的主窗口&#xff1a; Qt Creator 的界面很简洁。上方是主菜单栏&a…

【架构设计】如何设计一个几十万在线用户弹幕系统

文章目录 一、前言二、项目介绍客户端轮询WebSocket主动推送 三、弹幕初始架构四、弹幕架构演进五、弹幕存储六、弹幕查询七、总结 一、前言 现在无论是直播还是电视剧&#xff0c;我们都可以看到上面慢慢的弹幕&#xff0c;满足十几万用户在线的弹幕系统&#xff0c;我们该如…

ChatGPT 如何获取API Key

什么是OpenAI API Key? OpenAI是ChatGPT的“开发商”&#xff0c;提供API使得开发者可以在自己的应用程序上调用OpenAI的相关服务&#xff08;除了ChatGPT&#xff0c;OpenAI还有其他产品&#xff09;。如果想调用OpenAI的产品服务在自己的应用程序上&#xff0c;我们就需要申…

Web接口测试工具---Poster与Postman

工作当中有不少时间在编写和维护接口自动化测试用例。打算先整理一些接口相关工具的使用。 简单对接Web口测试的相关工具/技术做个划分。 HTTP/SOAP协议接口的功能测试&#xff1a; 1、浏览器URL&#xff08;GET请求&#xff09; http://127.0.0.1:8000/login/?usernamezhangs…

4.25、IO多路复用简介

4.25、IO多路复用简介 1. I/O多路复用&#xff08;I/O多路转接&#xff09;①阻塞等待&#xff08;BIO模型&#xff09;②非阻塞&#xff0c;忙轮询&#xff08;NIO模型&#xff09;③IO多路转接技术&#xff08;select/poll&#xff09;④IO多路转接技术&#xff08;epoll&am…

基于DeepSpeed训练ChatGPT

基于DeepSpeed训练ChatGPT 最少只需一张32G GPU&#xff0c;自己也可以训练一个ChatGPT&#xff01; 最近微软发布了一个基于DeepSpeed的训练优化框架来完成ChatGPT类模型的训练&#xff0c;博主对其进行了研究并通过此博文分享相关技术细节。 一、配置预览 1、开源仓库&…