音视频采集推流时间戳记录方案

news2025/1/3 17:47:28

音视频同步更多文章

深入理解音视频pts,dts,time_base以及时间数学公式_视频pts计算-CSDN博客

ffplay音视频同步分析_ffplay 音视频同步-CSDN博客

音视频采集打时间戳设计

实时音视频数据的采集和处理场景。具体来说:

采集阶段:

  • 在音视频数据采集过程中,需要为每一帧数据计算出时间戳。
  • 可以采用"起始时间=系统时间"的方式,计算第一帧的时间戳,后续帧按照固定的帧间隔累加得到。
  • 同时引入动态校正机制,检测累计时间戳与系统时间的偏差,及时修正时间戳。

传输阶段:

  • 将计算好的时间戳与音视频数据一起传输到客户端。

播放阶段:

  • 客户端接收到数据后,先将其缓存一段时间。
  • 然后根据附带的时间戳信息,按照正确的时间顺序进行播放。
  • 客户端可以进一步利用时间戳信息来调整缓冲区,以适应网络环境的变化。

这种时间戳设计方案的核心思路就是:

  1. 在采集端尽量保证时间戳的准确性和稳定性。后续讲解如何设计稳定和准确的方案
  2. 将时间戳信息传输到客户端,利用它来进行缓冲和时间校正。
  3. 通过客户端和服务器端的协作,最终实现音视频数据的平滑播放。

        这是实时音视频领域常用的一种时间戳管理策略,能够很好地应对系统负载变化、小数误差累积等问题。

方案推导

第一方案 直接系统时间模式


初始化 starttime = systime
frameTimeStamp = systime - start time
缺陷:涉及到音频硬件采样不稳定,操作系统调度和网络传输的时间,导致ts准确度不够问题且没用纠正机制。


第二种方案 帧间隔模式


初始化 starttime = systime
frameTimeStamp = current systime - start time
Compute TimeStamp = last FrameTimeStamp + duration

优点:能输出frame duration稳定的音视频时间戳。
缺陷:

  • 系统负载过高时,实际帧采集间隔可能与理论设定不一致。这将导致计算出的时间戳与实际情况不符,影响播放效果。
  • 帧间隔涉及到无限小数时,会随时间累积产生较大的误差。例如预计30帧,通常按帧间隔33毫秒处理,但实际是33.3333333毫秒。累积3333帧(约111秒)就出现1秒的误差。


第三种方案  帧间隔+直接系统时间模式


初始化 starttime = systime                                                        //起始时间=系统时间
frameTimeStamp = current systime - start time                       //第一帧时间戳= 系统时间–起始时间
Compute TimeStamp = last FrameTimeStamp + duration       //后续帧TimeStamp=上一帧时间戳+ 帧间隔

 T = current systime  -  starttime     //当前系统时间 – 起始时间 
if( |Compute TimeStamp - T |  >= duraiton/2 )  Compute TimeStamp  = last FrameTimeStamp

//如果当前帧的计算时间戳(CurrentFrameTS)与系统时间差值(T)的绝对值大于等于一个半帧间隔,那么我们就应该将当前帧的时间戳直接设置为系统时间差值T。 


解决:动态纠正,在第二方案基础上,解决了随着播放帧数,时间戳落后或提前现象。落点值 =  T = current systime  -  starttime     //当前系统时间 – 起始时间。关键点是设置一个合理的校正阈值,这里我们使用了半帧间隔。

优点:能够实时纠正时间戳,只要系统正常运转,就能立即恢复正确的时间戳。

缺陷:帧间隔不均匀,能否正常播放依赖于终端解决方案。 比如,假如音频一帧间隔为24毫秒,被采集的回调时间可能为20 毫秒,28毫秒,27毫秒,21毫秒。

终端解决这个问题,可以从以下几个方面着手:

在客户端使用自适应缓冲机制:

  • 根据实际采集帧率的波动情况,动态调整缓冲区大小,尽量平滑播放。

在服务器端进行帧率转换:

  • 服务器可以对不同帧率的数据进行帧率转换,输出稳定的帧率。
  • 这样可以屏蔽掉客户端设备性能的影响。

使用更加先进的时间戳校正算法:

  • 例如利用机器学习等方法,预测并修正时间戳的偏差。

 

采集时间戳同步问题分析

在使用帧间隔+直接系统模式基础上,发送端时间戳记录:

  • 记录每一帧音视频数据的pts时间戳和pts_duration帧间隔
  • 同时记录相邻帧之间的系统时间间隔 sys_duration
  • 这样可以分析在采集阶段,帧间隔的稳定性

分析发送端时间戳:

  • (1) ptsd(pts_duration)波动大,说明采集帧间隔不稳定,可能是由于系统负载波动等因素引起的
    • ​​​​​​​帧间隔 pts_duration 波动很大,那么意味着每帧数据被实际采集的时间间隔是不稳定的。这通常是由于系统负载波动、硬件性能波动等因素引起的,导致采集过程不够稳定。
  • (2) pts稳定,但sysd(sys_duration)波动大,说明在数据发送过程中,速率不够稳定可能是网络传输过程中出现了抖动.
    • ​​​​​​​这里的 pts 时间戳是相对稳定的,意味着数据在采集端生成时间戳是比较准确的。但是,相邻帧之间的系统时间间隔 sys_duration 却出现了波动,说明在数据发送过程中,速率不够稳定。这种情况通常是由于网络传输过程中出现了抖动,导致实际发送速率不够平滑。
  • (3) sysd和ptsd的值应该较为一致,如果两者差异较大,说明在整个采集-传输过程中存在问题
  • ​​​​​​​比如: [send]audio:1-pts:20ms-ptsd:24ms; sysd=23ms

接收端时间戳记录:

  • 接收到的帧信息包含: 帧序号、pts时间戳、pts_duration帧间隔
  • 同样记录了相邻帧的系统时间间隔 sys_duration

分析接收端时间戳:

  • (1) ptsd(pts_duration)波动大,说明采集帧间隔不稳定
  • (2) pts稳定,但sysd(sys_duration)波动大。说明在数据发送过程中,速率不够稳定
  • 比如: [recv] audio:1-pts:20ms-ptsd:24ms; sysd=23ms 200ms

总结核心思路是:

  • 在发送端和接收端同时记录时间戳信息,包括pts时间戳和系统时间
  • 通过对这些时间戳数据的分析,可以全面诊断出音视频同步过程中的各种问题
    • ptsd异常 采集端的帧间隔不稳定
    • pts稳定下 sysd异常 推流端的数据传输速率不稳定,存在网络传输过程中的抖动。

 

 学习资料分享

0voice · GitHub

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2268721.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

「numpy」numpy初步、ndarray、创建数组

Numpy 初步、ndarray、创建数组 【目录】 简介 ndarray介绍 ndarray用法 ndarray基本操作 一、numpy简介 Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度的数组。 Numpy支持常见的数组和矩阵操作。对于同样…

FFmpeg 编码和解码

文章目录 音频格式AACADIF音频数据交换格式ADTS音频数据传输流 音频解码音频编码 视频格式H264GOP图像组I帧,P帧,B帧H264压缩技术H264压缩级别H264视频级别H264码流结构SPSPPS 解码视频编码视频 音频格式 AAC AAC全称 Advanced Audio Coding&#xff0…

游戏引擎学习第67天

reviewing “apron”概念以更新区域 我们正在进行模拟区域的扩展工作,目标是通过增加一个更大的区域来支持更丰富的互动,尤其是那些可能超出摄像机视野的内容。现有的模拟区域包括摄像机能看到的区域和其周围的环境区域,但为了保证更高效的游…

3D线上艺术展:艺术与技术的完美融合

随着数字技术的飞速发展,未来的艺术展览正逐步迈向线上线下融合的新阶段。其中,3D线上展览以其独特的魅力,成为线下展览的延伸与拓展,为艺术爱好者们开辟了全新的观赏途径。 对于艺术家和策展人而言,3D线上展览不仅打…

Qt制作一个简单闹钟

增加testtospeech模块 QT core gui texttospeech 头文件 #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QTimerEvent> #include <QTimer> #include <QTime> #include <QMouseEvent> #include <QTextToSpeech>…

Java编程题_面向对象和常用API01_B级

Java编程题_面向对象和常用API01_B级 第1题 面向对象、异常、集合、IO 题干: 请编写程序&#xff0c;完成键盘录入学生信息&#xff0c;并计算总分将学生信息与总分一同写入文本文件 需求&#xff1a;键盘录入3个学生信息(姓名,语文成绩,数学成绩) 求出每个学生的总分 ,并…

tcpdump 网络数据包分析工具

简介 用简单的话来定义tcpdump&#xff0c;就是&#xff1a;dump the traffic on a network&#xff0c;根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的…

24个未授权访问漏洞详情

一、Redis未授权访问漏洞 第一步&#xff1a;进⼊vulhub⽬录使⽤以下命令启动靶机 进⼊⽬录&#xff1a;cd /vulhub-master/redis/4-unacc 启动&#xff1a;docker-compose up -d 检查&#xff1a;docker ps 第二步&#xff1a;在Kali上安装redis程序进⾏服务的链接 #安装r…

python3中条件判断语句:if 语句与if嵌套语句

一. 简介 本文开始学习 python3中条件判断语句。Python 条件语句是通过一条或多条语句的执行结果&#xff08;True 或者 False&#xff09;来决定执行的代码块。 二. python3中条件判断语句&#xff1a;if 语句与 if嵌套语句 1. if 语句 Python中if语句的一般形式如下所示&…

vue实现下拉多选、可搜索、全选功能

最后的效果就是树形的下拉多选&#xff0c;可选择任意一级选项&#xff0c;下拉框中有一个按钮可以实现全选&#xff0c;也支持搜索功能。 在mounted生命周期里面获取全部部门的数据&#xff0c;handleTree是讲接口返回的数据整理成树形结构&#xff0c;可以自行解决 <div c…

在 Unity 6 中为您的世界创建全局照明的新方法(三)

本文是Unity 6全局光照功能介绍系列中的最后一篇文章&#xff0c;在上篇文章中我们为大家介绍了关于使用沙漠绿洲场景创建实时光照的案例&#xff0c;在本文中我们将承接上篇文章继续为大家介绍如何使用Unity 6中的APV探针功能在URP管道中的另一个案例“花园场景”中创建实时光…

《计算机组成及汇编语言原理》阅读笔记:p116-p120

《计算机组成及汇编语言原理》学习第 7 天&#xff0c;p116-p120 总结&#xff0c;总计 5 页。 一、技术总结 1.CPU优化 (1)increase overall performance number 例如&#xff1a;16位电脑提升到32位电脑。 (2)multiprocessing One way to make computers more useful i…

Python的简单爬虫框架

爬虫为网络爬虫&#xff08;又称为网页蜘蛛&#xff0c;网络机器人&#xff0c;在FOAF社区中间&#xff0c;更经常的称为网页追逐者&#xff09;&#xff0c;是一种按照一定的规则&#xff0c;自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、…

优化站群SEO:使用苹果CMS泛目录插件实现泛目录页面刷新不变

优化站群SEO&#xff1a;使用苹果CMS泛目录插件实现泛目录页面刷新不变 在当今数字营销环境中&#xff0c;搜索引擎优化&#xff08;SEO&#xff09;是提升网站流量和可见性的关键策略。苹果CMS作为一款灵活的内容管理系统&#xff0c;提供了丰富的插件功能&#xff0c;尤其是…

Spring Cloud由入门到精通

文章目录 1.初识微服务1.1. 单体架构1.2.分布式架构1.3.微服务1.4 微服务技术比对1.5.Spring Cloud1.6. 总结2.服务拆分和远程调用2.1.服务拆分原则2.2.服务拆分示例2.2.1.项目工程结构设计2.2.2.创建Maven项目工程2.3.实现远程调用案例2.3.1.案例需求:2.3.2. 注册 Rest Templ…

【RK3588 Linux 5.x 内核编程】-内核I2C子系统介绍

内核I2C子系统介绍 文章目录 内核I2C子系统介绍1、内核中的I2C子系统2、内核中的I2C驱动2.1 获取I2C适合器2.2 创建i2c_board_info与设备2.3 创建设备ID和I2C驱动2.4 数据传输2.4.1 发送数据2.4.2 读取数据3、I2C总线如何工作I2C 是一种用于双线接口的串行协议,用于连接低速设…

GPIO相关寄存器,点灯

目录 一.输入模式 1.浮空输入 2.上拉输入 3.下拉输入 4.模拟输入 二.输出模式 1.推挽输出 2.开漏输出 三.寄存器 1.寄存器的作用 2.功能与类型 3.控制某一引脚输出电压来点灯所需要控制的寄存器 1.打开对应时钟开关 2.端口模式寄存器 ---输出模式 3.输出类型寄存…

【基础篇】三、MySQL表结构的操作

文章目录 Ⅰ. 创建表1、语法2、创建表样例3、创建和其它表一样结构的表 Ⅱ. 查看表结构1、查看数据库中的表2、查看指定表的属性3、获取表的创建语句 Ⅲ. 删除表Ⅳ. 修改表结构1、向表中插入新的字段2、删除表中的字段3、修改表名4、修改字段属性 Ⅰ. 创建表 1、语法 create …

Ethernet 系列(12)-- 基础学习::SOME/IP

目录 1. SOME/IP简介&#xff1a; 1.1 什么是SOME/IP&#xff1a; 1.2 什么时候使用SOME/IP&#xff1a; 2. SOME/IP的特点&#xff1a; 2.1 序列化&#xff1a; 2.2 远程过程调用&#xff08;RPC&#xff09;: 2.3 服务发现&#xff1a; 2.4 发布/订阅&#xff1a; 2.5 UDP消息…

前端小案例——轮播图(HTML+CSS+JS, 附源码)

一、前言 实现功能&#xff1a; 显示多张图片&#xff0c;每张图片占据轮播图容器的一部分空间。实现向左和向右的切换按钮&#xff0c;可以点击按钮切换到上一张或下一张图片。在底部显示小圆点&#xff0c;表示当前显示的图片&#xff0c;点击小圆点可以跳转到对应的图片。…