FFmpeg编程入门

news2025/1/11 19:42:32

标题

  • 播放器框架
  • 常用音视频术语
  • 解复用器和编解码器
  • FFmpeg库简介
    • FFmpeg有8个常用库:
  • FFmpeg函数简介
    • 封装格式相关
    • 编解码器相关
  • FFmpeg数据结构
    • 简介
    • 关系
    • 数据结构分析

播放器框架

在这里插入图片描述
在这里插入图片描述

流程:媒体文件通过复用器将音频流,视频流,字幕流分离开来,然后通过编解码器将各种流解码,然后通过同步控制处理后输出。

常用音视频术语

  • 文件/容器:即特定格式的多媒体文件,比如mp4、flv、mkv等。
  • 媒体流:就是根据时间顺序的连续数据,比如音频流,视频流,字幕流,可以是压缩的,也可以是非压缩的,压缩的需要通过编解码器来解压,有的音频流就是PCM数据。
  • 数据帧/数据包:媒体流通常是大量数据帧或者数据包构成的,通常具体看是否是压缩流,如果是非压缩就是数据帧,否则是数据包。
  • 编解码器:编解码器是以帧为单位实现压缩数据和原始数据之间的相互转换的。

解复用器和编解码器

在这里插入图片描述
在这里插入图片描述

FFmpeg库简介

在这里插入图片描述

FFmpeg有8个常用库:

AVUtil:核心工具库,下面的许多其他模块都会依赖该库做一些基本的音视频处理操作。

AVFormat:文件格式和协议库,该模块是最重要的模块之一,封装了Protocol层和Demuxer、Muxer层,使得协议和格式对于开发者来说是透明的。

AVCodec:编解码库,封装了Codec层,但是有一些Codec是具备自己的License的,FFmpeg是不会默认添加像libx264、FDK-AAC等库的,但是FFmpeg就像一个平台一样,可以将其他的第三方的Codec以插件的方式
添加进来,然后为开发者提供统一的接口。

AVFilter:音视频滤镜库,该模块提供了包括音频特效和视频特效的处理,在使用FFmpeg的API进行编解码的过程中,直接使用该模块为音视频数据做特效处理是非常方便同时也非常高效的一种方式

AVDevice:输入输出设备库,比如,需要编译出播放声音或者视频的工具ffplay,就需要确保该模块是打开的,同时也需要SDL的预先编译,因为该设备模块播放声音与播放视频使用的都是SDL库。

SwrRessample:该模块可用于音频重采样,可以对数字音频进行声道数、数据格式、采样率等多种基本信息的转换。

SWScale:该模块是将图像进行格式转换的模块,比如,可以将YUV的数据转换为RGB的数据,缩放尺寸由1280720变为800480。

PostProc:该模块可用于进行后期处理,当我们使用AVFilter的时候需要打开该模块的开关,因为Filter中会使用到该模块的一些基础函数。

FFmpeg函数简介

封装格式相关

◼ avdevice_register_all()对设备进行注册,比如V4L2等。
◼ avformat_network_init();初始化网络库以及网络加密协议相关的库(比如openssl)
◼ avformat_alloc_context();负责申请一个AVFormatContext结构的内存,并进行简单初始化
◼ avformat_free_context();释放该结构里的所有东西以及该结构本身
◼ avformat_close_input();关闭解复用器。关闭后就不再需要使用avformat_free_context 进行释放。
◼ avformat_open_input();打开输入视频文件
◼ avformat_find_stream_info():获取音视频文件信息
◼ av_read_frame(); 读取音视频包
◼ avformat_seek_file(); 定位文件
◼ av_seek_frame():定位文件
在这里插入图片描述

编解码器相关

• avcodec_alloc_context3(): 分配解码器上下文
• avcodec_find_decoder():根据ID查找解码器
• avcodec_find_decoder_by_name():根据解码器名字
• avcodec_open2(): 打开编解码器
• avcodec_send_packet(): 发送编码数据包
• avcodec_receive_frame(): 接收解码后数据
• avcodec_free_context():释放解码器上下文,包含了
avcodec_close()
• avcodec_close():关闭解码器
在这里插入图片描述

FFmpeg数据结构

简介

AVFormatContext:封装格式数据的上下文结构体,其中保存了封装格式的相关信息,比如具体的封装格式.
AVInputFormat 是具体封装格式的结构体。
AVStream:视频(音频)流结构体
AVCodecContext:编解码器上下文结构体,保存了具体视频(音频)流的编码器相关信息等。
AVCodec:就是具体编码器结构体。
AVPacket:存储压缩编码数据。
AVFrame:存储解码后的数据。

关系

AVFormatContext内部封装了AVInputFormat
AVCodecContext内部封装了AVCodec
具体看下面结构体字段介绍。
在这里插入图片描述
区分不同的码流通过不同的索引来区分:
在这里插入图片描述
在这里插入图片描述

数据结构分析

AVFormatContext

• iformat:输入媒体的AVInputFormat(复用器),比如指AVInputFormat ff_flv_demuxer
• nb_streams:输入媒体的AVStream 个数
• streams:输入媒体的AVStream []数组
• duration:输入媒体的时长(以微秒为单位),算方式可以参考av_dump_format()函数。
• bit_rate:输入媒体的码率

AVInputFormat

• name:封装格式名称
• extensions:封装格式的扩展名
• id:封装格式ID
• 一些封装格式处理的接口函数,比如read_packet()

AVStream

• index:标识该视频/音频流
• time_base:该流的时基,PTS*time_base=真正的时间(秒)
• avg_frame_rate: 该流的帧率
• duration:该视频/音频流长度
• codecpar:编解码器参数属性

AVCodecParameters

• codec_type:媒体类型,比AVMEDIA_TYPE_VIDEO , AVMEDIA_TYPE_AUDIO等
• codec_id:编解码器类型, 比AV_CODEC_ID_H264 ,AV_CODEC_ID_AAC等。

AVCodecContext

• codec:编解码器的AVCodec,比如指向AVCodec
ff_aac_latm_decoder
• width, height:图像的宽高(只针对视频)
• pix_fmt:像素格式(只针对视频)
• sample_rate:采样率(只针对音频)
• channels:声道数(只针对音频)
• sample_fmt:采样格式(只针对音频)

AVCodec

• name:编解码器名称
• type:编解码器类型
• id:编解码器ID
• 一些编解码的接口函数,比如int (*decode)()

AVPacket

• pts:显示时间戳
• dts:解码时间戳
• data:压缩编码数据
• size:压缩编码数据大小
• pos:数据的偏移地址
• stream_index:所属的AVStream

AVFrame

• data:解码后的图像像素数据(音频采样数据)
• linesize:对视频来说是图像中一行像素的大小;对音频来说是整个音频
帧的大小
• width, height:图像的宽高(只针对视频)
• key_frame:是否为关键帧(只针对视频) 。
• pict_type:帧类型(只针对视频) 。例如I, P, B
• sample_rate:音频采样率(只针对音频)
• nb_samples:音频每通道采样数(只针对音频)
• pts:显示时间戳

本文只是对FFmpeg编程需要了解的知识做了概述,具体使用及分析正在更新中~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/644027.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

iCache dCache

前言 CPU 和 RAM 之间存在多级高速缓存,一般分为 3 级,分别是 L1、L2、L3。 另外,我们的代码都是由两部分组成的:指令、数据。 L1 Cache 比较特殊,每个 CPU 会有两个 L1 Cache,分别为 iCache(指…

互联网 Java 工程师高级面试八股文汇总(1260 道题目附解析)

今年的行情,让招聘面试变得雪上加霜。已经有不少大厂,如腾讯、字节跳动的招聘名额明显减少,面试门槛却一再拔高,如果不用心准备,很可能就被面试官怼得哑口无言,甚至失去了难得的机会。 现如今,…

苹果将在 iOS 17 引入新功能,Safari隐私浏览有重大更新

苹果公司正在对Safari隐私浏览系统进行重大更新,为用户在浏览网页时提供更好的保护,防止第三方跟踪器。 iPhone制造商说:先进的跟踪和指纹保护有助于防止网站使用最新的技术来跟踪或识别用户的设备。隐私浏览现在可以在不使用时锁定&#xf…

MODIS数据下载

MODIS数据常用下载网址: Find Data - LAADS DAAC 在下载之前需要注册一个账号,才可进行下载。 1.选择数据产品,本人选取MOD09Q1数据产品(250m8天合成的反射率数据) 2.设置时间限制如下 3.找到感研究区域所在的位置&…

chatgpt赋能python:Python怎么拦截Windows浏览器的请求

Python怎么拦截Windows浏览器的请求 Python是一种流行的编程语言,并且被广泛用于Web开发。在这篇文章中,我们将深入探讨Python如何拦截Windows浏览器的请求。 什么是拦截请求? 拦截请求是指在网络传输过程中,对请求进行截获并进行处理的过…

C++结构体

目录 一、结构体的概念 二、结构体定义和使用 三、结构体数组 四、结构体指针 五、结构体嵌套结构体 六、结构体做函数参数 七、结构体中const使用场景 一、结构体的概念 结构体属于用户自定义的数据类型,允许用户存储不同的数据类型 二、结构体定义和使用 语法&…

对称二叉树(C++)

题目描述 一棵有点权的有根树如果满足以下条件,则被轩轩称为对称二叉树: 1. 二叉树; 2. 将这棵树所有节点的左右子树交换,新树和原树对应位置的结构相同且点权相等。 下图中节点内的数字为权值,节点外的 id 表示节点编号。 现在给出一棵二叉…

Spring 事务的相关配置、传播行为、隔离级别及注解配置声明式事务

目录 一、事务的相关配置 1. 添加测试标签 2. 添加对应方法 3. 测试 二、事务的传播行为 三、事务的隔离级别 四、注解配置声明式事务 1. 注册事务注解驱动 2. 加上注解 3. 配置类代替xml文件中的注解事务支持 4. 测试 往期专栏&文章相关导读 1. Maven系列专栏…

用了【WRITE-BUG数字空间】,其他文档软件可以卸载、注销账号了

都3202年了文档都进化成在线协同编辑文档了 让我看看谁还在用本地软件写文档啊~滋滋滋 使用【WRITE-BUG数字空间】云文档全键盘写作不是梦!铁汁,听我句劝,把本地软件卸载了奥,你把握不住~ 程序员兄弟姐妹们的最爱编辑器&#x…

Zotero jasminum茉莉花插件

github地址:https://github.com/l0o0/jasminum 一个简单的Zotero 插件,用于识别中文元数据 非常感谢作者开发了这么好用的工具 安装步骤 首先要安装zotero 下载茉莉花插件安装包 https://github.com/l0o0/jasminum/releases 下载这个xpi格式的文件…

chatgpt赋能python:Python怎么抢优惠券?优惠不再是梦想!

Python怎么抢优惠券?优惠不再是梦想! 在如今的消费社会,优惠券已成为人们购物时追逐的目标。而优惠券的数量有限且抢手,往往仅能在短时间内领取,因此初次抢到心仪的优惠券可谓令人欣喜不已。而对于程序员们而言&#…

《springboot使用篇》——只为使用,一篇就够

目录 环境: spring boot概述 一,springboot快速入门 1.创建maven项目 2.引入起步依赖 3.自定义controller 4.编写启动类 5.开始测试 二.快捷方式创建sprinboot工程 补充 三,配置文件 1.配置文件之间的关系 2.yml配置文件 1.基本…

【ROS】ROS+Gazebo强化学习:训练

1、安装ROS1 【ROS】Ubuntu20.04安装ROS1 2、安装Anaconda 【AI】PyTorch入门(一):通过Anaconda安装PyTorch 【PyThon】Anaconda常用命令 3、源码下载 使用论文 Goal-Driven Autonomous Exploration Through Deep Reinforcement Learnin…

VMware虚拟机安装win10系统教程

执行本教程前请依次阅读以下2篇文章,完成环境准备: 1.VMware虚拟机下载安装教程【详细步骤 - 图文结合】 VMware虚拟机下载安装教程【详细步骤 - 图文结合】_西晋的no1的博客-CSDN博客 2.如何在微软官网下载win10镜像文件 如何在微软官网下载win10镜像文…

IDEA中Node.js环境下npm报错Error:0308010C:digital envelope routines:unsupported

Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境。 Node.js 是一个开源的、跨平台的 JavaScript 运行时环境。Node.js 使用了一个事件驱动、非阻塞式 I/O 的模型,使其轻量又高效。Node.js 的包管理器 npm,是目前最流行的Node.js 的包管理器。 一、安装nod…

快速幂(简单 C++)

快速幂:就是能够快速地计算出以 a 为底数,b 为指数的幂,相较于传统的求幂算法,当指数 b 非常大时,使用快速幂算法,可以大大地降低循环的次数。 以3 ^ 13 为例: 首先将 b 转换成二进制&#xff…

Kubernetes配置Jenkins Slave

Kubernetes配置Jenkins Slave 部署在kubernetes集群内 1、部署jenkins 1.1、命名空间 apiVersion: v1 kind: Namespace metadata:name: jenkinscilabels:app: jenkinsci1.2、Deployment apiVersion: apps/v1 kind: Deployment metadata:name: jenkinscinamespace: jenkinsci…

软考A计划-系统架构师-案例分析考前背诵-上篇

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例点击跳转>软考全系列 👉关于作者 专注于Android/Unity和各种游戏开发技巧&#xff…

〖数据结构〗一棵有点自律的树——搜索二叉树

文章目录 💐专栏导读💐文章导读🌷搜索二叉树概念🌷二叉搜索树的构建🌺查找操作🌺插入操作🌺删除操作🌺遍历操作☘️测试 🏵️拓展——递归实现🍃递归查找&…

MATLAB与物联网:如何应用MATLAB进行物联网数据的处理和分析

第一章:引言 物联网(Internet of Things, IoT)作为当今科技领域的热门话题,正在改变我们的生活方式和工作方式。随着物联网设备的普及和数据的不断增长,如何高效地处理和分析物联网数据成为了一个重要的挑战。MATLAB作…