【音视频处理】FFmpeg详解,命令行、源码、编译安装

news2025/1/10 10:44:29

 

大家好,欢迎来到停止重构的频道。

本期我们讨论FFmpeg。

这里先提一个问题,FFmpeg命令行功能如此强大,为什么还需要舍近求远地调用库函数呢 ?

我们按这样的顺序讨论 :

1、  FFmpeg命令行说明 

2、  FFmpeg代码结构

3、  FFmpeg编译安装 

FFmpeg命令行说明 

FFmpeg命令行可快速实现音视频处理,几乎囊括所有音视频处理的功能。

常用的FFmpeg命令行如图所示,包括查看支持的编解码器、转封装、转码、文件直播推流等。

 

另外,FFmpeg也提供FFprobe工具,用于查看文件、轨道信息、打印每帧信息等。

 

FFmpeg命令行大致上与音视频处理过程对应

大概分为5部分:前置参数、输入文件及参数、原始帧filter处理设置、编码设置、输出文件及参数。

 

官网有相关参数的详细说明和例子,一般对音视频处理过程了解的话,则相关参数是比较好查找的,例如需要画中画合并多个视频,则在video filter中可找到layout设置。

 

如果是新手,由于FFmpeg功能过于庞杂,从头开始看说明并不现实

更推荐先在网上搜索答案,然后再查看官方对应说明,久而久之就会对很多设置有印象。

FFmpeg代码结构

在讨论FFmpeg代码结构之前,我们需要说明开篇的问题。

为什么FFmpeg命令行功能这么强大,还需要调用它的库函数,舍近求远地重新实现功能呢?

 

这是因为FFmpeg的命令行虽然强大,但是对于一些异常处理,如直播拉流中断重试就无法实现

另外,一些复杂功能,如直播中断补充默认帧、地图画面接入等场景,命令行也是无法实现的

 

所以如果希望做一个稳定或功能较复杂的音视频处理软件,更推荐调用FFmpeg的库函数,而非直接使用FFmpeg命令行。

FFmpeg的代码结构基本是对应音视频处理过程的,音视频处理过程可参考往期《视频转码》 。

 

如图所示,封装处理,对应库函数基本都在libavformat中;编解码处理,对应库函数基本都在libavcodec中;原始帧filter处理,对应库函数基本都在libavfilter 中。

 

官网、源码中都有每个库函数的说明,但是,通读FFmpeg的代码并不现实,且有很多说明第一次看是非常模糊的。

 

在刚开始的时候,最好参考对应的sample代码,然后再看对应库函数说明

 

深入后,可以参考FFmpeg命令行,在对应函数中设置相关参数。

 

另外,ffmpeg命令行、ffprobe、ffplay的代码也在源码中,必要时可以参考。

 

当然,网上也有很,FFmpeg代码分析,但由于版本差异,可能没有什么参考价值,所以最好还是看官方sample代码,必要时再追查源码。

FFmpeg编译安装 

网上有很多详细的教程,且不同版本的FFmpeg编译及相关设置有所区别,所以这里仅做概括性的说明

如果仅仅是使用FFmpeg常规命令行,可以从官网下载对应平台编译好的包。

 

如果是需要自定义裁剪FFmpeg ,增加编解码器、开启动态库、开启硬件编解码等,则需要下载源码进行编译安装

以Ubuntu22.04为例,编译过程一般分为三步:安装基础依赖、配置和编译安装、设置环境变量。

 

第一步,安装基础依赖,最基础的依赖只有3个,但是如果需要其他功能,如h265编解码,则需要安装对应的软件。

 

第二步,配置和编译安装,如果没有特殊要求,最好用最新的版本。

通过configure可进行编译设置,如果需要支持额外的功能,这里需要一一配置,通过./configure --help,可以查看可设置的项。

配置完后通过编译命令编译安装即可。

 

第三步,设置环境变量,如果是docker运行,需要在启动命令加上环境变量设置。

 

安装完毕后 ffmpeg、ffprobe等工具即可使用,相关动态库的函数也可以被调用。

顺便一提,追加编解码器等功能是常有的事情,但是每次都需要重新编译安装FFmpeg。

​因此更推荐使用动态库,而非把静态库编译进自己的程序,这样FFmpeg重新编译并不影响自己的程序。

 

总结

最后,本期内容只对FFmpeg做了浅显的介绍,很多人会抱怨FFmpeg过于复杂,库函数说明也不那么清晰,很多时候都得翻看源码,

可能原因在于音视频本身比较复杂,且处理过程也会有很多细节问题。不过,随着我们后续内容的深入,很多问题都会明了的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/707315.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何在 JavaScript 中压缩字符串

在 JavaScript 中,可以有范围很广的压缩,比如 gzip 之类的文件压缩等等。 在这里,我们将讨论两种压缩字符串的方法。 最初,我们将重点介绍霍夫曼算法。 稍后,我们将介绍解决任务的 LZString 方法。 在 JavaScript 中使…

主成分分析系列(一)概览及数据为何要中心化

一、概览 主成分分析(Principle Component Analysis,PCA)算法属于数据降维算法里面的一种。数据降维算法的主要想法是从高维度数据中找到一种结构,这种结构蕴含了数据中的大部分信息,从而将高维数据降维到低维数据&am…

Apikit 自学日记:参数构造器

构造器是测试时系统提供的快速生成请求数据的工具。一般用于快速对数据进行加密和生成随机数值。可在请求参数中某个字段的右侧选择构造器操作,通过构造器生成该字段的参数值。构造器由两种类型的操作组成:设置初始数据和多重操作。 设置初始数据 其中初…

基于C语言的开源csv解析库:MiniCSV使用示例

文章目录 MiniCSV简介官方示例csv文件解析示例CodeBlocks工程下载 MiniCSV简介 之前写了一篇基于C语言字符串操作函数的csv文件解析:C语言解析csv格式文件,本文介绍一个开源简洁的csv解析库的使用:MiniCSV,使用标准C语言设计。 …

Spring Boot 中的 Redis 的数据操作配置和使用

Spring Boot 中的 Redis 的数据操作配置和使用 Redis 是一种高性能的 NoSQL 数据库,它支持多种数据结构,包括字符串、哈希、列表、集合和有序集合。Redis 还提供了丰富的命令,可以对数据进行快速的 CRUD 操作。Spring Boot 是一个基于 Sprin…

数据结构--栈的引用--前中后缀表达式(前部分)

数据结构–栈的引用–前中后缀表达式(前部分) 常见的算数表达式 由三个部分组成: 操作数、运算符、界限符 \color{red}操作数、运算符、界限符 操作数、运算符、界限符 ps:界限符是必不可少的,反映了计算的先后顺序 波兰表达式(让计算机更容易识别的算数表达式) Reverse Po…

高性能分布式缓存Redis(一) 快速实战

一、缓存发展史&缓存分类 1.1、大型网站中缓存的使用 访问量越大,响应力越差,用户体验越差。 引入缓存、示意图如下: 读写策略: Cache Aside Pattern(旁路缓存模式)Read/Write Through Pattern&am…

AA-TransUNet github: 用于预测任务的注意力增强的TransUNet

文章目录 来源AA_TransUNet架构数据集和预训练模型使用作者 来源 github地址 AA_TransUNet架构 数据集和预训练模型 如果你对本文中使用的数据集(降水图和云量数据集)感兴趣,请访问SmaAt-UNet了解更多细节。 对于预训练的AA_TransUNet模型…

从磁盘看 IO

计算机上的易失和非易失存储器 常见磁盘可以分为两类:机械磁盘和固态磁盘。 第一类,机械磁盘,也称为硬盘驱动器(Hard Disk Driver),通常缩写为 HDD。机械磁 盘主要由盘片和读写磁头组成,数据就…

认识固态继电器及其工作原理

什么是固态继电器,有什么优缺点? 固态继电器 简称SSR,又被称之为“无触点开关”它利用电子元件(如双向可控硅等半导体器件)的开关特性,可到达无触点无火花地接通和断开电路。 固态继电器工作可靠&#…

1.3 Metasploit 生成SSL加密载荷

在本节中,我们将介绍如何通过使用Metasploit生成加密载荷,以隐藏网络特征。前一章节我们已经通过Metasploit生成了一段明文的ShellCode,但明文的网络传输存在安全隐患,因此本节将介绍如何通过生成SSL证书来加密ShellCode&#xff…

ChatGPT应用工具推荐

ChatGPT作为一种先进的自然生成技术,已经在各个领域展现出了其强大的应用能力,下面将给大家介绍一些ChatGPT的功能应用。 简介 此系统是基于likeadmin—PHP开发的智能对话系统,ChatGPT是一种基于人工智能技术的聊天机器人,它可以…

如何利用AI智能聊天机器人 10秒钟做出一个故事绘本的神奇插件

原文链接:如何利用AI智能聊天机器人10秒钟做出一个故事绘本的神奇插件 C_h~at_&G&&P_T : 以下称为AI智能聊天机器人 一、AI智能聊天机器人4中集成“Stories”插件 对于已经熟悉使用AI智能聊天机器人4 的插件的朋友们,直接在应用市场里搜索…

vtkdicom0.8_vtk9.2_dcmtk3.6.7_qt6.2编译OK

目录 0 结果展示 1 cmake要点 2 编译报错解决 3 参考链接 0 结果展示 1 cmake要点 注意DCMTK_dcmtk_INCLUDE_DIR 2 编译报错解决 D:\Work\C\qt6Work\DCMTK\install\bin\dcmtkcharls.dll : fatal error LNK1107: 文件无效或损坏: 无法在 0x308 处读取 修改,从…

docker安装mysql并且进行连接

1、拉取镜像、在linux中执行命令 docker pull mysql 2、运行容器、在linux中执行命令 docker run -d --name mysql -p 3308:3306 -e MYSQL_ROOT_PASSWORD123456 mysql3、 进入容器、在linux中执行命令 docker ps -a docker exec -it 2a85f05d4090 /bin/bash 4、登录docker中的m…

MySQL日志详解

♥️作者:小刘在C站 ♥️个人主页: 小刘主页 ♥️努力不一定有回报,但一定会有收获加油!一起努力,共赴美好人生! ♥️学习两年总结出的运维经验,以及思科模拟器全套网络实验教程。专栏&#xf…

基于SpringBoot+vue的校园新闻网站设计与实现

博主介绍: 大家好,我是一名在Java圈混迹十余年的程序员,精通Java编程语言,同时也熟练掌握微信小程序、Python和Android等技术,能够为大家提供全方位的技术支持和交流。 我擅长在JavaWeb、SSH、SSM、SpringBoot等框架…

移动WEB开发之流式布局

css基础(一)css基础(一)_上半场结束,中场已休息,下半场ing的博客-CSDN博客Emmet语法Emmet语法_上半场结束,中场已休息,下半场ing的博客-CSDN博客css基础(二)c…

go语言学习笔记1

go语言简介 ​ GoLang是一种静态强类型、编译型、并发型,并具有垃圾回收功能的编程语言;它可以在不损失应用程序性能的情况下极大的降低代码的复杂性,还可以发挥多核处理器同步多工的优点,并可解决面向对象程序设计的麻烦&#x…

2.ThreadLocalRandom

Random类及其局限性 一般情况下&#xff0c;我们都会使用java.util.Random来生成随机数&#xff08;Math.random()也是使用Random实例生成随机数&#xff09;。 示例 public static void main(String[] args) {Random random new Random();for (int i 0; i < 10; i) {S…