音视频开发风潮

news2026/2/11 4:00:23

聊聊为啥从事音视频技术，未来会很赚钱

核心竞争力：音视频是程序界的皇冠，掌握音视频意味着拿到通往未来的船票，不用担心会被其他人替代。因为音视频是有一定门槛的，所以也是与其他人拉开差距的分水岭。
高端人才相当缺乏：BOOS直聘中，北上广深很多年薪50W-70W的音视频开发岗位，常年招不到人，月薪2-3万大多是刚从事音视频的入门级开发者
技术迭代慢：H264编码从1995年成为标准至今一直都在使用，属于比较偏底层的技术，而底层技术几十年都不会有太大的改变。

音视频运作流程

音视频生产端： 音视频的采集 ->预处理-> 编码 -> 封装 -> 网络发送
音视频消费端： 网络接收 -> 解封装 -> 解码 -> 渲染

1、音视频采集

Android平台上的音频采集一般就三种：

利用android内置的应用程序
使用MediaRecorder进行音频捕获
使用AudioRecord进行音频捕获。

此3种方式的灵活性逐渐增大，相应的所需要做的工作也逐渐增多。

2、预处理

视频数据的预处理一般包括视频图像的滤镜处理、美颜处理、加字幕，绿幕抠图。

音频的预处理一般包括声音的3A算法和变速变调处理，这个在 WebRTC里面有详细的介绍和实现。

AGC：自动增益补偿]功能（Automatic Gain Control）
ANS：背景噪音抑制功能]（Automatic Noise Suppression）
AEC：回声消除器]（Acoustic Echo Canceller）

3、编码

音频的编码标准：

AAC
Opus
mp3

视频的编码标准：

H264
H265
VP8
VP9
AV1

以我目前的工作经验最常用的视频编码是 h264 音频编码是 AAC 编码。

4、封装

音视频编码后需要将音视频包以某种容器封装起来，这个步骤成为音视频的封装。常见的封装格式

ffmepg支持非常丰富的媒体封装格式。查看 ffmepg 支持的封装格式命令如下

ffmpeg -muxers

5、传输

常见的音视频的网络传输协议有 rtmp http-flv rtsp srt hls rtc udp ，各有优劣，这里不做详细对比。感兴趣可以百度 google搜索了解。

6、解封装

解封装是上面介绍的封装的逆操作，从音视频的容器中将音频包、视频包分离出来放到各自的队列，等待各自的解码线程去解码渲染视频，播放音频。

7、解码

编码的逆操作，将视频包解码成原始的视频帧，将音频包解码成原始的pcm音频数据。

8、渲染

视频的渲染 windows 平台下可以使用 Direct3D 技术渲染视频，macOS，Android 和 Linux 可以使用 OpenGL 、OpenGLES 技术渲染视频。

拓展知识：FFmpeg进阶

要学习音视频，无论是直播还是音视频处理，ffmpeg和webrtc 基本是绕不过去的，相对webrtc 来说，ffmpeg 应用的更广

音视频自学的难点

音视频自学非常困难，网上通俗易懂的难找到

网上部分资源是对应的开源版本较低，且知识点零散

音视频涉及大量的开源库和协议

◆ 比如 ffmpeg 的编译，如果不熟悉各种编译报错
◆ Janus 编译涉及各种开源组件编译不通过
◆ 比如 WebRTC 涉及的 RTP RTCP SDP STUN 等协议

部分嵌入式音视频的朋友技术面窄，技术不深入

◆ 比如有同学做了 2 年的音视频驱动，一帧音频能持续播放多久都不明白

这里给大家推荐一套学习路线，并附有相关《音视频开发核心知识点及源码解析笔记》，相信可以给大家提供一些帮助，有需要的朋友们也可以拿去查漏补缺。

高级音视频开发学习路线

FFmpeg 编译

H264 编码基础

JNI 编程

文章篇幅有限，文档内容就不一一展示了；文中所有资料都是免费分享给大家的；可以私信发送**“脑图”或“音视频”** 即可 免费领取

资料整理不易，觉得有帮助的朋友可以帮忙点赞分享支持一下~

你的支持，就是我的动力；祝各位前程似锦

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2650.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！