FFmpeg内存对齐简述

news2026/2/15 19:07:35

引文

行字节数的计算

ffmpeg中的align

ffmpeg中的linesize

内容参考

引文

在ffmpeg的使用过程中有时会发现align这个参数，那么这个参数代表什么意思，不同的值会产生什么影响呢，详见下文。

行字节数的计算

理解内存对齐之前首先要理解行的概念，视频有宽高两个概念，行通常是与宽相关联的。例如一张1280*720的图片，其宽就为1280，但其行却并不一定为1280，行具体为多少要取决于对齐数align是多少，一个行的大小必须是对齐数align的整数倍（类似于C语言的结构体对齐）。假设一张1280*720的图片，如果align为1，则行就为1280；如果align为3，则行为1281，需要在1280的基础上补1个字节。行的字节数计算方法可以概括为： $r = ceil( w / align ) * align$ 其中ceil表示向上取整。

其实上面的说法不是很严谨，因为一个像素点不可能只有一个字节，以rgb存储模式为例，一个像素点有rgb三个通道，每个通道占1字节的话，那么一个像素点就会占3个字节，那么在align为1的情况下1280*720的图片在实际存储时每一行的字节数就不是1280了，而是1280*3=3840，所以总大小就为3840*720。

也就是说对齐是根据实际存储字节大小来计算的，我们先要计算出这一行实际占用的字节数，再根据计算出的字节数来计算对齐。例如3*10的图片，每个像素点占2个字节，对齐数align为4，那么行数是多少呢，从条件可知，每行3个像素点，每个像素点占2字节，那么每行就是6字节，而对齐数是4，6不是4的整数倍，因此6需要补2个字节凑成8,8就是4的整数倍了，那么我们就知道每行在内存中实际占用了8个字节，后两个字节是为了对齐补上的，总共有10行，那么这张图片在实际内存中就占用了8*10=80个字节，而不是60个字节了。本来这张图片只需要60个字节，为何要用80个字节来存储呢？这是因为cpu并不能从任意地址开始读取数据，如果不对齐，那么可能需要多次读取才能读到完整数据，因此对齐主要是为了提升性能，典型的空间换取时间。

值得注意的是yuv的计算，以w*h的yuv420p为例，他是分三个平面存储三个分量的，而u和v的计算是一致的，也就是说计算出了u即可得到v；对于y来说，它有w行h列，因此需要计算w行的对齐后字节数再乘以h；对于u来说，它有w/2行h/2列（这是因为每4个y共享一组uv），因此需要计算w/2行的对齐后字节数再乘以h/2；v的计算与u的一模一样，最后将这个三个数相加即可。