视频基础学习四——视频编码基础一（冗余信息）

news2026/3/19 3:25:49

文章目录

前言
一、编码压缩的原理
- 1.空间冗余
- - 帧内预测
- 2.时间冗余
- - 帧间预测
  - - 运动估计
    - 运动补偿
- 3.编码冗余
- 4.视觉冗余
二、压缩编码的流程
- 1.编码器
- 2.编解码流程
总结

前言

上一篇文章介绍了视频帧率、码率、与分辨率。也介绍了为什么需要对视频进行压缩，因为720P、rgb24编码格式、25帧、1s的视频大小为
$1280 * 720 * 3/1024/1024 * 25 * 1 = 65.75 MB$
这无疑是很大的内存。

一、编码压缩的原理

视频编码就是为了去除视频帧之间大量的冗余信息，而视频图像中的冗余信息有以下几种：

空间冗余：图像相邻像素之间有较强的相关性
时间冗余：视频序列的相邻图像之间内容相似
编码冗余：不同像素值出现的概率不同
视觉冗余：人的视觉系统对某些细节不敏感
知识冗余：规律性的结构可由先验知识和背景知识得到

压缩技术就是将这些冗余信息去掉，去除数据之间的相关性，包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术

下面就以这张动态图来进行介绍这几种冗余
在这里插入图片描述

1.空间冗余

我们从这个图片中选中一块区域进行放大，提取像素点在这里插入图片描述
可以看到，相邻像素点之间几乎全部一模一样，这个也就是空间上的相似性，空间信息的冗余。
那么如何进行压缩呢，这里就有一种办法叫做帧内预测

帧内预测

我们预测：在一帧当中，颜色在垂直方向上保持一致，这种预测意味着未知像素颜色与近邻像素相同，看下图
在这里插入图片描述
但是这种预测是错误的，因为该表单中，最右下角的像素颜色不是（255，255，51），而应该是（255，255，204），这个时候我们通过减去实际值，算出残差，这样的数据就更容易压缩

同样，我们可以通过这个残差预测距离这个残差相邻的数据是什么样的像素

2.时间冗余

时间冗余信息是发生在相邻帧之间的，比如下面一张图片。
在这里插入图片描述
这两张图片具有很大的相似，随着时间的改变，除了海绵宝宝动作在变，背景是一直都没有变化的。
在时间上就构成了像素的相关性，这个就是时间冗余，通过帧间预测的方法可以进行压缩这种冗余信息。

帧间预测

帧间预测是利用视频时域的相关性，使用邻近已编码图像像素预测当前图像的像素，以达到有效去除视频时域冗余的目的。
帧间预测具有两大内容：运动估计（运动搜索、亚像素插值和运动矢量）、运动补偿

运动估计

运动估计是以当前图像的像素块在之前已编码的图像中寻找到最佳的一个匹配块。从而提取到当前图片的运动信息。

比如以当前帧减去上一帧（参考帧），留下的残差就可以视为一个匹配块，当然实际上是远比这要复杂的，最直接的方法是为每个像素指定一个运动向量，但是这种基于像素的运动表示法会有很高的数据量，为了降低这种复杂度，可以将图像分为不同大小的像素块，只有块大小选择合适，每个块的运动参数可以独立进行估计，这就是基于块的运动表示法

运动补偿

运动补偿：一种描述相邻帧（相邻在这里表示在编码关系上相邻，在播放顺序上两帧未必相邻）差别的方法，具体来说是描述前面一帧的每个小块怎样移动到当前帧中的某个位置去。

假使现在一个像素块在t时间坐标为x，t+1时间坐标在x+1，那么我们可以预测下一时间t+2该像素块在x+2位置。
在这里插入图片描述

3.编码冗余

这个纯纯是一种数据运算了，在视频基础学习二——图像深度与格式（RGB与YUV）这篇文章里面，曾介绍过YUV格式，也曾提到过YUV的出现可以大大减少编码存储内存，人眼对于Y分量也就是明度感知最为明显，对于UV分量反而不明显，所以就可以丢弃一些UV分量，而加大Y分量的数据，同时分析Y分量的频率进行压缩。

其中Y分量，也就是明度通过RGB进行转换为
$Y = 0.299 R + 0.587 G + 0.114 B;$