H.265/HEVC编码原理及其处理流程的分析

H.265/HEVC编码的框架图，查了很多资料都没搞明白，各个模块的处理的分析网上有很多，很少有把这个流程串起来的。本文的主要目的是讲清楚H.265/HEVC视频编码的处理流程，不涉及复杂的计算过程。

文章目录

H.265/HEVC编码原理及其处理流程的分析
一、什么是H.265/HEVC？
- 1.1、H.265/HEVC的作用
- 1.2、H.265/HEVC编码框架
二、DCT变换和量化
- 2.1、DCT变换
- 2.2、量化
三、H265的预测
- 3.1、帧内预测
3.2、帧间估计
- 3.3、预测方式的选择
四、环路滤波
五、总结
六、参考资料

一、什么是H.265/HEVC？

1.1、H.265/HEVC的作用

♈️H.265/HEVC是一种新的视频压缩标准，而视频是由一张张连续的图片组成的，因此对视频的压缩就可以理解为对一组图片的压缩。30帧的视频就表示一秒有30张的图片，60帧就表示该视频一秒有60张图片，对视频的压缩，就是对一组图片的压缩。由于一个视频里相邻的图片间常常存在大量相同的部分。比如这两张照片，相似度就很高，没必要两张都完整的存储下来。

♉️一张图片是由很多像素点组成，即使同一张图片内部也存在大量相同的部分，比如这张图片的背景几乎全是白色，我们没有必要把每个白色的位置及其像素值全部存储下来，这样既耗费资源又没有必要。

♊️因此，H.265/HEVC主要采用帧内预测（根据同一张图片的其他位置的像素点预测当前位置的像素值），或者帧间预测（根据其他图片的像素，来推测当前图片）对组成视频的图片进行压缩，以减少他们的大小。

1.2、H.265/HEVC编码框架

请添加图片描述

♋️H.265/HEVC的编码框架如图所示，图片来源【1】，本文的主要目的是为了讲清楚这张图展示的处理流程。首先，输入的图片被划分为一个个相似的块（CTU），这些块的大小最大为64*64，通过这样的划分，使得每个CTU的差别都不大。通过合理的划分CTU，可以将图片划分成相似度较高的一个个CTU块，这就是H.265/HEVC的第一步操作。

二、DCT变换和量化

2.1、DCT变换

♌️当一个视频，也就是一组图片的一个CTU输入时，我们先将其进行DCT变换`。
请添加图片描述

♍️由于我们人眼对高频信息不敏感，比如一张白纸上写一个字，我们对高频率出现的背景白色并不敏感，黑色线条虽然占据较小的比例，但这低频率出现的黑色信号才是我们关注的重点。该图是某个图片经过DCT变换后的结果，由图可以看出（图片来源【2】），DCT变换后得到频域矩阵，低频部分幅度很大（左上角低频，右下角高频），而高频部分幅度较低。

2.2、量化

♎️ 为了减少存储数据所需要的内存资源。CTU经过DCT变换后，我们再将其进行量化。由于量化步长选取的不一样，造成的精度损失也不一样（参考【3】）。举个例子，如果我们选最小步长是1，向下取整，那么0.6，0.2都将被量化为0，412.6就会被量化为412。可以看到，高频信号由于幅度较小，因此量化后的损失很大，而低频信号由于幅度较大，因此影响较小。毕竟普通人丢了100块钱和富豪丢了100块钱损失是不一样的。

♏️通过DCT变换和量化，在尽可能保持低频、敏感（容易被人眼察觉）信息情况下，对图片进行了压缩。