H264编码标准
H.264编码标准,也被称作MPEG-4 AVC(Advanced Video Coding),是一种被广泛使用的数字视频压缩标准。它由国际电信联盟(ITU-T)和国际标准化组织(ISO)共同开发,旨在提供比以往标准更高的视频压缩效率,同时保持或提高视频质量。
主要特点:
- 高压缩率:H.264能够在保持高质量的同时提供高压缩比,这使得它非常适合网络传输和存储。
- 多种分辨率和帧率支持:H.264支持从低分辨率到高分辨率的多种格式,以及不同的帧率,使其应用范围非常广泛。
- 帧内和帧间预测:H.264使用帧内预测和帧间预测技术来减少图像的冗余信息,提高压缩效率。
- 变换编码:采用整数变换编码技术,将图像数据从空间域转换到频域。
- 量化:H.264的量化算法更加精细,支持可变量化参数,适应不同的应用场景和传输条件。
- 环路滤波:采用先进的环路滤波技术,对解码后的图像进行后处理,减少压缩带来的图像失真。
应用场景:
H.264因其出色的压缩性能和图像质量,被广泛应用于视频监控、视频会议、流媒体服务、数字电视广播等领域。
参考代码
-
JM:https://iphome.hhi.de/suehring/
-
x264:https://www.videolan.org/developers/x264.html
git clone https://code.videolan.org/videolan/x264.git
- openh264:https://github.com/cisco/openh264
游程编码
行程编码(Run Length Encoding,RLE),又称游程编码、行程长度编码、变动长度编码等,是一种统计编码。主要技术是检测重复的比特或字符序列,并用它们的出现次数取而代之。比较适合于二值图像的编码,但是不适用于连续色调图像的压缩,例如日常生活中的照片。为了达到较好的压缩效果,有时行程编码和其他一些编码方法混合使用。
该压缩编码技术相当直观和经济,运算也相当简单,因此解压缩速度很快。RLE压缩编码尤其适用于计算机生成的图形图像,对减少存储容量很有效果。
【——百度百科】
游程编码的基本原理是将连续的重复数据用一个对来表示,这个对包含两个部分:
- 计数值:表示数据重复的次数。
- 数据值:表示被重复的数据。
应用场景
游程编码常用于图像压缩、文本压缩等领域,尤其是在数据中存在大量连续重复的模式时。
优缺点
优点
- 简单:算法实现简单,易于理解和实现。
- 高效:对于具有大量连续重复数据的文件,压缩比可以非常高。
缺点
- 不适用:对于没有连续重复数据的文件,游程编码可能不会减少数据大小,甚至可能增加数据量(因为需要额外存储计数值)。
示例
假设我们有一串二进制数据:00011111111000011111110,应用游程编码后,可以表示为:
3 0(表示三个0)
7 1(表示七个1)
3 0(表示三个0)
7 1(表示七个1)
c++实现游程编码
- RLE编码
#include <iostream>
#include <string>
#include <vector>
// 函数用于对字符串进行RLE编码
std::string rle_encode(const std::string& input) {
std::string output;
char last_char = 0;
int count = 1;
for (size_t i = 1; i <= input.size(); ++i) {
if (i == input.size() || input[i] != last_char) {
// 添加到输出
output += std::to_string(count);
output += last_char;
// 重置计数器和最后一个字符
count = 1;
last_char = input[i];
} else {
// 如果当前字符与上一个相同,增加计数器
++count;
}
}
return output;
}
// 主函数
int main() {
std::string data = "AAAABBBCCDAA";
std::string encoded_data = rle_encode(data);
std::cout << "Encoded data: " << encoded_data << std::endl;
return 0;
}
- RLE解码
#include <iostream>
#include <string>
#include <cctype>
// 函数用于对RLE编码的字符串进行解码
std::string rle_decode(const std::string& input) {
std::string output;
for (size_t i = 0; i < input.length(); ) {
// 解析计数
int count = 0;
while (i < input.length() && std::isdigit(input[i])) {
count = count * 10 + (input[i++] - '0');
}
// 添加字符到输出
while (count-- > 0) {
output += input[i++];
}
}
return output;
}
// 主函数中可以测试解码功能
int main() {
std::string encoded_data = "4A3B2C1D2A";
std::string decoded_data = rle_decode(encoded_data);
std::cout << "Decoded data: " << decoded_data << std::endl;
return 0;
}
这两个函数分别实现了RLE的编码和解码过程。编码函数rle_encode
读取输入字符串,并为每个连续的字符序列生成一个计数和该字符。解码函数rle_decode
则将编码后的字符串转换回原始字符串,它通过读取计数和紧跟的字符来重建原始数据。
H264编码标准中游程编码
- 图像在进行离散变换后能量集中字啊低频和直流区域,其系数经过量化后低频和直流分量有少量较大值,高频区域除了有少量的较小值外大部分为零。为了更加有效的编码,可以根据系数的统计特性采用熵编码进一步压缩数据,在熵编码前可以根据从高到低的统计特性,对系数进行锯齿扫描和游程长度编码。
- 在H264编码标准中,游程编码用3个量表示一个非零系数:第一个量是非零系数前0的个数;第二量为非零系数的值;第三个量为终止标志,常用1表示游程编码结束,0表示游程编码未结束。
示例
- 如下图是以8x8的图像块,经过变换、量化后的系数按照zigzag扫描,排序成串行行数据序列:
12,0,0-6,4,6,0,0,0,0,0,-7,0,0,0,-2,0,0,…
- 经过游程编码后的结果为:
(0,12,0)(2,-6,0)(0,4,0)(4,-7,0)(3,-2,1)
参考
- 深入理解视频编解码技术——基于H.264标准及参考模型