文章目录
- 率失真优化
- 率失真优化技术
- 率失真理论
- 1.互信息量
- 2.失真度
- 3.率失真函数
- 4.率失真信源编码定理
- 视频编码中的率失真优化
- 1.视频失真测度
- 2.视频率失真曲线
- 3.视频编码率失真优化
率失真优化
编码比特率和失真度相互制约、相互矛盾
因此,视频编码的主要目的就是在保证一定视频质量的条件下尽量减少编码比特率,或在一定编码比特率限制条件下尽量地减小编码失真。
在固定的编码框架下,为了应对不同的视频内容,往往有多种候选的编码方式,编码器的一个主要工作就是以某种策略选择最优的编码参数,以实现最优的编码性能。
率失真优化技术
率失真理论
1.互信息量
平均互信息量:
2.失真度
保真度准则
3.率失真函数
-
信息率失真函数只反映信源的特性,不同的信源,其信息率失真函数R(D)不同
-
在实际应用中,研究信息率失真函数R(D)是为了在已知信源和允许失真度的条件下,使信源必须传送给信宿信息的传输速率最小,即用尽可能少的码符号尽快地传送尽可能多的消息,以提高通信的有效性,这是信源编码问题。
-
信息率失真函数给出了限定失真条件下信息压缩允许的下界
4.率失真信源编码定理
对于无失真信源编码来说,每一个信源符号(或符号序列)必须对应一个码字(或码字序列),信源输出信息率不能减少。而在允许一定失真的情况下,信源输出信息率最少可减少到信息率失真函数R(D),有可 能是多个信源符号(或符号序列)对应一个码字(或码字序列)。率失真信源编码定理就是关于信息率和失真关系的一个极限定理,也称香农第三定理,即保真度准则下的离散信源编码定理。
定理1: 保真度准则下信源编码定理
对于任何失真度D>=0,只要码长l足够长,总可以找到一种编码C,使编码后每个信源符号的信息传输速率R’>R(D),而码的平均失真度D©<=D。即在允许失真D的条件下,信源可达到的最小传输速率是信源的R(D)
定理2: 保真度准则下信源编码逆定理
如果编码后平均每个信源符号的信息传输速率R’小于信息率失真函数R(D),就不能在保真度准则下再现信源的消息。
这两个定理证实了在允许失真D确定后,总存在一种编码方法, 使编码后的信息传输速率R‘大于R(D)且可任意接近于R(D),而平均失真度小于允许失真D。
注意:
-
香农第三定理只是一个最优编码方法的存在定理,对于复杂信源的有损编码实际中还存在大量的问题。
-
实际信源的R(D)函数的计算相当困难。
-
第一,需要对实际信源的统计特性有确切的数学描述
-
第二,需要对符合主客观实际的失真给予正确的度量,否则不能求出符合主客观实际的R(D)函数
-
第三,即便对实际信源有了确切的数学描述,又有符合主观感受的失真测度,率失真函数R(D)的计算是一个条件极小值的求解问题,复杂信源往往无法得到具体的率失真函数。
视频编码中的率失真优化
1.视频失真测度
一般来说,视频的客观失真测度应与人类视觉系统的感知失真一致。主观评价方法是由 观看者根据主观感受来给出视频质量的整体好坏,这种评价结果必然符合人的视觉感受。但其耗时耗力,无法用数学模型描述,不能直接用于度量视频编码中的失真,而且主观评价易受主观因素影响。
近期客观质量评估模型一直是视频领域的研究热点,但由于人们对人眼的视觉和认知机制仍不清楚,使用已有的客观评估方法得到的视频质量仍与主观体验质量一致性较差
2.视频率失真曲线
在实际编码系统中,通常对系统的编码复杂度、延时和内存等都有一定的要求,因此实际系统的最优性能并不能达到率失真曲线定义的理论值。
使用不同的编码参数可以得到不同的率失真性能,具体的编码参数包括量化参数、编码单元的分割模式、预测模式、变换模式等。使用一组特定的编码参数对视频源进行编码, 就可以获得该编码参数条件下的编码速率和失真,即率失真性能,这组 编码参数对应的(R,D)称为实际率失真曲线的一个可操作点。
遍历所有可行的编码参数组合就可以得到所有可操作点,由于实际编码系统中参数的取值是有限的。
3.视频编码率失真优化
不同的编码参数可以得到不同的率失真性能,最优的编码方案就是在编码系统定义的所有编码参数中使用能够使系统性能最优的参数值, 视频编码系统中的率失真优化就是基于率失真优化理论选择最优的编码参数。
将一 个视频序列作为编码单元,遍历大量的参数组合需要极大的计算量,实际的视频编码中无法使用这类穷举搜索方法。视频编码过程往往将视频序列分为多个较小的子任务,分别为每个子任务确定最优的参数集。这 里的子任务可以是编码一个CU、一幅图像或一个GOP。