H.266/VVC 关键帧内预测技术

news2025/2/8 9:58:11

在 VVC 中,帧内预测过程分为三个步骤:首先,从当前 CU 左侧和上方相 邻块获取参考像素,并对获取的参考像素值进行平滑滤波。其次,基于参考像素 预测得到当前 CU 像素值。最后为了提高预测像素值的精度,平滑滤波得到的预 测 CU 边界。

(1)更多样的角度模式

在 H.266/VVC 中,为了能充分捕捉视频中呈现的精细边缘方向以提高视频 压缩效果,将 H.265/HEVC 编码中已有的 35 个角度方向细分增加到了 65 个,并 保留了 Planar 模式及 DC 模式,如图 2-2 所示,红色箭头方向为 H.266/VVC 新 增的角度方向,所有 CU 大小的帧内亮度预测和帧内色度预测都可以使用如图 2-2 所示的帧内预测模式。

由于帧内角度预测模式数量的增加,并考虑了相邻两个帧内模式可用的基础 上,为了使得最有可能的模式(Most probable modes,MPMs)生成的列表复杂度低, 将 MPMs 的数量增加到了 6 个。在 H.266/VVC 中,由默认帧内预测模式、相 邻 CU 帧内预测模式及导出的帧内预测模式三个方面构建 MPMs 列表。

通过参考左侧和上方相邻 CU 的帧内模式来构造 MPMs 列表,如图 所 示,其中 A 代表左下方相邻的已编码块模式,B 代表左侧相邻的已编码块模式, C 代表左上方相邻的已编码块模式,D 代表上方相邻的已编码块模式,E 代表右 上方相邻的已编码块模式,则统一的 MPMs 列表的构造如下:

1)没有相邻块时,默认 Planar 模式。

2)左侧和上方都是非角度模式,MPMs 列表为{Planar,DC,垂直(50), 水平(18),垂直−4,垂直+4}。

3)左侧和上方其中一个为角度模式,另一个为非角度模式,设置左侧和上 方中模式最大的为 Max,MPMs 列表为{Planar,Max,DC,Max-1,Max+1, Max-2}。

4)左侧相邻已编码块和上方相邻已编码块都为角度模式。设置左侧和上方 模式最大的为 Max1,Max2,如果两者差值在 2~62 之间,其 MPMs 列表为{Planar, B,D,DC,Max1-1,Max1+1}。反之,MPMs 列表为{Planar,B,D,DC,Max1- 2,Max1+2}

5)如果都为角度模式且相同,MPMs 列表为{Planar,B,B-1,B+1,DC, B-2}。

在生成 MPMs 列表的过程中,通过不断删除重复的模式,保证只有唯一的 模式可以被包含在 MPMs 列表中。

因为 H.266/VVC 采用了四叉树划分、二叉树划分及三叉树划分的多类型树 划分结构,所以 CU 形状可能为正方形或矩形。但是由于传统的帧内角度预测方 向的范围为 45 度到负 135 度,而为了使得多叉树划分产生的非正方形块支持 65 种角度预测方向,在 H.266/VVC 中提出了广角预测模式以使帧内预测方向能够 超出传统的帧内预测方向的范围。广角帧内预测示例如图 2-4 所示,定义了 长度为 2W+1 的上部参考像素,以及长度为 2H+1 的左侧参考像素。通过广角帧 内预测,自动地替换掉了部分传统的帧内角度预测模式,保证帧内预测模式总数 量不变,并且保持原有的帧内模式编码方式,如图 所示,黑色虚线箭头为新 增的宽角度模式的方向。

在广角帧内预测模式下,通过当前块的宽高比来决定哪些传统的帧内预测模 式被替代成广角模式。如表 所示,当宽高之比等于 2 时,模式 2,3,4,5, 6,7 将自适应地替换为 67,68,69,70,71,72 模式。被改变的模式使用未变 前的模式序号发送至编码器,在解码器解码后将其重新变为广角模式。

在广角帧内预测下,两个垂直相邻的预测像素点可以使用两 个不相邻的参考像素点。为了减少像素样本间隙 Δpα 增大带来的负面影响,使用 了低通参考样本滤波和边缘平滑技术减小影响。

(2)位置决定的帧内预测组合

为了使预测像素值与相邻的重构参考像素值之间的边界平滑,并通过对定向 预测像素值提供平面效应来完善预测像素值,在 H.266/VVC 中提出了位置决定 的帧内预测组合技术。根据像素点位置,PDPC 将未滤波的参考像素值和滤波 后的参考线像素预测生成的预测像素值进行线性组合,并参考该线性组合得到当前块的预测像素值。在一般情况下,同一帧图像中像素之间的间隔距离越小,意 味着像素之间存在极强的相关性,通过上述规律,在 PDPC 中将相邻 CU 的参考 像素与当前 CU 的待预测像素之间的间隔距离设为权重,距离离得越近,计算出 来的权重越大,反之,参考像素与待遇测像素的间隔距离越远,计算出来的权重越小。

PDPC 技术应用于大小大于 4×4 的块,以及适用于以下帧内模式:Planar 模 式,DC 模式,水平模式(模式 18),垂直模式(模式 50),左下角模式及其八个 相邻的角度模式(模式 2~10),以及右上角模式及其八个相邻的角度模式(模式 58~66)。

在 PDPC 中,如果使用的帧内模式为 DC,Planar,水平和垂直模式时,则不 需要额外对边界进行平滑滤波,而在 HEVC 中 DC 模式、水平、垂直模式的情况 下,是必须使用边界滤波器。

位置决定的帧内预测组合的权重 wT、wL 和 wTL 和比例因子 nscale 根据当 前 CU 的高度和宽度以及当前像素点的位置的变化而变化,表 2-2 显示了权重 wT、wL 和 wTL 的定义,nscale 是由当前块的形状和帧内预测模式共同定义的位 移值,位移值和宽高相关,计算公式如式(2-2)所示。通常,宽高值小则 nscale 为 0,大则 nscale 为 2,多数情况 nscale 为 1。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1336159.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据库系统概论】第3章-关系数据库标准语言SQL(3)

文章目录 3.5 数据更新3.5.1 插入数据3.5.2 修改数据3.5.3 删除数据 3.6 空值的处理3.7 视图3.7.1 建立视图3.7.2 查询视图3.7.3 更新视图3.7.4 视图的作用 3.5 数据更新 3.5.1 插入数据 注意:插入数据时要满足表或者列的约束条件,否则插入失败&#x…

类加载器及其类加载子系统

类加载器子系统作用 类加载器子系统的作用是负责将字节码文件加载到内存中,并将其转化为能够被虚拟机直接使用的形式。它是Java虚拟机的一部分,具体作用如下: 加载 类加载器负责将类的字节码文件加载到虚拟机的方法区中,以便…

通过自然语言处理增强推荐系统:协同方法

一、介绍 自然语言处理 (NLP) 是人工智能的一个分支,专注于使机器能够以有意义且有用的方式理解、解释和响应人类语言。它包含一系列技术,包括情感分析、语言翻译和聊天机器人。 另一方面,推荐系统(RecSys)是旨在向用户…

elasticsearch 笔记二:搜索DSL 语法(搜索API、Query DSL)

文章目录 一、搜索 API1. 搜索 API 端点地址2. URI Search3. 查询结果说明5. 特殊的查询参数用法6. Request body Search6.1 query 元素定义查询6.2 指定返回哪些内容**6.2.1 source filter 对_source 字段进行选择****6.2.2 stored_fields 来指定返回哪些 stored 字段****6.2.…

【Azure 架构师学习笔记】- Power Platform(1) - 简介

本文属于【Azure 架构师学习笔记】系列。 本文属于【Power Platform】系列。 Power Platform 它是一个SaaS平台,支持和延伸M365, Dynamics 365和Azure甚至其他第三方服务。主要提供低代码,自动化,数据驱动和定制化业务逻辑的服务…

PSINS四元数转换函数rv2q

pins中的关于四元数转换 cquat rv2q(const cvect3* rv) 函数 代码对应的公式,第一个 第二个 其他 理解公式: 四元数的表示,与三角函数之间的关系 ,矢量(x,,y,z) 旋转角度为a, 矢量变…

c# OpenCvSharp 检测(斑点检测、边缘检测、轮廓检测)(五)

在C#中使用OpenCV进行图像处理时,可以使用不同的算法和函数来实现斑点检测、边缘检测和轮廓检测。 斑点检测边缘检测轮廓检测 一、斑点检测(Blob) 斑点检测是指在图像中找到明亮或暗的小区域(通常表示为斑点)&#…

数据结构之<堆>的介绍

1.简介 堆是一种特殊的数据结构,通常用于实现优先队列。堆是一个可以被看作近似完全二叉树的结构,并且具有一些特殊的性质,根据这些性质,堆被分为最大堆(或者大根堆,大顶堆)和最小堆两种。 2.…

Ps:制作“小行星”效果

在 Photoshop 中,制作 360 度全景效果或类似“小行星”效果主要就是使用“极坐标”滤镜。 不过,为了获得更好的效果,常常还需要做一些额外的处理和修饰。 原图(来自网络) 效果图 ◆ ◆ ◆ 一般步骤及说明 1、打开图像…

什么是OAuth2.0

前言 OAuth(Open Authorization)是一个关于授权(authorization)的开放网络标准,允许用户授权第三方应用访问他们存储在另外的服务提供者上的信息,而不需要将用户名和密码提供给第三方移动应用或分享他们数…

【华为机试】2023年真题B卷(python)-分糖果

一、题目 题目描述: 小明从糖果盒中随意抓一把糖果,每次小明会取出一半的糖果分给同学们。 当糖果不能平均分配时,小明可以选择从糖果盒中(假设盒中糖果足够)取出一个糖果或放回一个糖果。 小明最少需要多少次&#xf…

虚拟机服务器中了lockbit2.0/3.0勒索病毒怎么处理,数据恢复应对步骤

网络技术的不断发展也为网络威胁带来了安全隐患,近期,对于许多大型企业来说,许多企业的虚拟机服务器系统遭到了lockbit2.0/3.0勒索病毒攻击,导致企业所有计算机系统瘫痪,无法正常工作,严重影响了企业的正常…

【Vue2+3入门到实战】(4)Vue基础之指令修饰符 、v-bind对样式增强的操作、v-model应用于其他表单元素 详细示例

目录 一、今日学习目标1.指令补充 二、指令修饰符1.什么是指令修饰符?2.按键修饰符3.v-model修饰符4.事件修饰符 三、v-bind对样式控制的增强-操作class1.语法:2.对象语法3.数组语法4.代码练习 四、京东秒杀-tab栏切换导航高亮1.需求:2.准备代…

Java 快速入门

简介 跨平台性:Java 最大的优势之一就是跨平台性,即一份 Java 程序可以在多平台上运行,而无需重写。 简单易学:Java 的语法和面向对象的开发方式非常简单易学。 安全性:Java 对于安全性的处理非常慎重,对…

Power BI 学习

补充 二维表: 二维表就是由行列组成的,知道行号列号就可以确定一个表中的数据,这是二维表的特点。在关系数据库中,存放在数据库中的数据的逻辑结构以二维表为主.在二维表中惟一标识元组的最小属性值称为该表的键或码。二维表中可能有若干个健&#xff…

分别使用OVP-UVP和OFP-UFP算法以及AFD检测算法实现反孤岛检测simulink建模与仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 4.1 OVP-UVP算法 4.2 OFP-UFP算法 4.3 AFD检测算法 5.完整工程文件 1.课题概述 分别使用OVP-UVP和OFP-UFP算法以及AFD检测算法实现反孤岛检测simulink建模与仿真。 2.系统仿真结果 3.核心程序与模型…

Java基础回顾——JDBC

文章目录 介绍使用JDBC事务JDBC BatchJDBC连接池 介绍 Java为关系数据库定义了一套标准的访问接口:JDBC(Java Database Connectivity) JDBC是Java程序访问数据库的标准接口 好处: 各数据库厂商使用相同的接口,Java…

基于SSM+Vue的教材信息管理系统(Java毕业设计)

点击咨询源码 大家好,我是DeBug,很高兴你能来阅读!作为一名热爱编程的程序员,我希望通过这些教学笔记与大家分享我的编程经验和知识。在这里,我将会结合实际项目经验,分享编程技巧、最佳实践以及解决问题的…

Python遥感影像深度学习指南(2)-在 PyTorch 中创建自定义数据集和加载器

在上一篇 文章中,我们Fast.ai 在卫星图像中检测云轮廓,检测物体轮廓被称为语义分割。虽然我们用几行代码就能达到 96% 的准确率,但该模型无法考虑数据集中提供的所有输入通道(红、绿、蓝和近红外)。问题在于,深度学习框架(如 Keras、Fast.ai 甚至 PyTorch)中的大多数语…

OAuth2授权码模式---详解

OAuth2简介 是一个业界标准的授权协议(authorization protocol),这里的授权是以委派代理(delegation)的方式。可以这样理解,OAuth 2.0提供一种协议交互框架,让某个应用能够以安全地方式获取到用…