H266/VVC多样化视频编码工具概述

news2024/10/3 10:35:41

全景视频编码

全景视频: 具有360度全包围视角的球面视频。
全景视频编码: 包括H266在内的视频编码算法都是以平面视频为对象的,为了采用传统的视频编码编码算法,全景视频需要转换为平面视频,其中经纬图等角映射(ERP)、立方体映射(CMP)是常用的格式。

水平环绕运动补偿:
普通平面视频编码算法的运动补偿中,当运动矢量指向参考图像边界区域外的像素时,会对参考图像边界进行填充以获取参考像素值,填充方法是用距离填充位置最近的图像边界像素值作为填充值。
ERP格式全景视频的左右边界是连续的,即图像的最左侧列像素与最右侧列像素内容是相邻的,如下图。
在这里插入图片描述
水平环绕运动补偿针对该类格式视频设计,可以使用图像右侧像素对左侧像素进行填充,也可以使用图像左侧像素对右侧像素进行填充。此外水平环绕运动补偿适用于其他左右边界连续的格式,比如等面积映射。
在这里插入图片描述
虚拟边界取消环路滤波:
多面投影映射是将球面全景视频投影在多个平面上,不论采用何种拼接方式,都不可避免地会在某些相邻投影面之间出现图像内容不连续现象,比如如下CMP格式。
如果对这些不连续边界使用环路滤波,则在重建视频中会出现拼接伪影,H266标准允许对指定边界禁用换路滤波。
在这里插入图片描述

屏幕内容编码

屏幕内容视频:像计算机桌面分享、文档演示、游戏动画等,都是屏幕内容视频,通常是由计算机生成,相比自然视频,屏幕内容视频不受摄像机镜头的物理限制,不存在传感器噪声,常带有更少的颜色类型,更多的重复图形,更锐利的物理边缘,场景切换也在屏幕视频中频繁出现。

H266屏幕内容编码: 针对屏幕内容视频的特性,H266标准采用了多种屏幕内容编码(Screen Content Coding,SCC)工具,包括帧内块复制、变换跳过模式的残差编码,块差分脉冲编码调制,调色板模式,自适应色度变换等。

帧内块复制:
IBC(Intra Block Copy)不再将参考区域限制在相邻像素行,利用当前帧所有已编码区域,预测待编码CU。预测过程与帧间预测类似,以CU为单位在当前帧已经完成重建的区域内搜索匹配的块。
使用块矢量(Block Vector,BV)来描述当前CU与匹配块的位移,与帧间预测出中的运动矢量类似,利用块矢量可以获取匹配块作为当前CU的预测值,如下图,IBC预测模式可以有效利用屏幕内容中重复出现的内容,完成更高效的预测。
在这里插入图片描述
帧内块复制支持两种预测模式,即IBC Merge模式和IBC AMVP模式。其中IBC Merge模式的块矢量候选列表通过空域矢量和历史矢量构建,下图时候空域块矢量示意图。IBC AMVP模式候选仅通过空域相邻块获取块矢量预测值,其预测值构建方式与IBC Merge模式中的空域块矢量预测方式相同。
在这里插入图片描述

变换跳过模式的残差编码:
H266中添加了变换跳过模式,即跳过变换过程,直接对CU的预测残差进行量化和熵编码。在H266中,变换跳过模式仅对宽和高都小于MaxTsSize的CU使用,MaxTsSize的值在SPS层语法元素中标识,最大值为32。

块差分脉冲编码调制:
针对屏幕视频内容,H266标准中采用块差分脉冲编码调试模式(Block Differential Pulse Coded Modulation, BDPCM)。CU完成帧内预测后,不对预测残差进行变换而直接量化,然后对量化预测出残差按预测方向进行差分脉冲编码。

调色板模式:
屏幕视频的像素值经常集中在少量颜色,H266的调色板模式(Palette Mode)可以有效提高屏幕视频的编码性能。在该模式下编解码端维护一个称为调色板的颜色列表,当像素值等于活接近调色板中得到某一个颜色时,编码端值需要编码该颜色的索引。当屏幕内容视频中的颜色种类较少时,可以用长度较短的调色板完成像素信息描述,获得较高的编码效率。

自适应色度变换:
为了削弱颜色失真效应,屏幕视频经常使用4:4:4颜色格式,H266采用ACT技术(Adaptive Color Tansform),允许使用颜色转换模块,将视频信息转换到YCgCo颜色空间,进行变换、量化、熵编码等操作。ACT技术如下图。
YCgCo颜色空间具有接近KL变换的都编码性能、与RGB颜色空间的转换可逆,支持有损压缩和无损,只包含移位和加法运算,计算复杂度低等优势。
在这里插入图片描述

参考

JVET输出文档: https://www.itu.int/wftp3/av-arch/jvet-site/
书籍: 新一代通用视频编码H266/VVC:原理、标准与实现[万帅 霍俊彦 马彦卓 杨付正/著]

备注

本系列博客主要是对《新一代通用视频编码H266/VVC:原理、标准与实现》的学习笔记。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1362026.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深度学习|4.1 深L层神经网络 4.2 深层网络的正向传播

4.1 深L层神经网络 对于某些问题来说,深层神经网络相对于浅层神经网络解决该问题的效果会较好。所以问题就变成了神经网络层数的设置。 其中 n [ i ] n^{[i]} n[i]表示第i层神经节点的个数, w [ l ] w^{[l]} w[l]代表计算第l层所采用的权重系数&#xff…

记一次实战云渗透总结

点击星标,即时接收最新推文 云渗透思路 所谓的云渗透通常指SaaS或PaaS渗透,即将服务器端的某些服务搭建在云服务器上,源代码的开发、升级、维护等工作都由提供方进行。从原理上看,云渗透思路与传统渗透思路相差无几。站点必须由底…

Python中的cls语法

在Python中,cls 是一个用于指代类本身的约定性名称,通常用作类方法(class method)中的第一个参数。cls 类似于 self,它是对类的引用,而不是对实例的引用。cls 通常在类方法中用于访问类级别的属性和方法。举…

Kafka消息阻塞:拯救面试的八大终极解决方案!

大家好,我是小米,一个对技术充满热情的90后程序员。最近在准备社招面试的过程中,遇到了一个超级有挑战性的问题:“Kafka消息阻塞怎么解决?”今天,我就来和大家一起深入剖析这个问题,分享我在解决…

1-02VS的安装与测试

一、概述 对于一名C语言程序员而言,进行C语言程序的开发一般需要一个文本编辑器加上一个编译器就足够了。但为了方便起见,我们选择使用集成开发环境——Visual Studio(简称VS)。安装Visual Studio 下面讲一下如何安装VS&#xff0…

找不到mfc110u.dll,是什么原因,五种找不到mfc110u.dll,的解决方法

在日常使用电脑的过程中,我们可能会遇到一些错误提示,其中之一就是“mfc110u.dll丢失”。那么,什么是mfc110u.dll文件?为什么会出现丢失的情况?本文将为您详细介绍mfc110u.dll文件的作用、丢失原因以及提供5种解决方法…

概率论基础知识补充

概率论基础知识 样本概率:P(x)表示样本x出现的概率,也就是在全体样本中出现的概率先验概率:对于多类问题,类别状态 ω i \omega_i ωi​出现的概率, P ( ω i ) P{\left(\omega_i\right)} P(ωi​)条件概率:在类别 ω…

关于图像分类任务中划分数据集,并且生成分类类别的josn字典文件

1. 前言 在做图像分类任务的时候,数据格式是文件夹格式,相同文件夹下存放同一类型的类别 不少网上的数据,没有划分数据集,虽然代码简单,每次重新编写还是颇为麻烦,这里记录一下 如下,有的数据…

win10关闭打开文件安全警告

1.使用场景 在流水线上,因车间刷软件的程序不能下发到每一台电脑上,会使用共享文件夹的形式来共享程序。每次打开会弹出一下窗口,影响员工生产。 需要将安全警告关闭。2.解决步骤 1.winR键打开运行窗口,输入gpedit.msc&#xff…

vue3 的内置组件汇总

官方给出的说明: Fragment: Vue 3 组件不再要求有一个唯一的根节点,清除了很多无用的占位 div。Teleport: 允许组件渲染在别的元素内,主要开发弹窗组件的时候特别有用。Suspense: 异步组件,更方便开发有异步请求的组件。 一、fr…

django学习:页面渲染与请求和响应

1.请求过程 2.页面渲染 在app中新建一个目录(Directory),文件名命名为templates。该文件名命名是固定的,不可命名出错,如若后续步骤出错,该目录文件名是一个检查的重点项目。在该目录下新建一个html文件&a…

软件测试|全面解析Docker Start/Stop/Restart命令:管理容器生命周期的必备工具

简介 Docker是一种流行的容器化平台,用于构建、分发和运行应用程序。在使用Docker时,经常需要管理容器的生命周期,包括启动、停止和重启容器。本文将详细介绍Docker中的docker start、docker stop和docker restart命令,帮助您全面…

通过cpolar在公网访问本地网站

通过cpolar可以轻松将本地网址映射到公网进行访问,下面简要介绍一下实现步骤。 目录 一、cpolar下载 二、安装 三、使用 3.1 登录 3.2 创建隧道 一、cpolar下载 cpolar官网地址:cpolar - secure introspectable tunnels to localhost 通过QQ邮箱…

视频剪辑实战:如何批量嵌套合并视频,提高剪辑效率必备技巧

在视频剪辑工作中,经常要处理大量的视频片段。要提高工作效率,批量嵌套合并视频成为了一项必备技巧。现在一起看看云炫AI智剪如何使用一些实用的技巧,快速、准确地完成批量嵌套合并视频的任务。 合并后的视频截图,由两段不同片段组…

Flutter+Go_Router+Fluent_Ui仿阿里网盘桌面软件开发跨平台实战-买就送仿小米app开发

Flutter是谷歌公司开发的一款开源、免费的UI框架,可以让我们快速的在Android和iOS上构建高质量App。它最大的特点就是跨平台、以及高性能。 目前 Flutter 已经支持 iOS、Android、Web、Windows、macOS、Linux 的跨平台开发。 Flutter官方介绍,目前Flutte…

Flutter3.X基础入门教程(2024完整版)

Flutter介绍: Flutter是谷歌公司开发的一款开源、免费的UI框架,可以让我们快速的在Android和iOS上构建高质量App。它最大的特点就是跨平台、以及高性能。 目前Flutter已经支持 iOS、Android、Web、Windows、macOS、Linux的跨平台开发。 教程所讲内容支持…

气动凝结水回收机组 浮球机械泵回收机组工作原理动画讲解介绍

​ 1:气动凝结水回收浮球机械泵介绍 气动凝结水回收是一种利用气动力转换产生负压的装置,可以将废气中的水分分离出来并回收利用。这种装置主要包含两个关键部件:气水分离器和气动运动控制阀。 气水分离器负责将进入回收装置的废气中的水分…

1、Excel工作场景和知识点总结

参考: 戴师兄–戴你玩转数据分析 Excel发挥战斗力的场景 地量级数据的存储 我们日常所用的各种数据表格,基本都以excel的.xlsx或者.xls格式进行存储。并且因为大家电脑上都有excel,这就使excel的通用性很高(我用excel做好一个表发给你&#x…

数据库-MySQL 启动方式

以管理员身份运行命令行 或者Shell net start //查看所有服务 net start MYSQL80 //启动服务 net stop MYSQL80 //停止服务完整安装MySQL社区版本的 会有这个 启动服务 停止服务 重启服务

游戏缺少x3daudio1_7.dll文件怎么办?x3daudio1_7.dll丢失总共有六个解决方法

导语:在计算机使用过程中,我们经常会遇到一些错误提示,其中之一就是“x3daudio1_7.dll丢失”。那么,x3daudio1_7.dll到底是什么文件呢?它的作用和影响又是什么呢?本文将为您详细介绍x3daudio1_7.dll的相关知…