HEVC编码标准介绍

news2024/11/24 12:42:59

视频编码标准的发展历程

目前已经有H266、AVS3、AV1等新编码标准。
在这里插入图片描述

H264的编码劣势

  1. 宏块个数的爆发式增长,会导致用于编码宏块的预测模式、运动矢量、参考帧索引、量化等宏块级参数信息所占用的码字过多,用于编码残差部分的码字明显减少;
  2. 由于分辨率的大大增加,单个宏块所表示的图像内容的信息大大减少,这将导致相邻的4x4或8x8变换后的低频系数相似程度大大提高,导致出现大量的冗余;
  3. 由于分辨率的大大增加,表示同一个运动的运动矢量的幅值降大大增加,h264中采用一个运动矢量预测值,对运动矢量差编码使用的是哥伦布指数编码,该编码方式的特点是数值越小使用的比特数越少,因此,随着运动矢量的幅值的大幅增加,h264中用来对运动矢量进行预测以及编码的方法压缩率将逐渐降低;
  4. h264中的关键算法如采用CABLC和CABAC两种机遇上下文的熵编码方法、deblock滤波都要求串行编码,并行度比较低;针对GPU/DSP/FPGA/ASIC等并行化程度非常高的CPU,h264的这种串行化处理越来约成为制约运算性能的瓶颈。

HEVC编码顺势而为,孕育而生!!

h264与HEVC关键特性对比

在这里插入图片描述

HEVC编码框架

附英文版和中文版。
在这里插入图片描述
在这里插入图片描述

HEVC编码标准关键特性介绍

灵活的编码单元

为更灵活有效地表示视频内容,H.265/HEVC 为图像的划分定义了一 套全新的分割模式,包括编码单元(CodingUnit, cu)、预测单元 (PredictionUnit,PU) 和变换单元(TransformUnit, TU)1o。这种特性 有助 于编码器根据祝频内容特性、视频应用和终端的特性 来自适应地选 择编码模式。
在这里插入图片描述

改进的帧内编码预测技术

  1. 亮度帧内预测模式:
    ■ 帧内PU 支持5种大小:4x4、8x8、16x16、32x32、64x64;
    ■ 每种都有35种预测模式:planar模式(模式0,适用像素值变化缓慢的区域)、DC模式(模式1,适用于大面积平坦区域)、33种角度模式;
    ■ DC模式和H.264 /AVC 类似,对当前块的所有像素使用同一个预测值,即它们的平均值,适合像素变化缓慢的区域;
    ■ planar模式的预测值由水平和垂直两个方向上已知像素的线性内插产生,特别适用于图像的平坦区域。
    ■ 在帧内编码中色度信号也采用相应亮度信号所采用的预测模式。

  2. 色度帧内预测模式:
    ■ 每种有5种预测模式:planar、水平(角度10)、垂直(角度26)、DC和对应的最佳亮度预测模式。

  3. 预测过程:
    ■ 35种预测模式是在PU的基础上定义的,而具体帧内预测过程的实现是以TU为单位的,标准规定PU可以以四叉树的形式划分TU,且一个PU内所有TU共享同一种预测模式。具体步骤:
    ● 判断当前TU相邻像素是否可用并做相应处理;
    ● 对参考像素进行滤波;
    ● 根据滤波后的参考像素值计算当前TU的预测像素值。
    在这里插入图片描述

先进的帧间预测技术

为了提升帧间预测性能,在H. 265/HEVC 中引入了新的帧间预测技 术,包括运动信息融合技术(Merge)、先进的运动矢量预测技术( Advanced Motion Vector Predictor, AMVP) 以及基于Merge 的Skip模式。Merge 技 术 利 用 空 域 相 关性 和 时 域 相 关性 来减 少 相 邻 块 之 间 的 运 动 参 数 冗 余 , 具体来说,就是取其相邻 PU 的运动参数作为当前 PU 的运动参数。 AMVP 技术的作用与Merge 技术类似,也是利用空域相关性和时域相关 性来减少运动参数的元余。AMVP 技术得到的运动矢量一 方面为运动估 计提供搜索起点,另一方面作为预测运动矢量使用。

  1. merge模式
    为当前PU建立MV候选列表,存在5个候选MV,遍历这5个,进行率失真代价计算,代价最小的作为该merge的最优MV。编码器只需要传输该MV在候选列表中的索引即可;
  2. AMVP模式
    Advanced Motion Vector Prediction,利用空域和时域的运动相关性,为当前PU建立候选MV列表,选择最后MV后,进行差分编码。解码端通过运动向量残差MVD与预测MV在列表中的序号即可计算出当前PU的MV。类似于merge模式,不过AMVP模式的MV候选列表长度只有2。
    在这里插入图片描述

RQT技术

RQT (Residual Quad-treeTransform)技术是一种基于四叉树结构的自适应变换技术,它为最优TU 模式选择提供了很高的灵活性。

HEVC使用了4种不同的整数DCT变换,4x4、8x8、16x16、32x32。

HEVC规定在帧内4x4亮度分量残差编码中使用4x4整数DST,因为DST基函数适应距离预测像素越远,预测残差幅度越大。

TU是h265中进行变换、量化、熵编码的基本单元,4x4、8x8、16x16、32x32,CU可以以四叉树划分TU。由于PU、TU都直接由CU划分得到,二者大小没有明确关系,一个PU可能包含多个TU,一个TU也可以跨越多个PU,但二者都必须小于CU。

ASC技术

ACS (Adaptive Coeficient Scanning)包括 三类:对角扫描、水平扫 描和垂直扫描。

SAO技术

基于于块的混合编码框架必然会导致块效应、振铃效应、颜色偏差、图像模糊等失真效应,h265采用环路滤波处理,在量化之后,在熵编码之前,包括去方块滤波(Deblock Filter,DBF)、像素自适应补偿(Sample Adaptive Offset,SAO)。
DBF去除块效应,SAO去除振铃效应,先DBF之后SAO。

IBDI技术

IBDI (Internal Bit Depth Increase) 技术是指在编码器的输入端将末压缩图像像素深度由 P 比特增加到 Q 比特 (Q>P ),在解码器的输出端又将解压缩图像像素深度从 Q 比特恢复到 P 比特。

参考

新一代高效视频编码H.265/HEVC原理、标准与实现 [万帅,杨付正 编著] 2014年版。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/518778.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++实现并查集

1.并查集原理 在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个 单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一 个元素归属于那个集合的运算。适合于描述这类…

编译原理----词法分析设计

程序设计实验1 词法分析 一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。 二、实验内容 编制一个单词获取程序,从文件…

门店销售干货 | 4种不同类型的顾客VS销售技巧,直接套用!

“我就路过随便看看” “我在别人家看到的更便宜” “我自己看,你不要跟着我” “我下次再买” …… 在日常的门店经营过程中,你是否经常遇到不同类型的顾客,用各种不同的话拒绝你,最后成交的寥寥无几。 面对不同这样不同类型…

java异常总结

java异常总结 什么是异常? 在Java中,将程序执行过程中发生的不正常行为称为异常。 常见异常举例 1.算数异常ArithmeticException public class Test{public static void main(String[] args) {System.out.println(10/0);} }报错 ArithmeticExcept…

webhub123整理 中文语音识别数据集​

我们收集和整理了常用的中文语音识别数据集,合计超过12000小时的数据集。已经按照不同来源整理收录到 webhub123整理 中文语音识别数据集​https://www.webhub123.com/#/home/detail?projectHashid64335220&ownerUserid22053727 整理后的效果如下 ​ 每个卡片…

mysql Lock wait timeout exceeded; try restarting transaction

文章目录 一、mysql死锁及超时的原因二、mysql死锁排查思路1、show full processlist 查询当前数据库全部线程2、information_schema 一、mysql死锁及超时的原因 当在业务逻辑中看到这个错误,或者mysql中使用update语句更新数据报错: Lock wait timeout…

数影周报:丰田215万名日本客户信息被无意泄露,菜鸟将于明年初在港IPO

本周看点:丰田215万名日本客户信息被无意泄露;美光宣布吴明霞出任美光中国区总经理;谷歌将向Gmail用户提供暗网数据泄露报告;淘宝天猫集团架构调整完成;菜鸟计划于2024年初在香港IPO...... 数据安全那些事 丰田215万名…

体验了基于ChatGPT的谷歌翻译插件后,我把其他翻译插件移除了

最近,一个基于 ChatGPT 的谷歌浏览器翻译插件挺火的,我体验了下,总结下来就一个字“666”。 github 上已经有 14.9k 的 star 了 传送门:GitHub - yetone/openai-translator: 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端…

AI学术界无人后继?高校毕业生纷纷进厂,全是香饽饽

来源 | 新智元 微信号:AI-era 【导读】近日,有外媒对一批美国名校的大学生和教授进行了采访。结果显示,高校毕业生入职科技公司已成主流。 AI火,搞AI的人就火。 这不,据Insider最近的一次采访报道,科技类…

Vue3-黑马(五)

目录: (1)vue3-基础-axios-拦截器 (2)vue3-基础-条件与列表 (3)vue3- 基础-监听器 (1)vue3-基础-axios-拦截器 我们自己创建axios对象有一个好处,就是可以…

[译] Flutter 3.10 的新功能

[译] Flutter 3.10 的新功能 原文 https://medium.com/flutter/whats-new-in-flutter-3-10-b21db2c38c73 无缝的Web和移动端集成,Impeller稳定版的突破性图形性能,以及更多 欢迎使用Flutter 3.10!我们非常期待展示我们令人惊叹的Flutter社区所…

java可视化开发工具好用不好用?

java可视化开发工具到底好用不好用?这是不少粉丝朋友经常询问到的一个问题。在数字化发展趋势越发明显的当下,java可视化开发工具可以帮助各中大型企业实现转型升级,它的灵活、简洁、易操作、可视化等功能优势,让很多客户朋友欣慰…

OLYMP‘ARTS 2023奥艺大会中国推介会在北京盛大举行

北京时间2023年5月11日16时,以“艺术连接世界”为主题的OLYMPARTS 2023 国际奥艺大会中国推介会在北京盛大举行。此次活动由国际奥艺委员会(WOAC)指导支持,共邀请了国外驻华机构、文旅部、央国企、国内外协会机构、知名艺术家代表…

【项目源码】智慧班牌源码 家校互联小程序源码 智慧校园云平台

智慧校园平台源码 智慧班牌源码 人脸识别技术 电子班牌源码 家校互联小程序源码 源码开发环境:Javaspringbootvueelement-uimysql 智慧校园系统定位于中小学教育学校,侧重实际应用,讲究实际,突出加强校园安全监管,德…

【数值模型系列】CMAQ全局属性修改

一、问题产生 在做一个月的浓度预测时,由于GFS只能预报16天左右,因此需要使用CFS气象数据来驱动WRF模型,但CFS在WRF4.x版本有问题,因此重新装了WRF3.9.1版本的WRF。 而我这里的CMAQ ICON会去取前一天的CCTM CONC制作新的ICON文件…

ImageBind 横跨六种数据模式,用向量统一 AI 语言

出品人:Towhee 技术团队 作者:顾梦佳 人工智能(AI)最近毋庸置疑又迎来了一个高速发展的浪潮。 目前,人工智能的应用已经渗透到各个领域,包括自然语言处理、计算机视觉、语音识别、机器人技术等,…

如何自己搭建Scrapy爬虫框架

前言 当你学了一段时间爬虫后,就会知道各种功能太多而且麻烦。还不如自己整理个框架方便的多。因此,从开始写爬虫程序开始,就会慢慢的接触到一些有关爬虫的框架、效率提升而且扩展也很方便。接下来我将会以Scrapy爬虫框架将我的学习过程记录下…

查找符合条件,且不重复的数据 +++ EXCEL的数组公式(未完成)

查找符合条件,且不重复的数据 1 目标问题 查找第1列,月份为5月,并且第2列不重复的数据个数有2个条件 有的版本有唯一计数,有的没有 2 比较简单的方法 2.1 加辅助列,简单公式,其实逻辑是更清晰的 这里主要…

【数据结构】和栈一样简单的结构——队列

【数据结构】和栈一样简单的结构——队列 一、前言1、什么是队列?2、使用什么结构实现? 二、目标三、实现1、初始化工作2、入队2.1、图解思路2.2、代码实现 3、出队3.1、图解思路3.2、代码实现 4、打印队列(用于测试)5、返回队头元素6、返回队尾元素7、返…

Android工程师复盘小米、滴滴的面试全过程,网易offer已收入囊中

背景 时间过的真快,16年毕业到现在也有好几年了,最近面试试着投了几十家Android framework工程师的岗位,也面试了好几家,其中包括滴滴出行、小米、合众新能源、网易、最终收到了网易和滴滴offer,小米二面挂掉&#xf…