AV1 Bitstream Decoding Process Specification:术语和定义

news2025/1/11 16:57:17
  • 原文地址:https://aomediacodec.github.io/av1-spec/av1-spec.pdf
  • 没有梯子的下载地址:AV1 Bitstream & Decoding Process Specification
  • 摘要:这份文档定义了开放媒体联盟(Alliance for Open Media)AV1视频编解码器的比特流格式和解码过程。
  • 规范:此文档规定了开放媒体联盟(Alliance for Open Media)AV1比特流格式和解码过程。

术语和定义

对于本文档的目的,以下术语和定义适用:

  1. AC coefficient :AC 系数,在至少一个维度上频率索引非零的任何变换系数。
  2. Altref:替代参考帧, 在帧间编码中可以使用的帧。
  3. Base layer:基础层,即spatial_id 和 temporal_id 的值为 0 的层。
  4. Bitstream:比特流,即编码一系列帧生成的比特序列。
  5. Bit string:比特字符串,有限数量的比特的有序字符串。最左边的比特是最显著比特(MSB),最右边的比特是最不显著比特(LSB)。
  6. Block:块,样本的正方形或矩形区域。
  7. Block scan:块扫描,量化系数的特定序列排序。
  8. Byte:字节,8 比特的比特字符串。
  9. Byte alignment:字节对齐,如果比特的位置是从比特流中第一个比特的位置开始的八的整数倍,则该比特是字节对齐的。
  10. CDEF:约束方向增强滤波器,设计用于根据识别方向自适应地过滤块的滤波器。
  11. CDF:累积分布函数,表示符号值小于或等于给定水平的概率乘以 32768 的函数。
  12. Chroma:色度,一个色度样本值矩阵或其中一个色度差分信号的单个样本值。注意:色度的符号是 U 和 V。
  13. Coded frame:编码帧,解码过程之前一帧的表示形式。
  14. Component:分量,三个样本值矩阵中的一个(一个亮度矩阵和两个色度矩阵)或其单个样本值。
  15. Compound prediction:复合预测,一种帧间预测,通过混合两个参考帧的预测来计算样本值(混合的帧可以是相同的或不同的)。
  16. DC coefficient:DC 系数,在两个维度上频率索引都为零的变换系数。
  17. Decoded frame:解码帧,解码器从比特流重构出的帧。
  18. Decoder:解码器,解码过程的一个实现。
  19. Decoding process:解码过程,从语法元素推导出解码帧的过程,包括在使用电影颗粒合成过程之前和过程中使用的任何处理步骤。
  20. Dequantization:去量化,通过缩放量化系数来获得变换系数的过程。
  21. Encoder:编码器,编码过程的一个实现。
  22. Encoding process,编码过程,本规范中未指定的过程,它生成符合本文档描述的比特流。
  23. Enhancement layer:增强层,spatial_id 和 temporal_id 的值大于 0 的层。
  24. Flag:标志,二进制变量 - 一些变量和语法元素(例如 obu_extension_flag)使用“标志”一词来描述,以突出语法元素只能等于 0 或 1。
  25. Frame:帧,视频信号在空间域的表示,由一个亮度样本矩阵(Y)和两个色度样本矩阵(U 和 V)组成。
  26. Frame context:帧上下文,解码过程中使用的一组概率。
  27. Golden frame:黄金帧,可以在帧间编码中使用的帧。通常黄金帧以更高的质量编码,并用作多个帧间帧的参考。
  28. Inter coding:帧间编码,使用帧间预测来编码一个块或帧。
  29. Inter prediction:帧间预测,使用之前解码的帧推导出当前帧的预测值的过程。
  30. Intra coding:帧内编码,使用帧内预测来编码一个块或帧。
  31. Intra frame:帧内帧,仅使用帧内预测压缩的帧,可以独立解码。
  32. Intra prediction:帧内预测,使用同一已解码帧中先前解码的样本值推导出当前样本的预测值的过程。
  33. Inverse transform:逆变换,将变换系数矩阵转换为空间样本值矩阵的过程。
  34. Key frame:关键帧,一种帧内帧,当显示时会重置解码过程。
  35. Layer:层,一组具有相同spatial_id和相同 temporal_id 值的 tile group OBUs。
  36. Level:级别,对语法元素和变量值的一组定义的约束。
  37. Loop filter:环路滤波,应用于重建的滤波过程,旨在减少块边缘的可见性。
  38. Luma:亮度,代表与主要颜色相关的单色信号的样本值矩阵或单个样本值。注意:表示亮度的符号是 Y。
  39. Mode info:模式信息,在解码过程中包含有关如何预测块的指示的语法元素。
  40. Mode info block:模式信息块,一个 4x4 或更大尺寸的亮度样本值块及其对应的两个色度样本值块(如果存在)。
  41. Motion vector:运动矢量,用于帧间预测的二维矢量,将当前帧指向参考帧,其值提供了从当前帧中的位置到参考帧中位置的坐标偏移。
  42. OBU:开发比特流单元,所有结构都打包在“开放比特流单元”或 OBUs 中。每个 OBU 都有一个头部,提供包含数据(有效载荷)的识别信息。
  43. Parse:解析,从比特流中获取语法元素的过程。
  44. Prediction:预测,包括帧间或帧内预测的预测过程的实现。
  45. Prediction process:预测过程,使用预测器估算已解码样本值或数据元素的过程。
  46. Prediction value:预测值,在下一个样本值或数据元素的解码过程中使用的值,它是先前解码的样本值或数据元素的组合。
  47. Profile:配置文件,在规范部分中定义的语法、语义和算法的子集。
  48. Quantization parameter:量化参数,用于在解码过程中缩放量化系数的变量。
  49. Quantized coefficient:量化系数,去量化前的变换系数。
  50. Raster scan:光栅扫描,将二维矩形光栅映射到一维光栅,一维光栅的条目从二维光栅的第一行开始,然后扫描第二行、第三行等。每一行光栅都按从左到右的顺序扫描。
  51. Reconstruction:重建,获得已解码残差和相应预测值的加和。
  52. Reference:参考,一组标签中的一个,每个标签都映射到一个参考帧。参考帧是存储先前解码帧和相关信息的区域。
  53. Reserved:保留,一个特殊的语法元素值,将来可能会用于扩展本部分。
  54. Residual:残差,重建样本与相应预测值之间的差异。
  55. Sample:样本,构成帧的基本元素。
  56. Sample value:样本值,样本的值。对于 8 位帧,这是一个从 0 到 255(含)的整数;对于 10 位帧,这是一个从 0 到 1023(含)的整数;对于 12 位帧,这是一个从 0 到 4095(含)的整数。
  57. Segmentation map:分割图,一个 3 位数字,包含图像中每个 4x4 块的段归属。每个参考帧都存储一个分割图,允许新帧使用先前编码的图。
  58. Sequence:序列,编码比特流的最高级语法结构,包括一个或多个连续的编码帧。
  59. Superblock:超块,一个 tile 内块四叉树的最高级别。所有超块在帧内大小相同,并且是正方形。超块可以是 128x128 亮度样本或 64x64 亮度样本。一个超块可能包含 1 个或 2 个或 4 个模式信息块,或者可以在每个方向上分割成 4 个子块,这些子块可以进一步细分,形成块四叉树。
  60. Switch Frame:切换帧,可以用作序列之间切换点的帧。切换帧覆盖所有参考帧,而不强制使用帧内编码。目的是允许在流媒体使用案例中,视频可以以小块(比如1 秒时长)编码,每个块都以切换帧开始。如果可用带宽下降,服务器可以开始发送较低比特率编码的块。当这种情况发生时,帧间预测使用现有的较高质量参考帧来解码切换帧。这种方法允许在不产生完整关键帧成本的情况下切换比特率。
  61. Syntax element:语法元素,比特流中表示的数据元素。
  62. Temporal delimiter OBU:时间分割符OBU,表明随后的 OBUs 将与时间分隔符之前的上一帧有不同的表示/解码时间戳。
  63. Temporal unit:时间单元,时间单元由与特定、不同时间点相关联的所有 OBUs 组成。它由一个时间分隔符 OBU 和所有随后的 OBUs 组成,直到但不包括下一个时间分隔符。
  64. Temporal group:时间组,一组定期在视频序列中使用其时间预测结构的帧。
  65. Tile:瓦片,可以独立编码和解码的帧的矩形区域,尽管跨瓦片边缘仍然应用环路滤波。
  66. Transform block:变换块,用作逆变换过程输入的矩形变换系数矩阵。
  67. Transform coefficient:变换系数,在变换块中包含的标量值,被认为是在频率域中的值。
  68. Uncompressed header:未压缩的头部,要解码的帧的高级描述,编码时未使用算术编码。

原文

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2122351.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

上海市皮肤病医院引入AcrelEMS-MED平台打造绿色医院

在数字化转型的浪潮中,上海市皮肤病医院再次走在前列,宣布对其能源管理系统进行全面升级,引入AcrelEMS-MED医院能源管理平台,以科技力量推动绿色医院建设,为患者和医护人员打造更加安全、高效、环保的就医与工作环境。…

2024.9.9(极客大挑战 2019]EasySQL,[极客大挑战 2019]Knife)

题目一:极客大挑战 2019]EasySQL 1、点开题目链接,来到下面的界面 2、遇到这样的登录界面,先尝试admin和万能密码(1 or 11#),拿到flag 题目二:[极客大挑战 2019]Knife 1、点开链接&#xff0c…

【C++】模板:进阶(仿函数深度剖析)

目录 一.仿函数的概念 二.仿函数的作用 三.模板的非类型模板参数 四.array 五.模板的特化 六.函数模板 七.类模板 1.全特化 2.偏特化 八.模板分离编译 一.仿函数的概念 仿函数本质就是一个类,此类中重载了运算() ,因此它使用起来就和函数很像&a…

新160个crackme - 053-devilz KeyGen me#3

运行分析 解压出来4个文件运行程序发现要破解Name和Serial PE分析 32位,petite壳 手动脱壳 使用windows XP虚拟机OD打开程序按2下F8,发现ESP变红,根据ESP定律,在该地址右键 -> HW break下断点 继续按2下F9,来到灰色…

从0到1:中小企业如何用内容营销吸引客户,塑造品牌魅力?

今天咱们来聊聊中小企业如何通过内容营销这把“金钥匙”,打开客户的心门,同时塑造出独特的品牌魅力。别紧张,这其实就是一场精彩的交流盛宴,让我们一起探索其中的奥秘吧! 一、内容营销:真诚对话的开始 想象…

OAuth 2.0 授权流程详解与 FastAPI 实现

在现代网络应用中,OAuth 2.0 已成为授权和认证的标准协议。它允许用户将访问权限授予第三方应用,而无需暴露自己的用户名和密码。本文将详细介绍 OAuth 2.0 的常见授权流程,并展示如何在 FastAPI 中实现这些流程。 OAuth 2.0 简介 OAuth 2…

数字化转型不是终点,数字技术服务平台如何陪伴企业持续进化?

数字化转型确实不是终点,而是一个持续的过程,它要求企业不断适应变化、优化流程、创新业务模式。数字技术服务平台在陪伴企业持续进化方面扮演着至关重要的角色,具体体现在以下几个方面: 灵活性与可扩展性:数字技术服…

误删文件后的数据救赎实战恢复指南

误删文件的痛与思 在数字化时代,数据已成为我们生活与工作中不可或缺的一部分。无论是个人用户保存的家庭照片、工作文档,还是企业用户存储的财务数据、客户资料,都承载着无法估量的价值。然而,误删文件这一简单却致命的操作&…

【数组与广义表】(基本概念与思路)

1.数组的定义及特点 数组:按一定格式排列起来的,具有相同类型的数据元素的集合。 1.1一维数组 若线性表中的数据元素为非结构的简单元素,则称为一维数组。一维数组的逻辑结构:线性结构,定长的线性表声明格式:数据类型 变量名称…

仪表板展示丨DataEase看中国:中国月饼行业消费趋势报告

中秋节是中国最重要的传统节日之一,月饼是具有浓厚节日特色的传统美食。近年来,月饼市场呈现出诸多新趋势和消费特点。在本文中,我们使用DataEase开源BI工具(http://github.com/dataease)对中国月饼行业的消费趋势进行…

敏捷开发方法例题

答案:B 敏捷方法 特点 极限编程XP 4大价值观,5大原则,12个最佳实践 水晶法 认为每一个不同的项目都需要一套不同的策略,约定和方法论,认为人对软件质量有重要影响,因此随着项目质量和开发人员须知的提…

洛谷 P7391 「TOCO Round 1」自适应 PVZ

原题链接t 题目来源于:洛谷 题目本质:贪心,排序,平衡树 题目思路:把僵尸出现时刻和走进房子时刻想成左端点和右端点,按照右端点从小到大排序。第二对于同样可以使用的豌豆射手,我们一定选择上…

在 HKCR 新增项和值

; 1. Win11 HKCR 根键默认是 System 所有, Win10 HKCR 根键默认是 Administrators 所有。 ; 2. 以 System、管理员 还是 普通用户 登录系统? ; 在注册表里,操作 HKCR 行为与以上两项无关,都统一如下: ; 项 查权限所有者 当…

QT5实现https的post请求(QNetworkAccessManager、QNetworkRequest和QNetworkReply)

QT5实现https的post请求 前言一、一定要有sslErrors处理1、问题经过2、代码示例 二、要利用抓包工具1、问题经过2、wireshark的使用3、利用wireshark查看服务器地址4、利用wireshark查看自己构建的请求报文 三、返回数据只能读一次1、问题描述2、部分代码 总结 前言 QNetworkA…

单片机-STM32 看门狗(八)

目录 一、看门狗概念 1、定义: 二、单片机中的看门狗 1、功能描述: 2、看门狗设置部分 预分频寄存器(IWDG_PR) 3、窗口看门狗 特性: 4、看门狗配置: 一、看门狗概念 看门狗--定时器(不属于基本定时器、通用定…

HTTP 协议和 APACHE 服务

WEB 服务基础 Internet 因特网 因特网是 Internet 的中文译名 在 20 世纪 60 年代(冷战时期),美国国防部高等研究计划署(ARPA)出于军事上的目的,建立了 ARPA 网络,该网络由四个分布在不同地方…

FreeRTOS基础入门——FreeRTOS互斥信号量(十六)

个人名片: 🎓作者简介:嵌入式领域优质创作者🌐个人主页:妄北y 📞个人QQ:2061314755 💌个人邮箱:[mailto:2061314755qq.com] 📱个人微信:Vir2025WB…

本地部署Llama 3.1大模型

Meta推出的Llama 3.1系列包括80亿、700亿、4050亿参数版本,上下文长度扩展至12.8万tokens,并增加了对八种语言的支持。 部署模型需要用到Ollama的一个工具,访问官方网站https://ollama.com 点击下载,选择下载你对应的操作系统下…

opencv图像透视处理

引言 在图像处理与计算机视觉领域,透视变换(Perspective Transformation)是一种重要的图像校正技术,它允许我们根据图像中已知的四个点(通常是矩形的四个角)和目标位置的四个点,将图像从一个视…

2024.9.10 作业

代码&#xff1a; /*******************************************/ 文件名&#xff1a;widget.h /*******************************************/ #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QLabel> #include <QTimeEdit> #includ…