AV1 Bitstream Decoding Process Specification--[1]:术语和定义

news2025/1/18 8:53:38
  • 原文地址:https://aomediacodec.github.io/av1-spec/av1-spec.pdf
  • 没有梯子的下载地址:AV1 Bitstream & Decoding Process Specification
  • 摘要:这份文档定义了开放媒体联盟(Alliance for Open Media)AV1视频编解码器的比特流格式和解码过程。
  • 规范:此文档规定了开放媒体联盟(Alliance for Open Media)AV1比特流格式和解码过程。

术语和定义

对于本文档的目的,以下术语和定义适用:

  1. AC coefficient :AC 系数,在至少一个维度上频率索引非零的任何变换系数。
  2. Altref:替代参考帧, 在帧间编码中可以使用的帧。
  3. Base layer:基础层,即spatial_id 和 temporal_id 的值为 0 的层。
  4. Bitstream:比特流,即编码一系列帧生成的比特序列。
  5. Bit string:比特字符串,有限数量的比特的有序字符串。最左边的比特是最显著比特(MSB),最右边的比特是最不显著比特(LSB)。
  6. Block:块,样本的正方形或矩形区域。
  7. Block scan:块扫描,量化系数的特定序列排序。
  8. Byte:字节,8 比特的比特字符串。
  9. Byte alignment:字节对齐,如果比特的位置是从比特流中第一个比特的位置开始的八的整数倍,则该比特是字节对齐的。
  10. CDEF:约束方向增强滤波器,设计用于根据识别方向自适应地过滤块的滤波器。
  11. CDF:累积分布函数,表示符号值小于或等于给定水平的概率乘以 32768 的函数。
  12. Chroma:色度,一个色度样本值矩阵或其中一个色度差分信号的单个样本值。注意:色度的符号是 U 和 V。
  13. Coded frame:编码帧,解码过程之前一帧的表示形式。
  14. Component:分量,三个样本值矩阵中的一个(一个亮度矩阵和两个色度矩阵)或其单个样本值。
  15. Compound prediction:复合预测,一种帧间预测,通过混合两个参考帧的预测来计算样本值(混合的帧可以是相同的或不同的)。
  16. DC coefficient:DC 系数,在两个维度上频率索引都为零的变换系数。
  17. Decoded frame:解码帧,解码器从比特流重构出的帧。
  18. Decoder:解码器,解码过程的一个实现。
  19. Decoding process:解码过程,从语法元素推导出解码帧的过程,包括在使用电影颗粒合成过程之前和过程中使用的任何处理步骤。
  20. Dequantization:去量化,通过缩放量化系数来获得变换系数的过程。
  21. Encoder:编码器,编码过程的一个实现。
  22. Encoding process,编码过程,本规范中未指定的过程,它生成符合本文档描述的比特流。
  23. Enhancement layer:增强层,spatial_id 和 temporal_id 的值大于 0 的层。
  24. Flag:标志,二进制变量 - 一些变量和语法元素(例如 obu_extension_flag)使用“标志”一词来描述,以突出语法元素只能等于 0 或 1。
  25. Frame:帧,视频信号在空间域的表示,由一个亮度样本矩阵(Y)和两个色度样本矩阵(U 和 V)组成。
  26. Frame context:帧上下文,解码过程中使用的一组概率。
  27. Golden frame:黄金帧,可以在帧间编码中使用的帧。通常黄金帧以更高的质量编码,并用作多个帧间帧的参考。
  28. Inter coding:帧间编码,使用帧间预测来编码一个块或帧。
  29. Inter prediction:帧间预测,使用之前解码的帧推导出当前帧的预测值的过程。
  30. Intra coding:帧内编码,使用帧内预测来编码一个块或帧。
  31. Intra frame:帧内帧,仅使用帧内预测压缩的帧,可以独立解码。
  32. Intra prediction:帧内预测,使用同一已解码帧中先前解码的样本值推导出当前样本的预测值的过程。
  33. Inverse transform:逆变换,将变换系数矩阵转换为空间样本值矩阵的过程。
  34. Key frame:关键帧,一种帧内帧,当显示时会重置解码过程。
  35. Layer:层,一组具有相同spatial_id和相同 temporal_id 值的 tile group OBUs。
  36. Level:级别,对语法元素和变量值的一组定义的约束。
  37. Loop filter:环路滤波,应用于重建的滤波过程,旨在减少块边缘的可见性。
  38. Luma:亮度,代表与主要颜色相关的单色信号的样本值矩阵或单个样本值。注意:表示亮度的符号是 Y。
  39. Mode info:模式信息,在解码过程中包含有关如何预测块的指示的语法元素。
  40. Mode info block:模式信息块,一个 4x4 或更大尺寸的亮度样本值块及其对应的两个色度样本值块(如果存在)。
  41. Motion vector:运动矢量,用于帧间预测的二维矢量,将当前帧指向参考帧,其值提供了从当前帧中的位置到参考帧中位置的坐标偏移。
  42. OBU:开发比特流单元,所有结构都打包在“开放比特流单元”或 OBUs 中。每个 OBU 都有一个头部,提供包含数据(有效载荷)的识别信息。
  43. Parse:解析,从比特流中获取语法元素的过程。
  44. Prediction:预测,包括帧间或帧内预测的预测过程的实现。
  45. Prediction process:预测过程,使用预测器估算已解码样本值或数据元素的过程。
  46. Prediction value:预测值,在下一个样本值或数据元素的解码过程中使用的值,它是先前解码的样本值或数据元素的组合。
  47. Profile:配置文件,在规范部分中定义的语法、语义和算法的子集。
  48. Quantization parameter:量化参数,用于在解码过程中缩放量化系数的变量。
  49. Quantized coefficient:量化系数,去量化前的变换系数。
  50. Raster scan:光栅扫描,将二维矩形光栅映射到一维光栅,一维光栅的条目从二维光栅的第一行开始,然后扫描第二行、第三行等。每一行光栅都按从左到右的顺序扫描。
  51. Reconstruction:重建,获得已解码残差和相应预测值的加和。
  52. Reference:参考,一组标签中的一个,每个标签都映射到一个参考帧。参考帧是存储先前解码帧和相关信息的区域。
  53. Reserved:保留,一个特殊的语法元素值,将来可能会用于扩展本部分。
  54. Residual:残差,重建样本与相应预测值之间的差异。
  55. Sample:样本,构成帧的基本元素。
  56. Sample value:样本值,样本的值。对于 8 位帧,这是一个从 0 到 255(含)的整数;对于 10 位帧,这是一个从 0 到 1023(含)的整数;对于 12 位帧,这是一个从 0 到 4095(含)的整数。
  57. Segmentation map:分割图,一个 3 位数字,包含图像中每个 4x4 块的段归属。每个参考帧都存储一个分割图,允许新帧使用先前编码的图。
  58. Sequence:序列,编码比特流的最高级语法结构,包括一个或多个连续的编码帧。
  59. Superblock:超块,一个 tile 内块四叉树的最高级别。所有超块在帧内大小相同,并且是正方形。超块可以是 128x128 亮度样本或 64x64 亮度样本。一个超块可能包含 1 个或 2 个或 4 个模式信息块,或者可以在每个方向上分割成 4 个子块,这些子块可以进一步细分,形成块四叉树。
  60. Switch Frame:切换帧,可以用作序列之间切换点的帧。切换帧覆盖所有参考帧,而不强制使用帧内编码。目的是允许在流媒体使用案例中,视频可以以小块(比如1 秒时长)编码,每个块都以切换帧开始。如果可用带宽下降,服务器可以开始发送较低比特率编码的块。当这种情况发生时,帧间预测使用现有的较高质量参考帧来解码切换帧。这种方法允许在不产生完整关键帧成本的情况下切换比特率。
  61. Syntax element:语法元素,比特流中表示的数据元素。
  62. Temporal delimiter OBU:时间分割符OBU,表明随后的 OBUs 将与时间分隔符之前的上一帧有不同的表示/解码时间戳。
  63. Temporal unit:时间单元,时间单元由与特定、不同时间点相关联的所有 OBUs 组成。它由一个时间分隔符 OBU 和所有随后的 OBUs 组成,直到但不包括下一个时间分隔符。
  64. Temporal group:时间组,一组定期在视频序列中使用其时间预测结构的帧。
  65. Tile:瓦片,可以独立编码和解码的帧的矩形区域,尽管跨瓦片边缘仍然应用环路滤波。
  66. Transform block:变换块,用作逆变换过程输入的矩形变换系数矩阵。
  67. Transform coefficient:变换系数,在变换块中包含的标量值,被认为是在频率域中的值。
  68. Uncompressed header:未压缩的头部,要解码的帧的高级描述,编码时未使用算术编码。

原文

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2132593.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

浅谈C++入门(1)

​ 🌹个人主页🌹:喜欢草莓熊的bear 🌹专栏🌹:C入门 目录 前言 一、C的第一个程序 二、 命名空间 2.1 namespace的价值 2.2 namesapce的定义(这里一些东西以记住加理解为主) 2.…

国产服务器CPU发展分析

CPU行业概览:信创带动服务器CPU国产化 目前CPU行业由两大生态体系主导:一是基于X86指令系统和Windows操作系统的Wintel体系,主要用于服务器与电脑等;二是基于ARM指令系统和Android操作系统的AA体系,主要用于移动设备…

数据结构加餐:三路划分、自省排序、文件归并排序

数据结构加餐1 1.快排之三路划分2.快排之自省排序3.文件归并排序3.1外排序3.2归并排序的实现3.2.1归并排序思想3.2.2文件归并排序代码实现 1.快排之三路划分 在之前完成的快排仍然存在这一些问题,当重复数据较多时,快速排序选择的基值也会较不恰当&#…

SaaS化多租户实现的两种方法

SaaS化多租户实现的两种方法 SaaS系统的定义 SaaS,全称为Software-as-a-Service(软件即服务),是一种基于云计算的软件交付模式。而SaaS系统,即是通过这种模式提供给用户的软件系统。即多租户系统,每个租户…

MySQL 日志篇:Redo 文件和自适应检查点

MySQL 的 InnoDB 存储引擎使用 Redo Log 记录事务对数据的更改,以便在系统崩溃恢复时能够重做这些更改,从而保证事务的持久性。对于产生的 Redo Log,InnoDB 存储引擎首先将其写入内存中的 Log Buffer,随后再将 Log Buffer 中的 Re…

力扣337-打家劫舍 III(Java详细题解)

题目链接:337. 打家劫舍 III - 力扣(LeetCode) 前情提要: 本体是打家劫舍的一个变形题,希望大家能先做198. 打家劫舍 - 力扣(LeetCode),并看一下我上题的讲解力扣198-打家劫舍&…

【刷题】Day 3--错误的集合

hello!又见面啦~~~ 一道习题,要长脑子了...... 【. - 力扣(LeetCode)】 【思路】 /*** Note: The returned array must be malloced, assume caller calls free().*/void Bubble_sort(int arr[], int size) {int temp;for (int i…

多速率信号处理-CIC滤波器

基本原理 级联积分梳状滤波器(Cascade Intergrator Comb)是多速率信号处理中一种十分高效的数字滤波器。CIC滤波器具有低通滤波器的特性,同时具有以下优势: 滤波器系数全为1,设计时不需要存储滤波器系数,…

拖放WORD文件朗读全文

把WORD拖放到tkinter的窗口,就可以朗读整改word文件的内容。 代码: # -*- coding: utf-8 -*- """ Created on Tue Sep 10 17:09:35 2024author: YBK """ import pyttsx3 import comtypes.client import os import tkint…

按包边(边框)尺寸分类异形创意圆形(饼/盘)LED显示屏有哪些种类

在LED显示屏技术日新月异的今天,异形创意圆形(饼/盘)LED显示屏凭借其独特的形态设计与广泛的应用场景,成为了商业展示、舞台表演、艺术装置以及户外广告等领域的宠儿。其中,按包边(边框)尺寸的不…

holynix靶机详解

靶机配置 加一个网络适配器(网卡) 修改MAC地址 00:0C:29:BC:05:DE 原来的网卡设置为桥接,随机生成MAC地址 重启靶机即可扫到靶机IP 主机探测与端口扫描 arp-scan -l 发现开放80端口 nmap -sV -A -T4 192.168.229.153 访问网站 http://1…

OpenAI O1:人工智能推理能力的新里程碑

引言 北京时间9月13日凌晨,OpenAI在没有任何预告的情况下,正式发布了其首款具有推理能力的模型——OpenAI O1。这一模型的发布,不仅标志着人工智能能力的新水平,也预示着AI技术发展的新范式。本文将详细解析OpenAI O1模型的技术特…

【计网】数据链路层:概述之位置|地位|链路|数据链路|帧

✨ Blog’s 主页: 白乐天_ξ( ✿>◡❛) 🌈 个人Motto:他强任他强,清风拂山岗! 💫 欢迎来到我的学习笔记! ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩ 1. 在OSI体系结构中的位置 1. 位置:数…

每日一练:K个一组翻转链表

25. K 个一组翻转链表 - 力扣(LeetCode) 一、题目要求 给你链表的头节点 head ,每 k 个节点一组进行翻转,请你返回修改后的链表。 k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍&#x…

时间复杂度计算 递归

我们先拿出 2021 csp-s 程序题中一道看着就头大的程序题,要求分析 solve1 的复杂度。 设 T(n) ⁡ \operatorname{T(n)} T(n) 表示数组长度为 n n n 时的复杂度(即 m − h 1 n m-h1n m−h1n)。 T ( 1 ) 1 T(1)1 T(1)1,根据…

计算机毕业设计 酷听音乐系统的设计与实现 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试

🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点…

【SQL】百题计划:SQL排序Order by的使用。

简述: 排序函数:Order by;升序 ASC;降序 DESC; 答案: Select distinct author_id as id from Views where author_id viewer_id order by id Asc;

关于华大/小华 HC32F460 在IAR环境中,无法启用FPU 硬件浮点运算单元的解决方案

需求:要使用浮点FFT功能,面开启M4的 FPU功能 问题:无法开启 FPU,如下图所示:此栏为灰色,无法选择 尝试强制增加 __ARMVFP__: 编译出错,无法内链FPU: 解决方案&#xff1…

[000-01-008].第05节:OpenFeign高级特性-日志打印功能

我的后端学习大纲 SpringCloud学习大纲 1、日志打印功能: 1.Feign 提供了日志打印功能,我们可以通过配置来调整日志级别,从而了解 Feign 中 Http 请求的细节,说白了就是对Feign接口的调用情况进行监控和输出 2、日志级别: NONE&…

vue3【实战-组件封装】图文卡片

效果预览 技术要点 图片宽高比固定为 16:9,展示方式为 object-fit: cover通过 v-bind 实现父组件向子组件的批量传参单行文本超长显示省略号 white-space: nowrap; overflow: hidden; text-overflow: ellipsis; title 属性实现鼠标悬浮显示文本完整内容 范例代码 …