​AVS3支持下的8K内容生产和传输应用实践

news2024/12/22 9:58:41

AVS标准经过20年发展,到AVS3这一代实现了国产标准从跟跑到领跑的突破。博雅睿视团队深度参与AVS3标准制定,开发的8K AVS3实时、离线编解码设备有力支持了我国8K超高清视频产业的落地和推广。

本次分享将会分为三个部分,第一部分重点介绍AVS标准的发展历程以及AVS3标准的现状和最新进展;第二部分重点介绍8K直播、点播、内容生产整条链路当中的一些关键技术、挑战和我们的一些落地思路与实践经验;第三部分分享一下未来几年博雅睿视在8K超高清领域重点关注的技术和市场方向以及AVS生态建设方面的计划和思考。

文/韩巍

编辑/LiveVideoStack

大家好,我今天分享的题目是:AVS3支持下的8K内容生产和传输应用实践。众所周知,目前国内8K产业缺乏内容、缺做内容的人去丰富内容。于是我们做了8K的超分、增强,从而弥补内容的缺失。

我是来自博雅睿视的韩巍。博雅睿视是北京大学视频与视觉国家工程研究中心孵化的一个技术成果转化公司,主要致力于我国的视频编解码标准、AVS的产业化和国际化。AVS标准在高文院士的带领下做了20年,共三代四个标准,并且都成为国标、行标,其中AVS2是军标,在IEEE是国际标准。同时在今年7月,AVS3成为了欧洲DVB在超高清领域的推荐标准。

使用MPEG-2、H.264、H.265会面临高昂的专利费问题,因此出于国家战略和产业安全的需要,从2002年就开始推动我国自主知识产权的视频编解码标准的建设。 

今天的内容分为三个部分:

ce313c3ed5609c0ed2f3924bc151760a.png

-01-

AVS标准发展历程及AVS3最新进展

首先介绍AVS标准的发展历程及AVS3最新进展。

d939a1c793588821a3d3c0154c7cbeda.png

我国自2001年加入WTO以后成为了全球最大的DVD出口国,但是很多DVD在出海上岸的时候会由于使用了MPEG-2、H.264等视频编码标准被收取高昂的专利费。

香山会议是科技部和中科院每年在香山举办的关于中国重大科技发展的会议。在2002年3月的香山会议中,工信部针对DVD事件提出必须要做一个我国自己的视频编码标准,从而抗衡美国的MPEG-2和H.264。

944981b662305f20f1b7c9201de2d947.png

AVS标准是依据美国的MPEG-2和H.264提出的。最早的是MPEG-2,由日本的索尼、美国贝尔实验室、哥伦比亚大学、飞利浦等联合提出,这个编解码标准推动了全球音视频的基本发展。之后韩国、德国在90年代后期对该领域大量投入关键技术研发,产生了264这代标准。

DVD事件推动了香山会议之后,陆续又发生了MP3出口专利事件、机顶盒专利事件和数字电视标准事件。例如,全球的电视机面板出口我国占70%,如果瞄准厂家收专利费,HEVC至少有三个专利池,每个专利池至少收1.5美金,这对我们产业来讲是非常大的一个威胁。

整个与标准相关的产业市场从2002年到2006年大概5,000亿,到2008年有9,000亿,到2018年以后是万亿以上。如果我国能有自己的标准甚至出口,这将是一个巨大的产业。因此,建立我国自己的标准既是为了保证我国战略国家产业的安全,也是为了能把我国的标准、产业推出去从而获得利润,这是非常有意义的事情。 

8ad0d491ff7c07a2c2eda54a69beaf5a.png

AVS标准在AVS工作组成立的时候就有一个非常好的设计。前因是,MPEG组织现在已经散了,其中的公司太多导致没有统一的意见。他们专利费的收取是H系列标准在推广过程中产生很大阻力的一个原因。

因此我们在设计的时候,一开始就由AVS工作组制作标准,参与制作标准的包括了很多高校,例如北大、浙大、中科院计算所,以及产业,例如海康、字节、阿里、腾讯、咪咕等。

另外,成立AVS专利池委员会,各个组织加入我们贡献专利的时候,必须通过签署协议统一收费标准且用一个专利池收费。目前承诺整个产业链上只收一次费,只收终端芯片,一次只收1元人民币。这相比H.265更加规则和低廉,有助于整个生态在国际上推广。

同时成立了AVS产业联盟,包括了国内将近200家的科研院所和企业,共同推动整个标准的落地和产业化,这是非常大的一个优势。 

36b5fc9002610bfaadce5b15b2e9b20f.png

AVS是怎么炼成的呢?2002年8月在北京举行第一次会议,成立AVS;在2003年12月的第七次会议上制定完成AVS1的标准;后来央视要把AVS作为广电强制标准的时候,我们做了一版AVS+,AVS+对标264的压缩效率;2012年9月在桂林的第42次会议上启动AVS2,对标265;2015年,第五十五次会议时AVS2发布,AVS2和H.265压缩效率相当,但时间上晚了好几年。后来AVS2是广电的强标、国标,也进到了军标,另外AVS2也进入到了IEEE,是国际标准。

2018年启动AVS3的制定,面向8K,这类似于现在做5G和锂电池一样。以前一直是跟跑和追赶,我们希望这次能在266标准推出之前做出来,因此在十几个月以后的2019年1月,AVS3制定完成,共审议技术提案约6000项,输出文档2000多项。

2019年3月,AVS3标准发布。我们实验室是和海思、广科院共建,于是同年9月,在荷兰IBC发布第一颗解码芯片Hi3796CV300。至此,我们从标准到产业都打开局面,赶在了266之前。

虽然我们在4K高清以下的领域并不占优,但在超高清领域,我们第一次站在了美国标准之前。这也和我国的战略安全有关,全球的面板出口量我国占比达50%-70%,这种高功耗、劳动密集型产业一定不是长久之计,将来可能会转移向越南、印度等劳动力成本更低的国家。如果不顺势开发产业链,那么好不容易积累起来的技术优势就会荡然无存。

ab3b8cdb3444e31adec32ef6f7c6666f.png如图所示,AVS支撑了国内高清频道等重大应用

图中是AVS3标准制定的过程和一些关键成果,以及部分主要成员在封闭开发时期的合影,包括高文院士,马思伟教授等。

c3211a28e470821222b56fa75707d73b.png

AVS3从技术标准制定到芯片面市用时18个月,集合多方力量,制定了技术标准、芯片终端和系统应用,形成完整的生态和应用体系。

2bc19079840ccea577d6537797a515c0.png

AVS3是面向8K的,所以压缩效率要够。图为30年间视频编码领域的压缩效率演变。

e7a8f904268ce2e2113d8cc8b2802659.png

AVS3和HEVC/H.265相比,超高清视频压缩性能YUV综合提升超过36%。

20c16cf2175b73611127ef2a1a711f4a.png

融合智能编码后,在同等条件下,压缩性能再度提升超过44%。和VVC/H.266相比,提升超过8%。

20c6071670f9e71e2edc01846b019fc8.png图为AVS标准国际化的进展

中国音视频产业从技术落后到快速发展,以北大为代表的一批学术科研力量带动了中国音视频的发展,大量软硬件人才纷纷投入对于音视频产业发展的热忱。

724d5a59c0bfeea2effee51deb2d338c.png

学术突破带动了企业兴起。除了AVS之外,可以看到在H.266/VVC提案单位中,中国面孔占50%以上,迸发出了蓬勃的力量。

-02-

AVS3支持下的8K应用实践

caa19bf6237176aa8a1d5de73c50697c.png

针对于超高清视频产业的发展,各国都有制定相应的规划,以应对产业竞争,抢占制高点。

0e5969fa99c595710e1452baecaaf194.png

e5cd9d281a9a5cf478dd796c5492ce83.png图为AVS3标准制定后,在8K超高清视频产业所做的一些案例

6682284b76702b1ea88b742d31c12754.png

在AVS支持首次8K冬奥直播时,博雅睿视支持解决了8K AVS3编码码率控制问题,其CPU+GPU方案帮助歌华王城8K转播服务,并完成电影博物馆冬奥开幕式8K解码转播任务。

6b2aa665462d9eabf4c6915938fbde67.png

博雅睿视研发的基于x86架构的AVS全系列实时编解码系统,支持了央视冬奥会的超高清直播转播。 

59f3ee4aaa10ccf69a1a9768098ebceb.png

217a903319d72f5c9b77d36c27b7c150.png

2021年5月,工信部联合广电总局、央视等单位,组织开展“百城千屏”8K超高清视频落地推广活动,AVS3为其提供助力。

363a8129d18e0e327d45c5ae4ff5b360.png

图为8K大屏的逻辑架构图。依广电总局要求,户外大屏必须考虑信息发布安全要求,信号不能以直播方式播放。图文等信息都会以加密文件形式下发,前端信源通过素材管理,再信息发布到大屏。

9b0d59057028372e7d96d0a3fb28d43c.png

如图所示,高清视频文件经过存储系统,到超分离线转码,给到信息发布系统。直播信号会经过IP矩阵,调度到8K转码收录系统,再进入信息发布系统。信息发布系统的内容通过IP专线传输至大屏端的8K接收解码器,进行控制播放。

另外,8K大屏的信号会进行一路降分辨率转码,通过回传编码器,做特征提取,以防止播放内容被篡改。

8cbd787bf07a9effa91b7ebf9d2b4fd6.png

大量设备集中在播控中心,实现信息发布、信号调度、内容及信源监控、内容收录、8K内容生产和智能AI审核等功能。

9f95e4824886e2ef92ce79cf6962bf03.png图为8K超高清直播遇到的一些难题和对应的解决方案

070f2c2dae6485a22fad17d5cbdd900f.png

GPU适合并行运算,但熵解码是线性的,放在CPU中比较合适。其他的可以在GPU中并行,例如反变换、帧间预测、Deblock、SAO、ALF等,利用GPU多核并行。最后把重构信息异步拷贝至CPU。

dcbe29cb8527f5841430914242fb0cd8.png图为AVS3 8K实时编码器的两种服务器方案

cf383b3564a3e23649275b434a0d6bee.pngAVS3 8K实时解码器的三种方案及配置

-03-

未来几年技术演进和生态建设的思路

8b3945f77a86c0f4c570ee4990053bc2.png

传统编码的难题,现有框架下编码工具的提炼成本越来越高,而单项技术平均压缩效率提升从90年代的20%降为如今的不足1%。

如图中有图所示,AVS3和VVC分别使用36项和34项工具,而其中超过1%的分别只有7项和8项。 

e292e6781ca74f72abfc5425de4ddb27.png

但视频编码需求依然旺盛。8K内容原始数据量60Gbps,压缩码率希望是100Mbps以下,如何解决?

沉浸交互式视频有多个维度的数据,如分辨率、位宽、帧率、立体、压缩比等。传统编码对智能分析处理的支撑不足。

以上需求,都表示我们需要更高效更智能的编码方法。 

4aa6351b8a1bc6ad63b84e2eaa5d1c47.png

全神经网络编码可能是一个探索的方向。对未来编码器的需求有几个方向:

1.直接依据视觉失真优化编码码率;2.简化编解码开发;

3.计算高度并行;4.能在已部署硬件上高效运行;5.可下载更新。

4381b7a96d89678c278978500f825ff0.png

AVS3的第二个阶段正是朝着这个方向在发展。融合AI技术,目前AVS3性能超过VVC 7%,未来目标是比其提升20%。 

3efe180bbad61537cf1e5eb57a38a0d9.png

整体来讲,智能编码会随着数据丰富度、算力提升向前发展。智能编码的未来趋向是为智能媒体应用定义相应的数据格式,提供更高效的数据接口。

03ed2fa64da6ee77bd8ba4b4335378e6.png

AVS3从技术上可对标H.266,时间上还早一些,但为什么生态没有做起来?在一些低延时、低功耗场景,没有芯片结合就较难有深入的发展和探索。目前的计划是四年发布3颗AVS3编解码芯片。

78587555907350d91dc4c64cae857808.png图为AVS3生态建设计划

以上就是我的分享,谢谢!


dbc4673f5ee47a51555f2cdc25beafd3.png

扫描图中二维码或点击“阅读原文 

查看更多LiveVideoStackCon 2023上海站精彩话题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/674983.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MusicGen配乐工具开源,教你怎么给抖音短视频配乐,助你涨粉1000!

大家好,我是千与千寻,好久不见了,很多粉丝私信我说,千寻哥这是去哪了?难道被野外捕捉了。 哈哈哈,当然不是了,千寻依然在学习ChatGPT的道路上和大家一起学习,一起搞钱! 但…

TC8:TCP_MSS_OPTIONS_05-09

TCP_MSS_OPTIONS_05: Illegal option length for MSS in a SYN-ACK segment 目的 TCP能够处理SYN+ACK报文段中MSS选项的长度非法,而不会崩溃 可以正常地响应,就是不崩溃,这里指的应该是DUT发送ACK 测试步骤 Tester:让DUT侧的应用程序发起主动open调用DUT:发送SYNTester:…

C++类和对象--构造函数和析构函数

0.前言 在我们写某些需要动态开辟内存空间的函数时候,会经常忘记初始化、销毁,而且有时候程序返回的情况很多,那么销毁函数写起来就会很繁琐,那么有没有什么办法解决这个问题呢?答案是:当然有!在…

Java类 继承

Java是一种面向对象的编程语言,类是Java中最基本的编程单元。一个类可以包含变量、方法和构造函数等。类的定义需要使用关键字class,例如: public class Person { private String name; private int age; public Person(St…

文心一言 VS 讯飞星火 VS chatgpt (44)-- 算法导论6.1 1题

一、在高度为h的堆中,元素个数最多和最少分别是多少? 文心一言: 在高度为 h 的二叉搜索树(BST)中,元素个数最多和最少的情况分别如下: 1.最多情况:当每个节点都包含两个子节点时&#xff0c…

CSS3-盒子模型-边距问题

1 清除默认内外边距 场景:浏览器会默认给部分标签设置默认的margin和padding,但一般在项目开始前需要先清除这些标签默认的margin和padding,后续自己设置 比如:body标签默认有margin:8px、p标签默…

一句提示词生成整个代码库——Gpt Engineer神级项目开源(附演示视频)

近日,一个名为Gpt Engineer神级项目开源,并迅速火爆全网。 短短几天内,该项目已经得到了25K的星星。 使用GPT-engineer进行人工智能软件开发,可以改变软件开发的未来。 在软件开发领域,一场巨大的革命正在开始。这一转…

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(6月 22 日论文合集)

文章目录 一、检测相关(9篇)1.1 Wildfire Detection Via Transfer Learning: A Survey1.2 Polygon Detection for Room Layout Estimation using Heterogeneous Graphs and Wireframes1.3 Exploiting Multimodal Synthetic Data for Egocentric Human-Object Interaction Detec…

前端中的相关概念

谁道人生无再少, 门前流水尚能西。 桃花落尽胭脂透, 庭院无声五更鸡。 —— 杜甫《端午节》 HTML中class属性 HTML中class属性是一种用于为元素定义样式和标识的属性,以下是class属性的几种常见用法实例,包括标识元素、定义样…

利用OpenCV计算条形物体的长度

0、前言 在图像处理中,我们可能会遇到求一个线条长度的场景,比如,现在有一条裂缝,需要求其长度,或者有一个长条形的零件需要知道其长度。 本文利用OpenCV和skimage两个库,提供了一个解决方案。 1、解决步…

贪心法与动态规划的对比分析

高级算法设计课程论文 题 目:贪心法与动态规划的对比分析 作者姓名: 作者学号: 专业班级: 提交时间: 2023/6/3 目 录 1 引言 1 2 分析过程 2 2.1多段图的最短路径问题 2 2.2最小生成树问题 4 3动态规划与贪心法的对…

【动态规划算法练习】day3

文章目录 一、931. 下降路径最小和1.题目简介2.解题思路3.代码4.运行结果 二、64. 最小路径和1.题目简介2.解题思路3.代码4.运行结果 三、面试题 17.16. 按摩师1.题目简介2.解题思路3.代码4.运行结果 总结 一、931. 下降路径最小和 1.题目简介 931. 下降路径最小和 题目描述&…

浅析 GeoServer CVE-2023-25157 SQL注入

原创稿件征集 邮箱:eduantvsion.com QQ:3200599554 黑客与极客相关,互联网安全领域里 的热点话题 漏洞、技术相关的调查或分析 稿件通过并发布还能收获 200-800元不等的稿酬 更多详情,点我查看! 简介 GeoServer是一个开…

十八、网络基础(一)

一、协议 (一)前置 协议其实是一种约定!!! 计算机之间的传输媒介是光信号和电信号 , 通过 " 频率 " 和 " 强弱 " 来表示 0 和 1 这样的信息 , 要想传递各种不同的信息 , 就需要约定好双方的数据…

(自己动手开发自己的语言练手级应用)JSON(JavaScript Object Notation) 产生式(BNF)

写自己的开发语言时&#xff0c;很多人都会拿JSON当第一个练习对象 开源net json FJSON 解析工具https://dbrwe.blog.csdn.net/article/details/107611540?spm1001.2014.3001.5502 <json> :: <object> | <array> <object> :: "{" [ <me…

分布式学习第三天 nginx学习

目录 1. 一些基本概念 1.1 Nginx初步认识 1.2 正向/反向代理 1.3 域名和IP 2. Nginx 安装和配置 2.1 安装 2.2 配置 3. Nginx的使用 3.1 部署静态网页 3.2 反向代理和负载均衡 课外知识导读 1. URL和URI 2. DNS解析过程 复习 1. 一些基本概念 1.1 Nginx初步认识…

团体程序设计天梯赛-练习集L1篇②

&#x1f680;欢迎来到本文&#x1f680; &#x1f349;个人简介&#xff1a;Hello大家好呀&#xff0c;我是陈童学&#xff0c;一个与你一样正在慢慢前行的普通人。 &#x1f3c0;个人主页&#xff1a;陈童学哦CSDN &#x1f4a1;所属专栏&#xff1a;PTA &#x1f381;希望各…

在我掉入计算机的大坑并深陷其中时,一门名为“C语言”的编程语言让我沉迷

各位CSDN的uu们你们好呀&#xff0c;小雅兰好久没有更新博客啦&#xff0c;今天来小试牛刀&#xff01;&#xff01;&#xff01; 上一篇博客小雅兰是说自己原本是自动化专业的学生&#xff0c;但是因为一次偶然的机会对计算机的相关知识产生了浓厚的兴趣。那么&#xff0c;小雅…

Linux Ubuntu man文档的图文安装教程

文章目录 前言man文档的起源man文档的安装man文档的使用总结 前言 当提及"man文档"时&#xff0c;通常是指Unix和类Unix系统中的手册页&#xff08;man page&#xff09;&#xff0c;因为Linux是在Unix的基础上发展而来的操作系统&#xff0c;所以我们的Linux也有ma…

操作系统 - 内存管理

✅作者简介&#xff1a;人工智能专业本科在读&#xff0c;喜欢计算机与编程&#xff0c;写博客记录自己的学习历程。 &#x1f34e;个人主页&#xff1a;小嗷犬的个人主页 &#x1f34a;个人网站&#xff1a;小嗷犬的技术小站 &#x1f96d;个人信条&#xff1a;为天地立心&…