多维评测指标解读第17届MSU世界编码器大赛全高清10bit赛道结果

news2024/11/19 12:39:37
超高清视频纤毫毕现的关键一环。

01 主要指标多项第一,带宽节省48%

近日,第17届MSU世界编码器大赛全高清10bit赛道成绩揭晓,阿里自研的H.266/VVC编码器Ali266在该赛道最高效的1fps档次上获得两项冠军,相较大赛基准编码器x265可节省48%的带宽,有效降低超高清视频门槛,推动其普及。

MSU世界编码器大赛是指由莫斯科国立大学(Lomonosov Moscow State University,MSU)主办的面向全球各大公司、学术机构、开源社区和个人的编码器比赛,从2005年起每年举办一次,至今已举办17届。

在过去的17届比赛中,参赛编码器总体数量不断攀升,使MSU世界编码器大赛成为视频编解码领域影响力最大的顶级权威赛事,吸引了如Google、Intel、Netflix等众多知名科技公司参赛,参赛编码器均有广泛实用性、代表了行业发展的风向标。

本届MSU大赛共有21款编码器参赛,并首次专门设立了10bit赛道。继获得16届全高清赛道8项冠军和主观赛道冠军后,Ali266参加了本届大赛10bit赛道压缩率最高的1fps速度档位,取得SSIM、PSNR两项指标第一

为了全面地测评参赛编码器在多项质量评价指标下的压缩性能,MSU比赛采用了PSNR、SSIM、VMAF等客观质量评价指标。

其中,SSIM指标从亮度、对比度和结构信息三个方面来估计失真图像的视觉质量,旨在比较原始视频和失真视频的结构相似度,研究感知结构的损伤来评估视频质量,可以更好地反映人眼主观特性,因此历来也是MSU主办方指定的主要评价指标。

具体来看,按YUV (6:1:1)-SSIM指标排名

第一名:阿里巴巴Ali266、腾讯Tencent266 v0.2.1和Tencent266 v0.2.2

上图中,纵坐标为参赛编码器,横坐标为相同的SSIM质量下,各编码器输出文件相对于参考编码器x265的平均大小。

柱状图越短,表示编码器输出的文件越小,压缩率越高,编码器性能越好。图中显示,在同等YUV (6:1:1)-SSIM画质下,Ali266比参考编码器x265节省了48%的文件大小。

按YUV (6:1:1)-PSNR (avg. MSE)指标排名

第一名:腾讯Tencent266 v0.2.1、阿里巴巴Ali266

图中显示,在同等YUV (6:1:1)-PSNR (avg. MSE)画质下,Ali266比参考编码器x265节省了43%的文件大小。

对全球众多编码器进行全面、公平、公正地测评并非易事。以本届10bit赛道测评为例,从2022年6月1日开始公开征集参赛编码器,到2023年9月25日发布评测结果,整整经历了约16个月的时间。

费时费力的背后,在于视频编码技术在多媒体信息传输和处理环节中的基础性、关键性作用。

02 4K、60帧、10bit,补齐全链路最后一环

数字视频实质上就是一帧帧连续的图像,虽然一帧图像的大小并不大,但一般情况下每秒至少得有24帧图像,它们累积起来就会占据非常大的空间。

而当前,视频超高清化趋势势不可挡,人们越来越享受视频高分辨率、高帧率、高比特深度带来的极致震撼体验。

以4K超高清视频为例,分辨率为3840×2160像素,帧率为60(即每秒有60幅图像),那么未经压缩的1秒视频的数据量超过119.4亿比特(3840×2160像素/帧×24bits/像素×60帧/秒)。

视频编码器可以去除原视频的冗余信息给视频“瘦身”。以暑期热映的《封神第一部:朝歌风云》举例,该电影片长148分钟,合8900秒。若选用4K、24帧/秒、10bit位深的最高清画质,全片数据量便超过7000GB。这么巨大的数据量,不经过压缩直接传输和存储几乎是无法实现的。

在保证画质的前提下,编码器可将原始视频的数据量压缩至几百分之一甚至几千分之一。

因此,视频编码技术使得视频的存储和播放成为可能。

据测算,利用广泛采用的上一代标准开源编码器x265 veryslow档位编码的《封神》4K全片文件大小约3GB,而采用Ali266 slow档位可比原方案节省流量1.8GB,码率节省高达64%。

毫无疑问,4K、60帧、10bit逐渐成为行业公认的超高清视频标准。本届MSU世界编码器大赛首次专门设立了10bit赛道。那么,10bit究竟能为我们的生活带来什么呢?

如果用最直观的说法去描述,10bit能够让色彩呈现出更加细腻的渐变变化,因为每一个颜色通道中的色彩级数由8bit的256级(目前绝大多数的显示设备都采用的是8bit)一下子提高到10bit的1024级,这意味着能够在色彩的渐进和变化方面表现出非凡的细腻度

如下表示的夕阳西下图,上半副图采用8bit位深表示,我们看到太阳由内到外的橘黄色过渡存在明显的“断层”现象,而下半副图采用10bit表示,色彩过渡非常自然。

该对比图片来源于网络

随着国家政策持续发力、市场需求不断增长,视频超高清产业正蓬勃发展。而超高清视频的高分辨率、高帧率、宽色域、宽动态范围等特征,必须与高位深相配合才能充分展示色彩细腻度和对比度,为消费者带来真正的视频临场体验感。因此,高位深是超高清视频不可或缺的重要特征和趋势之一。

若要真正享受到10bit色彩,光有屏幕支持10bit显示是远远不够的,而需要将视频的采集、处理、编码、存储或传输、解码、显示等全链路都以10bit进行处理。

由此可见,10bit编码和10bit解码是整个处理链路中必不可少的两个环节。在H.266/VVC以前的几代标准中,入门档次只支持8bit位深,10bit位深需要在更高的扩展档次才能支持,因此大部分编解码设备并不支持10bit位深视频。

而H.266/VVC在2017年10月发布技术征求书时,就将宽色域和宽动态范围视频(即HDR/WCG)作为主要面向的应用,因此,其入门档次(Main10 Profile)就支持10bit位深的编码标准,大大提高了对10bit位深视频的友好性,拉齐视频业界支持高位深的水准。

此次Ali266编码器在10bit赛道获奖,亦证明了Ali266完全具备10bit编码能力,补齐了全链路10bit的关键一环,符合视频超高清技术发展趋势,为消费者享受真实的视频临场体验提供了新的解决方案。

03 持续耕耘,Ali266的自我进化

Ali266是阿里巴巴达摩院对新一代国际视频标准H.266/VVC的编解码实现,具有高压缩性能、高清实时编码速度、完整的实时高清编解码能力等特点。Ali266编解码器的推出,更好地打开了H.266/VVC标准端到端的生态,为业界提供了新一代视频编解码解决方案。

编码端,Ali266通过实现多种编码算法提升编码质量,提高压缩效率,例如运动补偿时域滤波,自适应GOP大小决策,场景切换检测,屏幕内容检测、码率控制技术等。

另一方面,Ali266涵盖了上百种编码快速算法,配合多线程技术、汇编指令、内存访问效率等工程优化手段,以极小的压缩性能代价大幅提高编码速度。

解码端,Ali266自研的解码器架构、数据结构和内存可复用设计,通过多核并行、汇编优化、内存占用和访存效率优化等一系列工程和算法的优化手段来提高解码速度,可完美兼容Android、iOS、Linux、MacOS、Windows等多种平台。特别是对于集成Ali266解码器的中低端手机,也可清晰流畅地观看最新的H.266/VVC视频或直播,更好地满足了移动互联网时代的用户使用需求。

此外,Ali266充分考虑了商业化软件的需求,经过不同平台数千款高中低端设备的大规模检验,验证了Ali266解码器的鲁棒性、稳定性和可商用性。在MSU世界编码器大赛上连续获奖,标志着Ali266具备业界领先的软件编解码性能,展现其在视频超高清产业的应用潜力。

2022年1月,Ali266在优酷正式上线,优酷也成为当时业界首个H.266/VVC实用落地项目。据测算,自优酷稳定上线使用Ali266以来,在码率上,同等画面清晰度的情况下比原H.265/HEVC方案码率最高节省40%;在体验上,卡顿率降低50%,稳定性超过99.95%

为了充分释放视频编解码标准升级带来的技术红利,为业界提供更低成本、更高画质的视频解决方案,阿里云联合达摩院实现了Ali266对视频点播业务的全线支持。此举将进一步帮助客户大幅节省带宽成本,提升播放体验,解决视频观看体验和带宽流量间的矛盾。

阿里云视频点播支持H.266/VVC,主要包括两方面。一方面阿里云视频云支持将视频转码为H.266/VVC的视频流,并支持mp4、ts、hls等主流容器,方便H.266/VVC视频流存储、传输和分发。另一方面,阿里云播放器提供完美兼容H.266/VVC编码协议视频流的播放解决方案,让客户享受流畅清晰的播放体验。

更多编码效果展示,请点击:https://retina.aliyun.com/#/Ali266

未来,Ali266将紧扣10bit HDR、超高清4K~8K、高帧率60fps~120fps、自由视角等最新技术发展趋势,与音视频产业紧密结合,在点播、直播、RTC等场景不断探索新的商业应用可能,并与5G、人工智能、虚拟现实等技术深度融合,催生大量新场景、新应用、新模式,为观众带来更极致的视听体验和更创新的互动玩法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1124557.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VR全景平台应该具备哪些功能,怎样选择VR全景平台

引言: 虚拟现实(VR)技术在不断发展,为企业和消费者提供了全新的交互体验。VR全景平台是一个关键的组成部分,它必须具备一系列重要的功能来吸引用户、提供内容和实现商业成功。那么VR全景平台应该具备哪些功能&#xf…

Ubuntu22.04系统 Cgroup v2 切换成v1

使用v1导致docker容器启动失败 Failed to mount cgroup at /sys/fs/cgroup/systemd: Operation not permitted Issue #4072 lxc/lxc GitHub https://github.com/lxc/lxc/issues/4072 原因:ubuntu自21.04版本后的版本(不包含21.04)linux内…

DS200DCFBG1BLC IS220PAICH1A 构建人工智能能力背后的紧迫性

DS200DCFBG1BLC IS220PAICH1A 构建人工智能能力背后的紧迫性 2023年9月12日可安装文件系统全球云企业软件公司发布了第一批研究结果,研究技术在企业向服务化业务模式转变的过程中,在实现业务优势和推动价值方面所扮演的角色。该研究调查了美国、英国、…

【网络安全】网络安全基础必备技能

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

Speech | 语音中的风格迁移论文及总结[20231023更新版]

2018_Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-to-End Speech Synthesis 1.样式标记:端到端语音合成中的无监督样式建模、控制和传输 paper:Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-t…

OSPF的网络类型

1.3配置OSPF的网络类型 1.3.1实验3&#xff1a;配置P2P网络类型 实验需求 实现单区域OSPF的配置实现通过display命令查看OSPF的网络类型 实验拓扑 实验拓扑如图1-11所示 图1-11 配置P2P网络类型 实验步骤 步骤1&#xff1a;[1] 配置IP地址 路由器R1[2] 的配置 <Huawe…

基于SpringBoot的学生班级考勤管理系统

基于SpringBootVue的学生班级考勤管理系统的设计与实现~ 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringBootMyBatisVue工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 管理员界面 课程管理 班级管理 学生管理 学生界面 考勤管理 摘要 学生…

Deployments

Deployments 一个 Deployment 为 Pod 和 ReplicaSet 提供声明式的更新能力。 你负责描述 Deployment 中的目标状态&#xff0c;而 Deployment 控制器&#xff08;Controller&#xff09; 以受控速率更改实际状态&#xff0c; 使其变为期望状态。你可以定义 Deployment 以创建新…

项目快讯|深汕特别合作区气膜羽毛球馆正式开工

“永不坍塌”的气膜运动馆 “安全”是每个行业可持续发展的核心原则、是每个企业长久生存的重要底线、是每个人追求幸福生活的基本保障。 任何新行业、新技术、新材料、新工艺的发展都需要逐步规范化的企业标准、行业标准、国家标准。 气承膜技术发展的初期&#xff0c;面临行业…

代码随想录 Day26 贪心算法01 中 LeetCode T376 摆动序列

LeetCode T376 摆动序列 题目链接:376. 摆动序列 - 力扣&#xff08;LeetCode&#xff09; 前言 这题我们看到可以删除数组中的元素也可以不删除可能就吓到了,其实是这道题可以用动态规划或者贪心的策略去解决问题,这里我们还是用贪心的解法去解决问题,具体动态规划的思路可以…

【LittleXi】地址空间三题

【LittleXi】地址空间三题 问题 给定这个结构体 struct {bool s;short b;const char *str "AABB";int i; } a[2];计算这三个输出 printf("%d\n", (char *)(&(a[0].i)) - (char *)(&(a[0].s))); printf("%x\n", (&(a[1].i)) - (…

为什么红黑树比AVL树效率高?

文章目录 前言红黑树的提出都知道的几个定义理解红黑树的高效总结 前言 红黑树为什么这么火呢&#xff1f;大家应该都很清楚&#xff0c;面试的时候不管三七二十一&#xff0c;就问你&#xff1a;什么是红黑树&#xff0c;为什么要用红黑树&#xff1f;就好像他很懂&#xff0…

Modeling Deep Learning Accelerator Enabled GPUs

Modeling Deep Learning Accelerator Enabled GPUs 发表在 ISPASS 2019 上。文章研究了 NVIDIA 的 Volta 和 Turing 架构中张量核的设计&#xff0c;并提出了 Volta 中张量核的架构模型。 基于 GPGPU-Sim 实现该模型&#xff0c;并且支持 CUTLASS 运行。发现其性能与硬件非常吻…

git log 命令详解

测试仓库 asdf 常用参数 查询指定目录 git -C /Users/yanlp/workspace/asdf log 限制显示提交数量 git log -n 3 限制提交人|邮箱 git log --authorEdwin Kofler | git log --authoredwinkofler.dev 限制一个月内的提交git log --since1.month.ago | git log --since2023-0…

1024程序员狂欢节特辑 | ELK+ 协同过滤算法构建个性化推荐引擎,智能实现“千人千面”

专栏集锦&#xff0c;大佬们可以收藏以备不时之需 Spring Cloud实战专栏&#xff1a;https://blog.csdn.net/superdangbo/category_9270827.html Python 实战专栏&#xff1a;https://blog.csdn.net/superdangbo/category_9271194.html Logback 详解专栏&#xff1a;https:/…

推荐一款支持异步批量下载图片的chrome插件——图片助手(ImageAssistant) 批量图片下载器

https://chrome.google.com/webstore/detail/imageassistant-batch-imag/dbjbempljhcmhlfpfacalomonjpalpko/related?hlzh-CNhttps://chrome.google.com/webstore/detail/imageassistant-batch-imag/dbjbempljhcmhlfpfacalomonjpalpko/related?hlzh-CN 安装后直接点击 会根据…

第五章Maven依赖的特性-进阶篇

文章目录 第一节 重新认识MavenMaven 的完整功能项目管理功能的具体体现 POM 的四个层次超级 POM父 POM有效 POM概念查看有效 POM 小结 属性的声明与引用help 插件的各个目标使用 help:evaluate 查看属性值通过 Maven 访问系统属性Java 系统属性一览使用 Maven 访问系统属性 访…

Django 注册及创建订单商品

注册功能的实现 user/views from rest_framework.generics import GenericAPIView from rest_framework.views import APIViewfrom apps.user.models import User from apps.user.serializers import UserSerializer from utils import ResponseMessage from utils.jwt_auth …

Unity OnGUI调试工具

背景 在产品开发过程中调试数据是必不可少的过程之一&#xff0c;那么涉及到频繁的设置数据、运行unity等一系列繁琐的操作&#xff0c;有没有更好的办法呢&#xff1f;答案是肯定有更好的办法。这里我所用到的是unity自带的OnGUI相关的工具可以实时的更改数据调试。 代码 usi…

有没有人声和背景音乐分离的神器?

做视频剪辑&#xff0c;二次创作的朋友&#xff0c;需要去除视频中的背景音乐&#xff0c;保留人声&#xff1b;或者去除人声&#xff0c;保留背景音乐。随着用户需求的增多&#xff0c;科技的发展&#xff0c;让我们能通过智能的人声分离软件来实现&#xff0c;下面就来看看如…