破解色带现象(下)

news2025/2/3 0:58:47

编者按:本文是“破解色带现象”文章的第二部分,Fabio Sonnati进一步  分析了色带现象产生的原因,并提供了新的检测办法。本文已获得作者授权转载。

翻译:Argus

原文链接:https://sonnati.wordpress.com/2022/09/16/defeat-banding-part-ii/

最近,色带终于成为编码优化的热门话题。正如上一篇文章中所讨论的,它现在是编码专家最大的敌人之一,尤其是在尝试微调内容感知编码[CAE]技术时。

当压缩在帧上局部减少过多的高频时会出现色带,这会在单个纯色条带中分离渐变。因此,这些条带很容易看到并降低了感知质量。

多年来,我一直强调,即使像 VMAF 这样有用的指标也无法有效地识别条带,我们需要更具体的指标或像 VMAF 这样的指标,但对画面的黑暗或平坦部分的伪影很敏感,希望是一个无参考指标,可用于源文件以及压缩后的指标评估。

9ef47935aff654c8a5b1ef4f81169229.png

图 1 – 在带状序列的情况下,VMAF 和 MOS 之间缺乏相关性(来源:Netflix)

正如上一篇文章所预期的那样,我在2020年开始实验一些关于衡量带状的指标的PoC,第二年我验证了这个逻辑在我的一个客户那里的工作,即 "带状指数 "指标。为了简单起见,我把它叫做bIndex

重要的是目前Netflix也在研究带状物,并提出(2021年10月)他们的带状物检测指标Cambi。Cambi是一个基于像素分析和阈值处理的一致的无参考带状检测器,加上许多优化有夯实和准确的带状识别率。

我所使用的逻辑与Cambi非常不同,它不仅可以用来识别带状物,还可以使用我所说的 "自动相似性 "原则识别许多类型的损伤。

来源受损的相似性的逻辑

我探索的逻辑如下图所示:

2418f5d87a8330bc9306e2ff12c68a02.png

图2 - 自动相似性原则

当一个源视频受到损失,会引发拥塞、带状、振铃、过度量化和类似的伪影现象。

如果一个视频的受损版本仍然与无损的自身内容相似,则意味着原始视频已经有了一定程度的这种损伤。这个程度与相似度指数成反比。

我称其为 "来源受损的相似性 "或有时为 "自动相似性",因为视频是与自身以及注入的、受控的、已知的损伤进行比较。这种损害需要是一次性的,而不是累积性的。让我更好地解释一下。

对于一次性损伤,我指的是只在第一次应用时产生效果的修改。例如:一个从颜色到灰色的过滤器就有这样的特点,如果你第二次应用它,结果就不会再有变化。

现在我们要选择的东西是:减损过滤器和相似度量。

因此,假设我们想找到视频的一部分是否有带状或过多的量化伪影,在这种情况下,我们可以使用频域量化作为减损。这种形式的减损具有上述特点:当多次应用时,只有第一次应用会产生失真,接下来的应用不会修改已经用已知量化水平量化过的图像。

最常用的相似性指标是SSIM。当视频完全相同时,它的最大值为1,而当出现不相似时,它将低于1。它比PSNR更具有感知性,而且只要平均值、方差和协方差等统计指标相似,就对小的差异不敏感。

将视频分成小部分而不是整体进行分析是非常重要的,特别是在度量的微调过程中,可以更好地理解如何设置阈值并验证伪影的正确识别。然后可以计算 "区域覆盖率",提供关于被测试的伪影(带状或其他)影响的帧范围的有趣信息。

下面的高水平图示说明了指标的计算。衡量标准的微调需要其他处理,如预设条件(这可能有助于提高人工质量),适当阐述SSIM值以只保留所需信息(非线性映射和阈值),最后汇总数据以总结(汇集)每帧的重要指数。

3e67d74aaf9df84c903736a8483ca747.png

图3 - 提取bIndex的情况

    结论

为了开发、验证和微调bIndex指标,我扩展了我过去开发的一个自定义播放器,用于逐帧和并排比较。在下面的图片中,你可以看到每一帧区域的指数,当带状物不可见时为绿色,当带状物可见且令人讨厌时为红色。第一张图片还显示了一个叠加的、可寻找的时间线,该时间线绘制了每个图片区域的条带化程度以及区分不相关条带和可见恼人条带的阈值。通过这种方式,可以快速寻找含有带状物的帧序列并评估检测的正确性。

dd5107d3828438110e0e79cf48709d64.png

71c461887826e61671b4f8675036a518.png

6f04e769cb3a79ecfd5f313ebb7d011c.png

b284f5bea1dbcbc670163e8ec545e975.png

ab30dde92b150f2d37abce7178e537cf.png

2efe876b0cc5eb456224f0e2b9e0b420.png

94084d396b44a3239721efe71bd914ea.png

这种方法可以扩展到许多类型的人工制品,并用于评估各种类型的视频(来源、夹层、压缩视频)的不同阈值。拥有来自帧覆盖率的统计指标也有助于做出决定,如拒绝信号源或用特定的配置文件重新编码内容来解决问题。请注意,目前的阈值是通过黄金眼对大屏幕感知来确定的,但在未来更复杂的建模可以用来将客观数字与感知相关联,并引入其他改进,如时间掩码和上下文感知的带状估计。

3a679f72b882e2643589f64342db7441.png▲扫描图中二维码或点击阅读原文
了解音视频技术大会更多信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/103890.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Flink实战案例四部曲

Flink实战案例四部曲 第一部曲:统计5分钟内用户修改创建删除文件的操作日志数量 输入 1001,delete 1002,update 1001,create 1002,delte 输出 1001,2 1002,2代码如下。 import org.apache.flink.streaming.api.environment.StreamExecutionEnvironmen…

Anlios装grouplist 组件之后报错,安装tiger-vncserver

因为之前升级了一个epel-release源,然后containerd也装进去了,但是版本太低 然后以为是runc挡住了,发现没有runc 删完了containerd就可以装了 rpm -ivh http://mirrors.wlnmp.com/centos/wlnmp-release-centos.noarch.rpm dnf install wntp…

【性能篇】30 # 怎么给WebGL绘制加速?

说明 【跟月影学可视化】学习笔记。 常规绘图方式的性能瓶颈 例子&#xff1a;在一个画布上渲染 3000 个不同颜色的、位置随机的三角形&#xff0c;并且让每个三角形的旋转角度也随机。 <!DOCTYPE html> <html lang"en"><head><meta charse…

SpringBoot+Vue实现前后端分离的高校思政课实践教学管理系统

文末获取源码 开发语言&#xff1a;Java 使用框架&#xff1a;spring boot 前端技术&#xff1a;JavaScript、Vue.js 、css3 开发工具&#xff1a;IDEA/MyEclipse/Eclipse、Visual Studio Code 数据库&#xff1a;MySQL 5.7/8.0 数据库管理工具&#xff1a;phpstudy/Navicat JD…

基于SSM的大学生心理健康系统设计与实现

开发工具(eclipse/idea/vscode等)&#xff1a; 数据库(sqlite/mysql/sqlserver等)&#xff1a; 功能模块(请用文字描述&#xff0c;至少200字)&#xff1a; 网站前台&#xff1a;关于我们、联系信息、文章信息、咨询师信息、服务信息、测试信喜 管理员功能&#xff1a; 1、管理…

继续谈谈从Rxjava迁移到Flow的背压策略

前言 对于背压问题不久前就讨论过了&#xff0c;这里就不过多介绍了&#xff0c;总之它是一个非常复杂的话题&#xff0c;本文的主要目的是分析我们如何从Rxjava迁移到Flow并且使用其背压方案&#xff0c;由于本身技术的限制以及协程内部的复杂性&#xff0c;不会做过多的深入…

下载安装PyTorch

1、下载并安装Visual Studio Code选择合适版本安装 2、下载安装conda并配置环境 下载方式一&#xff1a;官网下载 下载方式二&#xff1a;清华镜像安装 3、conda配置环境 打开电脑高级系统配置点开系统环境变量&#xff1a; 找到path然后点击Edit或者直接双击&#xff1a; 之后…

利用LSTM识别篇章关系实战代码+数据

1.显式篇章关系分类概述 案例知识点: 任务描述:篇章关系分析是自然语言中处理篇章级基础语言分析任务,其目的是利用规则或机器学习等计算机处理手段判别篇章各组成成分之间的修辞逻辑关系,从而从整体上理解篇章。其中论元之间有连接词连接的此类关系称为显式篇章关系。本教…

实验七、MOS管分压式偏置共源放大电路的静态和动态参数

一、题目 搭建MOS管分压式偏置共源放大电路。利用Multisim研究下列问题&#xff1a; &#xff08;1&#xff09;确定一组电路参数&#xff0c;使电路的 QQQ 点合适。 &#xff08;2&#xff09;若输出电压波形底部失真&#xff0c;则可采取哪些措施&#xff1f;若输出电压波形…

Mysql概念知识

Mysql数据库基础知识为什么要使用数据库数据保存在内存数据保存在文件数据保存在数据库什么是SQL&#xff1f;什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有几种录入格式&#xff1f;分别有什么区别&#xff1f;数据类型mysql有哪些数据类型引…

计算机毕设Python+Vue学生资源管理系统(程序+LW+部署)

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

websocket使用方法

前言 最近项目用到了websocket接口&#xff0c;用来做长连接&#xff0c;监听服务器数据变化&#xff0c;保持各终端数据同步。 用下来发现确实很好用&#xff0c;避免了轮询&#xff0c;开销小&#xff0c;而且最重要的是没有同源策略限制。 websocket WebSocket 是一种在…

Nginx-安装和部署全过程

前言 OpenResty是一个基于Nginx与 Lua 的高性能 Web 平台&#xff0c;其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。openresty官网&#xff1a;OpenResty - 中文官方站 …

软件著作权到底享有哪些权利?

根据《计算机软件保护条例》相关规定 软件著作权人享有下列各项权利: &#xff08;一&#xff09;发表权&#xff0c;即决定软件是否公之于众的权利&#xff1b; &#xff08;二&#xff09;署名权&#xff0c;即表明开发者身份&#xff0c;在软件上署名的权利&#xff1b; &a…

iOS的启动优化

应用的启动优化 当我们参与到大型应用的时候 会遇到一些启动时间过长的情况 这时候就需要使用到相关的操作。 总结来说&#xff0c;main()方法调用前&#xff0c;启动过程大体分为如下步骤&#xff1a; 先是LLVM把项目翻译成IR文件然后到backend&#xff0c;PRE_MAIN,main。 …

感冒咳嗽土法子

目录介绍 01.常见的感冒药02.止咳的土方法03.感冒的土方法 01.常见的感冒药 感冒是生活中最常见的疾病 患者往往会有&#xff1a;头昏、发烧、浑身酸痛、鼻塞、流鼻涕等症状 注意点 注意休息&#xff0c;适当补充水分&#xff0c;保持室内空气流通。 常见感冒药 主要成分的作…

CSS规范

CSS规范 命名规范 页面外围控制整体布局宽度&#xff1a;wrapper、页头&#xff1a;header、页面主体&#xff1a;main、内容&#xff1a;content、页脚&#xff1a;footer、导航&#xff1a;nav、主导航&#xff1a;mainbav、子导航&#xff1a;subnav、顶导航&#xff1a;t…

利用FormData上传本地文件

前言 最近接了个小项目&#xff0c;有个用客户端本地文件的需求。 正常这种需求都是前台传文件&#xff0c;后台去解析。 但这次C的老哥非让我给文件路径&#xff0c;说公司平台有解析文件的能力。 我说web不是桌面端&#xff0c;拿不到真实路径&#xff0c;他还不信&#…

已解决1. Downgrade the protobuf package to 3.20.x or lower.

已解决TypeError: Descriptors cannot not be created directly. If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc > 3.1.0If you cannot immediately regenerate your protos, some other possible worka…

【Ctfer训练计划】——(二)

作者名&#xff1a;Demo不是emo 主页面链接&#xff1a;主页传送门创作初心&#xff1a;舞台再大&#xff0c;你不上台&#xff0c;永远是观众&#xff0c;没人会关心你努不努力&#xff0c;摔的痛不痛&#xff0c;他们只会看你最后站在什么位置&#xff0c;然后羡慕或鄙夷座右…