ViSQOL、PESQ、mosnet等mos分打分工具和Polqa语音感知音质打分测评

news2024/10/7 12:26:41
原创:转载需附链接:
https://blog.csdn.net/qq_37100442/article/details/132057139?spm=1001.2014.3001.5502
        

一、背景

        Mos分评价音质重要指标,最近也有很多机构和公司在研究适合自己的评价体系。目前Mos分主要分为主观评测和客观感知评价。其中客观感知评价由于方便和节省人力,被大众研究。本文章以标准polqa的mos分为可信前提,验证visqol、pesq、mosnet与polqa的一致性,以及visqol的可信度验证;主要用于 编解码、 降噪、回声消除等算法的感知效果进行打分,从而促进算法的迭代和可信度;

二、评价方式综述

       1、主观评价

               1) 优点主观测试是音频评价的黄金准则,最符合人的实际听感。

               2) 缺点主观评测费时费力,测试者太少、测试者不规范等都会带来测试误差;

               3) 常用方法:AB-TEST, MUSHAR

        2、客观打分

                1) 缺点:不能够完全符合人的听觉感知,存在听感好打分低的情况;

                2) 优点:方便测试和开发人员,快速验证语音的相对质量,方便日常工作,提升开发                         和测试效率;

                3) 常用方案:有参考(POLQA, PESQ, VISQOL)和无参考(ITU-TP.1201传统方法                          和  MOSNET的AI打分)

二、打分维度和一致性对比

         1、打分维度:

           结论:Visqol支持对时间帧和频率轴的各个频带进行打分(如下图所示),并且支持16khz和48khz;pesq只有最后的评分结果,拿不到时间和频率的细节打分,并且仅支持8kh和16khz打分;Mosnet为无参考打分;

2、一致性对比:

         结论:visqol和polqa的一致性更高, pesq颗粒度不够, mosnet(AI无参考模型)表现最差;

注:SMD48和SMD49,SMD50和SMD51,SMD271和SMD272这三对音频各对的音源相同,并且每对的后者都针对前者做了过认证优化。

三、visqol可信度测评

        从一些常见维度对语音进行损伤,测试visqol是否符合听感判断。

1、音量的影响:

        结论:音量差异影响不大,但是当降低-18db开始分数降低;

​​​​2、混响的影响:

        结论:混响音响较大,加入混响分数就开始降低,但是混响大小影响有规律

3、噪音的影响:

      结论:噪音影响很大,加入噪音分数就明显降低,但是不同信噪比变化有规律

4、频带缺失的影响

        结论:频带缺失影响打分较大,但是不同的频带模型还是能够匹配降低不同的分值;

四、总结

        visqol和polqa有较高的一致性(可能有幸存者偏差,但是拿到的数据是我们过认证的随机音频),visqol也存在和听感不符合的打分,例如加入轻微混响和噪音都会对打分有影响;但是混响和噪音的影响随着RT60和SNR的变化是有规律的,如果在降噪和混响模型的测试,也具相对意义,可以进行研发的自测;

参考文献:

       1、 https://github.com/google/visqol

       2、Objective Measure of Perceptual Audio Quality

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/842230.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

49. 海豚记账簿软件(b站的一个小项目)

闲着也是闲着就跟着别人做了一个小项目 目录 1.需求和目标 2.整体功能描述 3.核心思路 4.全部代码 1.需求和目标 项目的需求,实现一个叫做“海豚记账簿”的基于命令行界面的家庭记账软件。 2.整体功能描述 这个软件相对简单,只需要基于命令行做纯…

【数据结构OJ题】移除元素

原题链接:https://leetcode.cn/problems/remove-element/ 目录 1. 题目描述 2. 思路分析 3. 代码实现 1. 题目描述 2. 思路分析 方法一:暴力删除,挪动数据覆盖。即遍历整个nums[ ]数组,遇到值等于val的元素,就将整…

Eclipse如何自动添加作者、日期等注释

一、创建类时自动添加注释 1、Window->Preferences 2、Java->Code Syle->Code Templates->Code->New Java files->Edit->要添加的注释->Apply 二、选中要添加的类或者方法通过AltShiftJ快捷键添加 1、Window->Preferences 2、Java->Code Syle…

IP地址、网关、子网掩码

通过SSH将Ubuntu的盘映射到Windows下面去,以及在VsCode通过SSH Server或者在MobaXterm中通过SSH连接到远程ubuntu服务器,但由于之前Ubuntu的网络是自动连接的,IPv4经常会改变,就会导致上述三个远程连接都需要重新配置。 故由DHCP自…

ETHERCAT转PROFIBUS网关连接安川伺服支持EtherCAT总线吗

捷米JM-DP-ECT,是自主研发的一款PROFIBUS从站功能的通讯网关,它的主要功能是将ETHERCAT设备接入到PROFIBUS网络中。 JM-DP-ECT这个小小的网关可不简单,连接到PROFIBUS总线中做为从站使用,连接到ETHERCAT总线中做为从站使用。 1.2…

DAY03_Spring—SpringAOPAOP切入点表达式AOP通知类型Spring事务管理

目录 一 AOP1 AOP简介问题导入1.1 AOP简介和作用1.2 AOP中的核心概念 2 AOP入门案例问题导入2.1 AOP入门案例思路分析2.2 AOP入门案例实现【第一步】导入aop相关坐标【第二步】定义dao接口与实现类【第三步】定义通知类,制作通知方法【第四步】定义切入点表达式、配…

kafka-保证数据不重复-生产者开启幂等性和事务的作用?

1. 生产者开启幂等性为什么能去重? 1.1 场景 适用于消息在写入到服务器日志后,由于网络故障,生产者没有及时收到服务端的ACK消息,生产者误以为消息没有持久化到服务端,导致生产者重复发送该消息,造成了消…

SpringMVC -- REST风格开发,RESTful快速开发、RESTful注解开发

🐌个人主页: 🐌 叶落闲庭 💨我的专栏:💨 c语言 数据结构 javaweb 石可破也,而不可夺坚;丹可磨也,而不可夺赤。 REST 一、REST简介1.1REST风格简介 二、RESTful入门案例2.…

SpringBoot集成Logback日志

SpringBoot集成Logback日志 文章目录 SpringBoot集成Logback日志一、什么是日志二、Logback简单介绍三、SpringBoot项目中使用Logback四、概念介绍一、日志记录器Logger1.1、日志记录器对象生成1.2、记录器的层级结构1.3、过滤器1.4、logger设置日志级别1.5、java代码演示1.6、…

【资料分享】全志科技T507-H工业核心板规格书

1 核心板简介 创龙科技SOM-TLT507是一款基于全志科技T507-H处理器设计的4核ARM Cortex-A53全国产工业核心板,主频高达1.416GHz。核心板CPU、ROM、RAM、电源、晶振等所有元器件均采用国产工业级方案,国产化率100%。 核心板通过邮票孔连接方式引出MIPI C…

防火墙第四次作业

1. 什么是IDS? IDS是:入侵检测系统(intrusion detection system,简称“IDS”)是一种对网络传输进行即时监视,在发现可疑传输时发出警报或者采取主动反应措施的网络安全设备。它与其他网络安全设备的不同之…

K8s中的核心技术Helm

1.helm的引入 (1)编写yaml文件 (2)编写deployment文件 (3)编写service文件 (4)编写Ingress文件 2.helm的引入解决的问题? (1)使用helm可以把…

CommStudio for .NET Crack

CommStudio for .NET Crack CommStudio for.NET使您的应用程序可以轻松地使用串行端口和调制解调器进行通信。CommStudio for.NET是一套全面的组件和可视化调试工具,可将远程系统和设备与visual Studio 2005和visual Studio 2008集成。开发与遗留系统和外部设备集成…

IAR开发环境的安装、配置和新建STM32工程模板

IAR到环境配置到新建工程模板-以STM32为例 一、 简单介绍一下IAR软件1. IAR的安装(1) 下载IAR集成开发环境安装文件(2) 安装 2. 软件注册授权 二、IAR上手使用(基于STM32标准库新建工程)1、下载标准库文件2、在IAR新建工程&#x…

99%的人做效果图都会忽略的问题!为什么你的效果图没有亚洲面孔?

不知道各位设计师有没有发现一个问题,我们做了不少效果图,也积攒了很多素材,但是出现在我们效果图的人物几乎都是外国人! 可能你会说是亚洲人的素材实在太少,但本质是对“人”不够重视,觉得随便“复制粘贴”…

信息安全技术工业控制系统安全控制应用指南学习笔记

工业控制系统安全控制基线 根据工业控制系统在国家安全、经济建设、社会生活中的重要程度,遭到破坏后对国家安全、社会秩序、公共利益以及公民、法人和其他组织的合法权益的危害程度等,结合信息安全等级保护标准划分及实施效果分析,结合工业…

超简单的ssm的疫情上报系统java学生防控打卡统计 jsp源代码mysql

本项目为前几天收费帮学妹做的一个项目,Java EE JSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。 一、项目描述 疫情上报系统 软件介绍 使用SSM框架搭建后台 前端采…

MYSQL06高级_为什么使用索引、优缺点、索引的设计、方案、聚簇索引、联合索引

文章目录 ①. 为什么使用索引②. 索引及其优缺点③. InnoDb - 索引的设计④. InnoDb中的索引方案⑤. 索引 - 聚簇索引⑥. 索引 - 二级索引 ①. 为什么使用索引 ①. 索引是存储引擎用于快速找到数据记录的一种数据结构,就好比去图书馆找书,或者新华字典里找字,相当于一个目录,可…

react搭建在线编辑html的站点——引入grapes实现在线拖拉拽编辑html

文章目录 ⭐前言⭐搭建react ts项目⭐引入grapes 插件⭐结束 ⭐前言 大家好,我是yma16,本文分享关于react搭建在线编辑html的站点。 react 发展历史 React是由Facebook开发的一种JavaScript库,用于构建用户界面。React最初发布于2013年&…

MySQL两种存储引擎及索引对比

MySQL两种存储引擎及索引对比 前言存储引擎主要区别相关命令存储引擎1: MyISAM存储引擎2: InnoDB其他存储引擎: 索引聚集(聚簇)索引二级索引 常见面试题为什么 DBA 都建议表中一定要有主键,而且推荐使用整型自增?为什么要有主键&a…