声音事件检测DESED 数据集介绍

news2024/11/15 8:25:49

DESED dataset contains:DESED
Domestic Environment sound event detection;
家庭环境声音事件检测;

1. 数据

Content内容

DESED dataset contains:DESED 数据集包含:
Domestic Environment sound event detection;

家庭环境声音事件检测;

  • Recorded soundscapes.录制的音景。
  • Synthetic soundbank (+ code to create new soundscapes using Scaper) and dcase 2019 soundscapes.
    合成音库(+使用Scaper创建新音景的代码)和 dcase 2019 音景。
  • Public evaluation (recorded soundscapes) used in dcase 2019 (a.k.a. Youtube eval set in dcase, Vimeo is not available.).
    dcase 2019 中使用的公开评估(录制的音景)(又名 dcase 中设置的 Youtube 评估,Vimeo 不可用。)。
Overview概述

The dataset is split into two subsets as described below.
数据集分为两个子集,如下所述。


Recorded soundscapes录制的音景
  • Verified and unverfied subset of Audioset.
    Audioset的已验证和未验证子集。
    • Unlabel_in_domain data: Unverified data have their label discarded: 14412 files.
      Unlabel_in_domain data:未验证的数据的标签被丢弃: 14412个文件
    • Weakly labeled data: training data have their labels verified at the clip level: 1578 files.
      弱标记数据:训练数据在剪辑级别验证了其标签: 1578 个文件
    • Validation data have their labels with time boundaries (strong labels): 1168 files.
      验证数据的标签带有时间边界(强标签): 1168 个文件
    • Evaluation public files: 692 Youtube files
      评估公开文件: 692 个 Youtube 文件
Synthetic soundscapes合成音景
  • Background files are extracted from SINS [2], MUSAN [3] or Youtube and have been selected because they contain a very low amount of our sound event classes.
    背景文件是从 SINS [2] 、MUSAN [3]或 Youtube 中提取的,之所以被选择是因为它们包含的声音事件类数量非常少。
  • Foreground files are extracted from Freesound [4][5] and manually verified to check the quality and segmented to remove silences.
    前景文件从 Freesound [4] [5]中提取,并手动验证以检查质量并分段以消除静音。
  • Mixtures are described in Generating new synthetic data.
    生成新的合成数据中描述了混合物。
  • Sound bank: 声音库:
    • Training: 2060 background files (SINS) and 1009 foreground files (Freesound).
      训练: 2060 个背景文件(SINS)和_1009 个前台文件_(Freesound)。
    • Eval: 12 (Freesound) + 5 (Youtube) background files and 314 foreground files (Freesound).
      评估: 12 (Freesound) + 5 (Youtube)后台文件_和_314 个前台文件(Freesound)。
Bibliography参考书目

You can find information about this dataset in these papers:
您可以在这些论文中找到有关此数据集的信息:

  • Turpault et al. Description of DESED dataset + official results of DCASE 2019 task 4.
    图尔波特等人。 DESED数据集描述+DCASE 2019任务4的官方结果。
  • Serizel et al. Robustness of DCASE 2019 systems on synthetic evaluation set.
    塞里泽尔等人。 DCASE 2019 系统在综合评估集上的鲁棒性。
Relation to DCASE task 4

与 DCASE 任务 4 的关系

If you want more information about dcase 2019 dataset go to Desed for DCASE 2019 task 4 below, or visit DCASE 2019 task 4 web page
如果您想了解有关 dcase 2019 数据集的更多信息,请参阅下面的Desed for DCASE 2019 任务 4 ,或访问DCASE 2019 任务 4 网页

2. 数据片段

This page explains how to download the recorded clips. The training + validition sets are downloaded separately from the public evaluation set.
本页介绍如何下载录制的剪辑。训练+验证集是与公共评估集分开下载的。

Training set and validation set

训练集和验证集

  • The real_data folder real_data 文件夹
    • Clone this repo克隆这个仓库
    • cd real_data/src
    • python download_real_data.py
    • Send a mail with the csv files in the real_data/missing_files folder to nicolas (and romain)
      real_data/missing_files文件夹中包含 csv 文件的邮件发送给nicolas (和romain )
    • If you want to do the dcase2019 repo, launch create_dcase2019_dataset.sh from real_data folder
      如果您想执行 dcase2019 存储库,请从real_data文件夹启动create_dcase2019_dataset.sh
Public evaluation set公开评价集

The evaluation data are in the following repo: DESED_public_eval.
评估数据位于以下存储库中: DESED_public_eval

It corresponds to “youtube” subset in the desed eval paper and in the task 4 of DCASE 2019 Challenge.
它对应于设计评估论文和 DCASE 2019 挑战赛任务 4中的“youtube”子集。

  • Download DESED_public_eval.tar.gz
    下载 DESED_public_eval.tar.gz
  • tar -xzvf DESED_public_eval.tar.gz
  • To move it to dcase2019, merge dataset/ with dcase2019/dataset.
    要将其移动到 dcase2019,请将dataset/dcase2019/dataset合并。
Class-wise statistics按类别统计

在这里插入图片描述

| | Training (weak)训练(弱) | Validation验证 | Public Evaluation公众评价 |
| | clips剪辑 | clips剪辑 | events事件 | clips剪辑 | events事件 |
| Alarm/bell/ringing闹钟/铃声/响铃 | 205 | 187 | 420 | 79 | 196 |
| Blender混合器 | 134 | 80 | 96 | 73 | 84 |
| Cat猫 | 173 | 121 | 341 | 70 | 240 |
| Dishes菜肴 | 184 | 171 | 567 | 136 | 488 |
| Dog狗 | 214 | 160 | 570 | 82 | 441 |
| Electric shaver/toothbrush
电动剃须刀/牙刷 | 103 | 62 | 65 | 84 | 108 |
| Frying煎炸 | 171 | 89 | 94 | 88 | 90 |
| Running water自来水 | 343 | 197 | 237 | 92 | 109 |
| Speech演讲 | 550 | 627 | 1754 | 314 | 913 |
| Vacuum cleaner吸尘器 | 167 | 91 | 92 | 94 | 96 |
| Total全部的 | 1578 | 1168 | 4093 | 692 | 2765 |

ref

https://project.inria.fr/desed/description/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2078293.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[学习笔记]在不同项目中切换Node.js版本

文章目录 使用 Node Version Manager (NVM)安装 NVM使用 NVM 安装和切换 Node.js 版本为项目指定 Node.js 版本 使用环境变量指定 Node.js安装多个版本的 Node.js设置环境变量验证配置使用 npm 脚本切换 在开发中,可能会遇到不同的Vue项目需要不同的Node.js&#xf…

各个版本jdk新特性

jdk8新特性 方法引用:方法引用允许直接通过方法的名称来引用已经存在的方法,简化了函数式接口的实现。默认方法(Default Methods):默认方法允许在接口中定义具有默认实现的方法,以便接口的实现类可以继承该…

uniapp-Vue项目如何实现国际化,实现多语言切换,拒绝多套开发,一步到位,看这篇就够

一 安装 找到自己的项目,输入cmd进入命令行,输入安装命令,点击回车进行下载: npm install vue-i18nnext 下载完将在项目的配置文件中看到: 二 使用 2.1 在项目中创建一个文件夹如:lang 用于存放不同语言的包。这些语言文件通常为JSON格式 2.2 在项目main.js文件中引入并初…

YoloV8损失函数篇(代码加理论)

首先yolov8中loss的权重可以在ultralytics/cfg/default.yaml修改 损失函数定义ultralytics/utils/loss.py 回归分支的损失函数 DFL(Distribution Focal Loss),计算anchor point的中心点到左上角和右下角的偏移量IoU Loss,定位损失,采用CIoU…

开源网络安全大模型 - SecGPT

网络安全大模型是指使用大量数据和参数来训练的人工智能模型,它可以理解和生成与网络安全相关的内容,例如漏洞报告、利用代码、攻击场景等。 目前各家网络安全厂商也纷纷跟进在大模型方面的探索,但可供广大从业者研究的特有网络安全大模型…

2013-2023年 中国MOD17A3H植被净初级生产力(NPP)数据

中国MOD17A3H植被净初级生产力(NPP)数据是基于NASA的MODIS卫星遥感数据计算得出的,这些数据对于评估生态系统碳收支、碳循环以及气候变化的影响具有重要意义。NPP数据可以反映植被通过光合作用固定大气中二氧化碳并转化为有机物质的能力&…

OpenStack组件介绍(2)

cinder 提供块存储服务,管理openstack中的块存储资源,为云平台提供持久的块存储服务,通过驱动的方式可以接入不同种类的后端存储。 cinder对接nfs 关闭防火墙和selinux [rootlocalhost yum.repos.d]# systemctl stop firewalld [rootlocal…

对想学习人工智能或者大模型技术从业者的建议

“ 技术的价值在于应用,理论与实践相结合才能事半功倍” 写这个关于AI技术的公众号也有差不多五个月的时间了,最近一段时间基本上都在保持日更状态,而且写的大部分都是关于大模型技术理论和技术方面的东西。‍‍‍‍‍‍‍‍‍ 然后最近一段…

网络安全售前入门04——审计类产品了解

目录 1.前言 2.数据库审计介绍 2.1产品架构功能 2.2应用场景 2.3部署形式 2.4产品价值 2.5选型依据 1.前言 为方便初接触网络安全售前工作的小伙伴了解网安行业情况,我制作一系统售前入门(安全产品,安全服务,法律法规等)文章介绍,希望能给初进网安职场的小伙伴提供…

STL中的stack与queue

前言: stack与queue是STL中的容器适配器,而不是容器。何为适配器?给手机充电的充电器就是一种适配器,将高电压变成低电压。适配器是用来做转化的,不用来直接管理数据,而是在其他容器的基础上去封装转换。 …

WordNet介绍——一个英语词汇数据库

传统语义知识库最常见的更新方法是依赖人工手动更新,使用这种更新方法的语义知识库包括最早的 WordNet、FrameNet和 ILD,以及包含丰富内容的 ConceptNet和 DBPedia。此类语义知识库的特点是以单词作为语义知识库的基本构成元素,以及使用预先设…

C++ | Leetcode C++题解之第376题摆动序列

题目&#xff1a; 题解&#xff1a; class Solution { public:int wiggleMaxLength(vector<int>& nums) {int n nums.size();if (n < 2) {return n;}int prevdiff nums[1] - nums[0];int ret prevdiff ! 0 ? 2 : 1;for (int i 2; i < n; i) {int diff n…

记一次NULL与空字符串导致的分组后产生重复数据

目录 一&#xff0c;场景说明二&#xff0c;实现功能三&#xff0c;修改原实现方法四&#xff0c;说明 一&#xff0c;场景说明 想实现这样一个功能&#xff0c;统计人员信息中不同性别的人的总工资。 实现方式&#xff1a;将数据group by 分组后累加。 二&#xff0c;实现功…

叉车(工业车辆)安全管理系统,云端监管人车信息运营情况方案

近年来&#xff0c;国家和各地政府相继出台了多项政策法规&#xff0c;从政策层面推行叉车智慧监管&#xff0c;加大叉车安全监管力度。同时鼓励各地结合实际&#xff0c;积极探索智慧叉车建设&#xff0c;实现作业人员资格认证、车辆状态认证、安全操作提醒、行驶轨迹监控等&a…

探秘Facebook的人工智能战略:如何用智能技术重塑社交网络

人工智能&#xff08;AI&#xff09;正以前所未有的速度渗透到各个领域&#xff0c;社交网络也不例外。作为全球最大的社交平台之一&#xff0c;Facebook&#xff08;现Meta&#xff09;正利用人工智能技术重塑其网络环境&#xff0c;提升用户体验。本文将深入探讨Facebook的人…

对SpringBoot项目Jar包进行加密防止反编译

最近项目要求部署到其他公司的服务器上,但是又不想将源码泄露出去,要求对正式环境的启动包进行安全性处理,防止客户直接通过反编译工具将代码反编译出来,本文介绍了如何对SpringBoot项目Jar包进行加密防止反编译,需要的朋友可以参考下 场景: 最近项目要求部署到其他公司的服…

华为HCIP-datacom 真题 (2024年下半年最新题库)

备考HCIP-datacom的小伙伴注意啦 2024年下半年8月份最新题库带解析,有需要的小伙伴移动至文章末 1.BGP 邻居建立过程的状态存在以下几种&#xff1a;那么建立一个成功的连接所经历的状态机顺序是 A、3-1-2-5-4 B、1-3-5-2-4 C、3-5-1-2-4 D、3-1-5-2-4 答案&#xff1a;D 解析…

界面控件DevExpress VCL v24.2路线图预览——增强云集成、简化应用程序皮肤等

DevExpress VCL Controls是Devexpress公司旗下老牌的用户界面套包&#xff0c;所包含的控件有&#xff1a;数据录入、图表、数据分析、导航、布局等。该控件能帮助您创建优异的用户体验&#xff0c;提供高影响力的业务解决方案&#xff0c;并利用您现有的VCL技能为未来构建下一…

el-pagination 下拉条目数最后一个样式改成全部

2024.08.27今天我学习了如何把el-pagination的下拉条目数修改&#xff0c;效果如下&#xff1a; 我们需要把最后一条选择换成全部展示&#xff0c;其实传给后端的还是总的数量&#xff0c;只是换了一个content&#xff0c; 通过f12查看元素可以拿到.el-select-dropdown__item …

华为鸿蒙NEXT大揭秘:微信版功能曝光,简洁界面回归

在科技界&#xff0c;每一次操作系统的更新迭代都是一场期待与猜测的盛宴。华为的鸿蒙系统自问世以来&#xff0c;就以其独特的设计理念和强大的功能吸引了全球的目光。而今&#xff0c;随着微信版鸿蒙NEXT的曝光&#xff0c;我们似乎又将迎来一次科技的飞跃。但这一次&#xf…