开源数据 | 语音对话大模型高品质数据集——MagicHub多方言语音数据集推荐

news2025/1/9 21:54:28

图片

近日,法国知名开源AI研究实验室Kyutai推出了一款具备看、听、说多模态大模型——Moshi。Moshi功能与GPT-4o相似,可以听取人的语音提问后进行实时推理回答内容。然而,Moshi最吸引人的是全面开源,并可以支持在端侧运行。这将大大提振语音对话模型在端侧的普及。

Moshi作为一个端到端的多模态模型,不仅在语音处理上有所突破,更重要的是它让我们看到了不一样的人机交互方式。近期国内的从业者也开始下载Moshi并试用。考虑到Moshi目前对普通话支持较差,我们很期待国内产品优化对普通话的支持。最好再支持一些粤语、四川话、上海话、天津话等有特色的地方语言,就像汽车导航那样一定会非常有意思!

对于中国的老百姓来说,能够用自己熟悉的方言进行交流将大大提升沟通效率和亲近感。大模型公司通过提供方言对话功能,也能够更好地满足这部分用户的需求,从而增加用户黏性和忠诚度。同时,方言对话也能够为用户提供更个性化的服务体验,进一步巩固企业在市场中的竞争优势。

因此,中国的语音对话大模型在各种应用场景下,方言的对话理解能力,成为落地的刚需。

图片

然而,方言是一种交互起来很便捷,但书写起来却非常困难的语言。很多方言几乎没有自己的用字体系。这使得方言数据的获得非常困难,特别是高质量方言数据集。

在这个背景下,MagicHub积极行动,开源了多个高质量方言数据集,旨在推动方言语音大模型的发展。这些方言对话数据由晴数智慧对话语音专家进行设计,并针对不同的方言构建了相应的用词体系。它们不仅能够增强模型的方言识别能力,还能为方言语音合成、翻译等领域提供有力支持。

图片

本次开源的方言对话数据其价值主要体现在:

  1. 真实的自然对话,能更深入地了解方言语法和表达特点;

  2. 说话人多样,覆盖方言主要代表区域;

  3. 其内容经过了精细的人机协作pipeline清洗,保证了品质,是识别、合成、翻译等多场景的重要原料。

开源方言数据集

天津方言对话语料库

https://magichub.com/datasets/tianjin-dialect-conversational-speech-corpus-2/

四川方言日常语音语料库

https://magichub.com/datasets/sichuan-dialect-scripted-speech-corpus-daily-use-sentence/

粤语日常用语语料库

https://magichub.com/datasets/guangzhou-cantonese-scripted-speech-corpus-daily-use-sentence/

上海方言日常用语语料库

https://magichub.com/datasets/shanghai-dialect-scripted-speech-corpus-daily-use-sentence/

郑州方言日常用语语料库

https://magichub.com/datasets/zhengzhou-dialect-scripted-speech-corpus-daily-use-sentence/

*以上数据集版权归Magic Data所有,支持学术研究,未经允许禁止商用。

更多热门数据集下载👇

https://magichub.com/datasets/

除此之外,我们还有数万小时的各地方言商用数据,是构建语音大模型的高品质数据,欢迎大家咨询!

👇扫码咨询:

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1912364.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ARM裸机:一步步点亮LED(汇编)

硬件工作原理及原理图查阅 LED物理特性介绍 LED本身有2个接线点,一个是LED的正极,一个是LED的负极。LED这个硬件的功能就是点亮或者不亮,物理上想要点亮一颗LED只需要给他的正负极上加正电压即可,要熄灭一颗LED只需要去掉电压即可…

Dynamics365 UCI下的高级查找(不要留恋Classic了)

UCI界面已经用了多年了,在Classic下的的高级查找按钮(漏斗icon)已不见踪影 但因为使用习惯问题,还是有人会通过右上角高级设置,进入Classic界面找到漏斗Icon来使用高级查找 但新的UCI风格下已经没了高级查找的概念,取而代之的是基…

ComfyUI入门教程

本文主要介绍了通过源码运行comfyui,默认例子介绍,节点管理器的使用,以及界面汉化。可多参考开源工作流,多加实践,从而掌握comfyui操作。 1.源码运行comfyui 执行命令python main.py如下: 安装numpy 1.x最…

JavaScript中的LHS和RHS

LHS和RHS之前我们先来回忆一下最简单的赋值操作! var test100; console.log(test); 以上代码的意思简单我们理解为把右边的值赋值给左边的test变量,然后输出打印结果。 可是我们要是深入理解你就会发现在这个过程当中,还发生了一些其他的事情 而这些事情就是今天…

C++入门基础(1)

因为6月中旬学校事情多,许久未更新,让我们继续学习吧! 目录 前言: 一、命名空间: 1、定义: 2、使用: 3、访问命名空间域: 二、C输入、输出函数: 1、输入函数: 2、输出…

vue3源码(六)渲染原理-runtime-core

1.依赖关系 runtime-dom 依赖于runtime-core,runtime-core 依赖于reactivity和sharedruntime-core提供跨平台的渲染方法createRenderer,用户可以自己传递节点渲染的渲染方法renderOptions,本身不关心用户使用什么APIruntime-dom提供了为浏览器而生的渲染…

关闭这八个电脑设置,保护个人隐私

你知道吗?电脑可能一直在偷窥你的小秘密。朋友们,一定要记得关闭这8个电脑设置哦,这样可以有效地保护我们的个人隐私。 按住键盘Windows键加i键,快速打开Windows设置。然后点击隐私选项。 我们来看基本的常规设置。里面有四个设置…

关于put提交不了参数的解决办法

html中form表单只支持GET与POST请求,而DELETE、PUT等method并不支持, 如图所示 参数请求改成RequestBody,用json格式传参即可解决问题

资料分析笔记整理

提升技巧多做题、少动笔、多分析 资料分析认识 国考一般20题(24~28分钟) 统计材料的类型包括单纯的文字、表格、图形以及由这些元素组成的复合类型材料 文字性材料:(30~60秒) 多段落型文字材料(时间、关键词、结构) 孤立段落文字材料(时间、关键词、标点[。;]) 表…

数据挖掘——matplotlib

matplotlib概述 Mat指的是Matlab,plot指的是画图,lib即library,顾名思义,matplotlib是python专门用于开发2D图表的第三方库,使用之前需要下载该库,使用pip命令即可下载。 pip install matplotlib1、matpl…

Idea使用EasyApi插件自动生成接口文档到Yapi

1.安装EasyApi插件 2.配置Yapi 设置-》EasyApi Yapi的Server 配置为Yari项目的地址 tokens:项目名Yapi项目里面的token:例如:test-project0e6cfb3c22c884a0fce108fffe554a20ca12341e421d7201233143ee440af36b mytest-portal0e6cfb3c22c884a…

关于Qt模型插入最后一行数据中存在未填满的项,点击导致崩溃的解决办法

在使用Qt模型视图框架的时候,你可能会遇见这种情况:给QTableView设置设置模型的时候,网模型里面插入数据,因为数据是一行一行插入的,即要使用model的appandRow函数,但有时候最后一行数据没有填满一行&#…

Temu是什么?Temu自养号测评有什么优势?

一、 Temu是什么?Temu是拼多多于海外线的跨境电商平台,“Temu”这个名字的含义也和拼多多的意思相近。Temu跨境电商自上线以来,下载量不断攀升,发展势头一片大好,击穿地板价的商品在欧美市场掀起了一阵狂潮&#xff0c…

html H5 dialog弹窗学习,实现弹窗显示内容 替代confirm、alert

html H5 dialog弹窗学习,实现弹窗内容 替代confirm 框架使用的mui,使用mui.confirm() 弹窗内容过多时,弹窗被撑的到屏幕外去了,使用H5 dialog 标签自定义一个固定大小的弹窗,内容过多时可下拉显示 效果展示 隐私政策内容很多,可以下拉显示 代码 myDialog.css dialog{p…

Java虚拟机面试题汇总

目录 1. JVM的主要组成部分及其作用? 1.1 运行时数据区划分? 1.2 哪些区域可能会发生OOM? 1.3 堆和栈的区别? 1.4 内存模型中的happen-before是什么? 2. HotSpot虚拟机对象创建流程? 2.1 类加载过程…

Xilinx zc706 USB电路解析

作者 QQ群:852283276 微信:arm80x86 微信公众号:青儿创客基地 B站:主页 https://space.bilibili.com/208826118 参考 USB OTG检测原理 USB3320 USB_ID为低电平时候,为host模式,USB_ID为悬空(高…

如何快速实现一个无缝轮播效果

🧑‍💻 写在开头 点赞 收藏 学会🤣🤣🤣 需求简介 轮播图是我们前端开发中的一个常见需求,在项目开发中,我们可以使用element、ant等UI库实现。某些场景,为了一个简单的功能安装一…

数据结构作业/2024/7/9

2>实现双向循环链表的创建、判空、尾插、遍历、尾删、销毁 fun.c #include "head.h" //1.双向循环链表的创建 doubleloop_ptr create_list() …

面经-计算机网络-数据结构-堆

1.什么是堆 堆是一种满足以下条件的树: 堆中的每一个节点值都大于等于(或小于等于)子树中所有节点的值。或者说,任意一个节点的值都大于等于(或小于等于)所有子节点的值。 2.堆的用途 当我们只关心所有数…

Raylib 实现超大地图放大缩小与两种模式瓦片地图刷新

原理: 一种刷新模式: 在宫格内整体刷新,类似九宫格移动到边缘,则九宫格整体平移一个宫格,不过这里是移动一个瓦片像素,实际上就是全屏刷新,这个上限是 笔记本 3060 70帧 100*100个瓦片每帧都…