由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、NVIDIA、语音之家、希尔贝壳共同主办的【语音之家】AI产业沙龙—动手体验语音AI开发利器 - NVIDIA NeMo代码实战,将于2023年2月28日19:00-20:30线上直播,同时还可线上与老师一起上机实操。
沙龙简介
NVIDIA NeMo是一个用于构建对话式人工智能应用的自动语音识别工具库。它采用语音文本数据为输入,并使用人工智能和自然语言处理模型理解语义,从而实现语音与文字间内容的相互转换。NeMo toolkit可用于构建人机语音文字交互的对话式解决方案,用于搭建智能语音助手,聊天机器人,智能语音翻译 ,声控智能家居及无人驾驶汽车语音指令交互等应用场景。本次沙龙将重点介绍如何使用NeMo训练自定义语音AI模型,同时上机操作体验在边缘计算设备Jetson NX中实现语音AI模型的推理。
参会嘉宾
Yipeng Li
NVIDIA 企业开发者社区经理
嘉宾简介:Yipeng Li,拥有多年数据分析建模、人工智能自然语言处理开发经验。在自动语音识别、自然语言处理、语音合成等对话式 AI 技术领域有丰富的实战经验与见解。曾开发法律、金融、保险文档中基于实体抽取的智能问答系统,曾开发基于 NLP 知识抽取,KG 知识图谱的建立的科研文档智能检索系统。
分享主题:通过NVIDIA NeMo训练语音AI模型
摘要:NVIDIA NeMo是一个使用了GPU加速的能够用于构建对话式人工智能应用的自动语音识别工具库,它采用语音文本数据作为输入,并使用人工智能和自然语言处理模型理解语义,从而实现语音与文字间内容的相互转换。NeMo toolkit可用于构建人机语音文字交互的对话式解决方案,用于搭建智能语音助手,聊天机器人,智能语音翻译 ,声控智能家居及无人驾驶汽车语音指令交互等应用场景。我们将重点介绍如何使用NeMo训练自定义语音AI模型,涉及构建适用于NeMo的语音数据集、中文语音识别模型、中文语音合成模型的训练,同时上机操作体验在边缘计算设备Jetson NX中实现语音AI模型的推理。
沙龙议程
-
NVIDIA NeMo介绍
-
构建适用于NeMo的语音数据集
-
使用NeMo训练中文ASR语音识别模型
-
使用NeMo训练中文TTS语音合成模型
-
在边缘计算设备上实现语音AI模型推理
上机操作
-
50台Jetson NX 作为实验硬件平台
-
Jupyter Lab 作为实验开发工具
-
线上远程网络连接对应IP端口登录
-
限50个名额、先到先得旁听不限
上机报名连接: 【语音之家】AI产业沙龙—— 动手体验语音AI开发利器 - NVIDIA NeMo代码实战
参加方式
直播将通过CSDN进行直播
移动端、PC端均可观看
👇👇👇
https://live.csdn.net/room/weixin_48827824/dPEAe6nB