Listen、Attention、Spell模型

news2024/11/27 2:28:25

LAS是一个做语音识别的经典seq2seq模型,主要分为三个部分Listen、Attention、Spell

Listen

Listen部分就是一个encoder。
输入声学特征向量,提取信息、消除噪声,输出向量。
在这里插入图片描述
encoder可以是RNN
在这里插入图片描述
也可以是CNN。比较常见的是先用CNN,再用RNN
在这里插入图片描述
还有一种趋势是使用Self-Attention
在这里插入图片描述

Down Sampling减少取样

由于声音的采集通常都是很大数据量的。比如采样率为16KHz需要在一秒钟采集16000个采样点,所以通常需要对声音的特征向量进行Down Sampling,减少样本数。

对于RNN,
方法一是通过使用两层RNN,4个向量通过第一层RNN输出4个向量,通过第二个RNN输出2个向量
方法二是把通过RNN输出的四个向量中,每隔一个输出向量
在这里插入图片描述

对于CNN,使用TDNN的方法,可以认为一段附近的几个特征向量差不多,采取使用第一个和最后一个向量,减少样本参数。

对于Self-Attention,计算当前向量和所有向量(1秒16K)计算量太大,只计算一个范围内的注意力。
在这里插入图片描述

Attention

我们可以直接编码解码之后直接输出,但是我们当前的编码解码不仅限于这一个编码向量,还取决于周围的编码向量,所以要做attention。

注意力机制如下图所示。 z z z是待训练的向量,初始时随机初始化, z z z与每个 h h h做match得到注意力分数 α α α
match的方法有两种,一种是Dot-product,另一种是Addictive。
在这里插入图片描述
在这里插入图片描述
做完match之后,每个 h h h的注意力分数 α α α做softmax,然后对应比例的h相乘相加,得到向量 c c c c 0 c^{0} c0作为decoder(Spell)的输入。
在这里插入图片描述

Spell

c 0 c^{0} c0作为decoder的输入
随机初始化的 z 0 z^{0} z0经过训练之后得到 z 1 z^{1} z1 z 1 z^{1} z1作为RNN的隐状态输入
通过RNN,输出|V|维向量经过Softmax,输出最大概率的token。
在这里插入图片描述
z 1 z^{1} z1作为待训练的向量,与每个 h h h做attention,得到 c 1 c^{1} c1作为输入
把得到的Token加入RNN网络, z 1 z^{1} z1训练后得到的 z 2 z^{2} z2作为隐状态,训练得到下一个Token
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/42404.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第三章变量

第三章变量 查看javaAPI文档的网址: https://www.matools.com/ 3.1程序中号的使用 1)当左右两边都是数值型时,则做加法运算 2)当左右两边有一方为字符串,则做拼接运算 3)运算顺序从左到右 System,out.prin…

Springboot+vue校园新闻网站idea

将系统需求进行分析总结,系统需求如下: 系统可以运行在Windows操作系统平台上,并通过友好的界面进行管理 系统用户分为游客,登录用户,管理员 游客可以浏览新闻 游客可以浏览评论 管理员具有用户所有的权限 管理员还可以…

别再把Tableau、PowerBI吹上天了,在中国根本用不起来,看看为啥

工作业务相关,这几年接触BI较多,借此浅聊下我对BI工具以及市场的看法,原创禁止转载。 1、BI并不玄乎,本质就是实现简单数据分析和可视化的工具 很多人觉得BI玄乎,其实很大程度是因为BI厂家给造的名词太多了&#xff…

Ajax学习:如何在Chrome网络控制台查看通信报文(请求报文/响应报文)

第一步:F12开启控制台, 第二步骤:打开网络标签 然后刷新页面 在网络标签位置处,这时候会出现所有发送的请求 点击第一个:会出现内容 预览部分:是解析 观察解析结果处 标头headers:主要观察请求头和请求体部分 GET请…

saltstack 企业级实战

一、自动化运维工具对比 使用所需软件配置单个服务器是一项相当简单的任务。 但是,如果许多服务器需要安装相同或相似的软件和配置,则该过程将需要大量的工时才能完成,这会耗尽您本已紧张的资源。如果没有某种形式的自动化,这项任务几乎无法完成。考虑到这一任务,开发了新…

【SpringCloud】06 链路跟踪 Sleuth+zipkin

链路追踪 在大型系统的微服务化构建中,一个系统被拆分成了许多微服务。这些模块负责不同的功能,组合成系统,最终可以提供丰富的功能。在这种架构中,一次请求往往需要涉及到多个服务。互联网应用构建在不同的软件模块集上&#xf…

【附源码】计算机毕业设计JAVA智慧养老院管理系统

【附源码】计算机毕业设计JAVA智慧养老院管理系统 目运行 环境项配置: Jdk1.8 Tomcat8.5 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: JAVA …

Assignment写作抄袭常见形式怎么了解?

直接照抄他人的想法并且当做自己的Assignment上交,这是最简单的Assignment抄袭行为。实际上,形式更微妙的Assignment抄袭形式更为常见。今天我们为大家介绍英国Assignment抄袭常见的形式,帮助大家做好英国Assignment查重,避免Assi…

React源码分析(一)Fiber

前言 本次React源码参考版本为17.0.3。 React架构前世今生 查阅文档了解到, React16.x是个分水岭。 React15及之前 在16之前,React架构大致可以分为两层: Reconciler: 主要职责是对比查找更新前后的变化的组件;R…

TMS Logging提供了短日志输出

TMS Logging提供了短日志输出 TMS Logging Compact跨平台框架以最小的代码量为各种目标提供了短日志输出。 TMS记录惊人属性: 登录到一个或多个输出处理程序,如控制台、HTML、文本、文本、CSV文件、TCP/IP、浏览器、Windows事件日志等,。。。…

代码质量与安全 | 使用Incredibuild加速Klocwork静态代码分析

Klocwork是一款优秀的静态代码分析和SAST工具,适用于 C、C、C#、Java、JavaScript、Python和Kotlin,可识别软件安全性、质量和可靠性问题,帮助强制遵守标准。 Incredibuild是一款加速编译工具,为C代码编译和分析提供强大的分布式处…

IMX6ULL学习记录——持续更新中......

环境搭建小记 问题集锦 1、nfs无法挂载的问题 原因:ubuntu16之后nfs默认使用nfs的版本为3,4 解决:原子用户手册中/【正点原子】I.MX6U网络环境TFTP&NFS搭建手册V1.3.1/第四章 4.3 NFS挂载文件系统 具体: sudo vim /etc/default/nfs…

CISAW信息安全保障人员认证考试难吗?

CISAW信息安全保障人员认证,作为信息安全行业相当热门的证书之一,其持证人数已超50%,在信息安全行业内占有一席之地,很多报考人都比较关心CISAW考试难不难?能通过吗?那接下来说一说CISAW证书考不好考&#…

《WEB前端框架开发技术》HTML5响应式旅游景区网站设计与实现——榆林子州HTML+CSS+JavaScript

👨‍🎓学生HTML静态网页基础水平制作👩‍🎓,页面排版干净简洁。使用HTMLCSS页面布局设计,web大学生网页设计作业源码,这是一个不错的旅游网页制作,画面精明,排版整洁,内容…

面向OLAP的列式存储DBMS-12-[ClickHouse]的管理与运维

ClickHouse 的管理与运维 ClickHouse 管理和运维相关的知识,该部分可以让 ClickHouse 变得更加安全与健壮。在前面演示的案例中,为了方便,我们一直使用默认的 default 用户,并且没有配置密码,这显然不符合生产环境的要…

怎么看电脑配置?电脑配置好不好?详细教程来了!

小伙伴出去买电脑,最关心的就是电脑配置问题。买回电脑后,首先应该是查看自己的电脑配置,看看是否跟商家宣传的一样,有没有出现被更换的问题。那么怎么看电脑配置呢?怎么看电脑配置和型号?接下来小编就跟大…

算法设计与分析 SCAU19184 传球游戏

19184 传球游戏 时间限制:1000MS 代码长度限制:10KB 提交次数:0 通过次数:0 题型: 编程题 语言: G;GCC;VC;JAVA Description n个同学站成一个圆圈,其中的一个同学手里拿着一个球,每个同学可以把球传给自己左右的两个同学中的一个(左右任意…

制作一个简单HTML抗疫逆行者网页作业(HTML+CSS)

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

Spring循环依赖

一、循环依赖全景图 二、什么是循环依赖问题? 1、什么是循环依赖: 类与类之间的依赖关系形成了闭环,就会导致循环依赖问题的产生。 比如下图中A类依赖了B类,B类依赖了C类,而最后C类又依赖了A类,这样就形…

免费分享一个springboot+vue学生选课管理系统,挺漂亮的

大家好,我是锋哥,看到一个不错的springbootvue前后端分离的学生选课管理系统,分享下哈。 项目介绍 这是一个采用前后端分离开发的项目,前端采用 Vue 开发、后端采用 SpringBoot Mybatis 开发。 项目部署 1. 将 studentms.sql…