1. 概念学习
WER(word error rate): 单词错误率,是评价asr系统的一种重要指标,越低越好
是Continuous integrate-and-fire的简称,集成和发射,翻译成积分不太合理,可理解为求和
2. 思想
一个人说了几句话,在说第一句话的时候会不断地对输入的信号集成,说完这句话(达到了一定阈值)输出这些集成的信息到后续的识别模块,下一句话进行同样的操作。
2. 结构
总体结构如上图
图2中CIF的计算过程如上图3
算法流程为
可以看出,输入是一个序列,输出也是一个序列
输入是encoder模块输出的h序列,输出是CIF模块输出的C序列
论文地址: