摘要
语音研究有巨大的进步在过去使用以下的模式:
- 定义研究问题
- 收集语料针对性的衡量进展
- 解决这个研究问题
自然语言研究,另一方面,取得了典型的进步在没有任何数据语料的情况下,这能够测试研究的假设。
我们描述了
A
T
I
S
ATIS
ATIS试点语料库,设计的语料可以测量进展,在口语语言系统中,包括:a speech and natural language compoment.
这个尝点标注着全面收集语料和提供指导为未来的努力。
Introduction
- AITS 语料,提供了一个机会可以开发和评估语音系统。可以自发的理解语音。这个语料库区分与其他的程序,
- the Resource Management corpus 资源管理语料。
- 在至少四个重要方法中:
- Instead of being read,
- 语音收集发生在一个官方的环境中,而不是在语音室里。
A T I S ATIS ATIS,所支持的评估方法依靠有一个类似的表示关于每个语句的问答。 - database queries 数据库查询
- the acoustic speech data:声学语音数据
- the Official Airline Guide OAG
- preliminary 初步的,预备的。
- an exit questionnaire 离职问卷
- different transcriptions 三个不同的合成
- orthographic transcription 正字法的转录