来源: AINLPer公众号(每日干货分享!!)
编辑: ShuYini
校稿: ShuYini
时间: 2024-3-11
该数据集由华盛顿大学的研究人员提出,它是一个大规模的常识推理挑战数据集,包含约44,000个问题,旨在评估和提升NLP模型的常识推理能力。
具体来说,WinoGrande数据集由多个部分组成,包括训练集、验证集和测试集。数据集的结构包括句子、两个选项(option1和option2)、以及正确答案(answer),这些问题通常以填空形式出现,要求选择正确的选项来完成句子。该数据集还通过AfLite算法减少了数据集中的偏见,以确保模型不是通过利用数据集中的特定模式或偏见来解决问题,而是真正理解了常识推理。该数据集为研究者提供了一个平台,以探索和改进NLP模型在常识推理任务上的表现。它特别强调了模型在理解和生成与常识相关的文本方面的能力。
相关数据集与论文获取,GZ: AINLPer公众号 回复:WG数据集