一、介绍
代码:https://github.com/ljynlp/W2NER
论文:Unified Named Entity Recognition as Word-Word Relation Classification(武汉大学)
在平铺实体、重叠实体、非连续实体的数据集上,取得了SOTA的效果
建模方式:word-word的关系分类(中文:字-字的关系分类)
Word-Word的关系类别
NONE
NNW:Next Neighboring Word,表示两个word是在同一个实体中相邻的位置;
THW-:Tail-Head-Word-**,表示两个word是在同一个实体中,且分别是实体的结尾和开始字符,**表示实体类别;
通过这三个关系类别,可以标记一个句子中的所有平铺、重叠、非连续实体