目录
自然语言处理概要
分词与词性标注
N-Gram 分词
分词及词性标注的难点
法则式分词法
全切分
FMM和BMM
Bi-direction MM
优缺点
统计式分词法
N-Gram概率模型
HMM概率模型
词性标注(Part-of-Speech Tagging)
HMM
文本挖掘概要
信息检索(Information Retrieval)
全文扫描
关键词
逐项反转
签名文件
向量空间模型
关键词提取
文本非结构数据转结构
词袋模型
无监督词嵌入模型-Glove
PCA
矩阵分解
有监督的词嵌入模型—Word2Vec
Skip-Gram
CBOW
自然语言处理概要
分词与词性标注
N-Gram 分词
<