1. 数据 用于文献的摘要的相似度的计算 ## 导包 import pandas as pd import jieba import gensim from gensim.models import Doc2Vec from gensim.models.doc2vec import TaggedDocument 再定义停用词典,用于分词,还可以自己定义一个分词词典 ## 读入数据 papers = pd.</