NLP：文本相似度计算

news2026/2/12 17:11:41

前面我们已经实现了把长段的句子，利用HanLP拆分成足够精炼的分词，后面我们要实现“联想”功能，我这里初步只能想到通过文本相似度计算来实现。下面介绍一下文本相似度计算

（当然HanLP也有文本相似度计算的方法，这里我应该上一节也说过，但是使用之后效果并不理想，因此，我们要换其他的方法）

这里我们采取的是text2vec，事实上网上通用的是word2vec,但是他要求自己训练模型，而且github上的流程我没看得懂，所以我就在github上找了别人现成的模型来使用

下载

pip install torch # conda install pytorch
pip install -U text2vec

这里下载第二个的时候建议用上镜像，并且请在网络较好的地方下载

测试

import sys


sys.path.append('..')
from text2vec import Similarity

# Two lists of sentences
sentences1 = ['c++开发十年经验',
              '善于沟通,领导他人',
              '全栈开发',
              '你好']

sentences2 = ['擅长编程',
              '体贴',
              'web 开发',
              '有领导能力']

sim_model = Similarity()
for i in range(len(sentences1)):
    for j in range(len(sentences2)):
        score = sim_model.get_score(sentences1[i], sentences2[j])
        print("{} \t\t {} \t\t Score: {:.4f}".format(sentences1[i], sentences2[j], score))

放上运行结果

可以发现，联想的效果还是有的，至少在我当前的需求下，它是完全够用的。

We couldn't connect to 'https://huggingface.co'

这是一个很关键的报错，具体可以参考这位老哥的博客：解决办法

（不过确实，因为围墙的存在，在一定程度上是阻碍了国内科研和学习的发展）

亲测可行的方法则是在代码前面补充上下面两行代码（即利用镜像）

import os
os.environ['HF_ENDPOINT']='https://hf-mirror.com'

之后如果有闲工夫的话，我还是想利用word2vec来训练一个自己的模型，毕竟数据摆在这里，不用而去调别人现成的模型，多少是不会满足特定场景的需求。

参考文献：

python实现文本相似度的计算

python利用word2vec计算文本相似度

wiki. model下载

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1505874.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

NLP：文本相似度计算

相关文章

Day33-计算机基础3

第五十三天| 1143.最长公共子序列、1035.不相交的线、53. 最大子序和

no main manifest attribute,in xxx.jar(关于Spring项目，无法在云服务器上运行jar包的解决方法）

基于springboot+vue实现高校学生党员发展管理系统项目【项目源码+论文说明】计算机毕业设计

P8680 [蓝桥杯 2019 省 B] 特别数的和：做题笔记

复盘-word

会话_过滤器_监听器笔记

缓解LLM的局限性：微调 VS RAG

Kap - macOS 开源录屏工具

Spring Boot 中使用 Redis + Aop 进行限流

自然语言发展历程

docker学习（十四）docker搭建私服

深入浅出计算机网络 day.1 概论② 因特网概述

云原生之容器编排实践-ruoyi-cloud项目部署到K8S：网关服务、认证服务与系统服务

【Linux】深入探究CentOS防火墙（Firewalld）：基础概念、常用命令及实例操作

OpenStack之Glance

【Java.mysql】——增删查改(CRUD)之增查(CR) 附加数据库基础知识

Linux文件与文件系统的压缩

三、实战篇优惠券秒杀

【JavaScript】JavaScript 变量 ① ( JavaScript 变量概念 | 变量声明 | 变量类型 | 变量初始化 | ES6 简介 )