在Word中,用VBA比较两段文本的相似度

news2024/9/21 20:41:44

效果1:

去掉字符串中回车,进行改进后效果:

代码:

Function LevenshteinDistance(s As String, t As String) As Integer
    Dim d() As Integer
    Dim i As Integer
    Dim j As Integer
    Dim cost As Integer

    Dim sLen As Integer
    Dim tLen As Integer

    sLen = Len(s)
    tLen = Len(t)

    ReDim d(sLen, tLen)

    For i = 0 To sLen
        d(i, 0) = i
    Next i

    For j = 0 To tLen
        d(0, j) = j
    Next j

    For i = 1 To sLen
        For j = 1 To tLen
            If mid(s, i, 1) = mid(t, j, 1) Then
                cost = 0
            Else
                cost = 1
            End If

            d(i, j) = GetMinValue(GetMinValue(d(i - 1, j) + 1, d(i, j - 1) + 1), d(i - 1, j - 1) + cost)
        Next j
    Next i

    LevenshteinDistance = d(sLen, tLen)
End Function
Function GetMinValue(ByVal Num1, ByVal Num2)
    Dim MinValue As Double
    MinValue = Num1
    If Num2 < MinValue Then MinValue = Num2
    GetMinValue = MinValue
End Function
Function similarity1(s As String, t As String) As Double
    Dim maxLen As Integer
    Dim dist As Integer
    If Len(s) > Len(t) Then
        maxLen = Len(s)
        
    Else
        maxLen = Len(t)
    End If
    If maxLen = 0 Then
        similarity1 = 1#  ' 如果两个字符串都为空,视为完全相似
        Exit Function
    End If

    dist = LevenshteinDistance(s, t)
    similarity1 = 1# - (dist / maxLen)
End Function

Sub TestSimilarity()
    Dim str1 As String
    Dim str2 As String
    Dim similarity As Double

    str1 = ActiveDocument.Content.Paragraphs(1).Range.text
    str2 = ActiveDocument.Content.Paragraphs(3).Range.text
    str1 = Replace(str1, vbCr, "")
    str2 = Replace(str2, vbCr, "")
    
    similarity = similarity1(str1, str2)
    MsgBox "文本相似度: " & Format(similarity, "0.00%")
End Sub

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2131917.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

nginx实现https安全访问的详细配置过程

文章目录 前言什么是 HTTP&#xff1f;什么是 HTTPS&#xff1f;HTTP 和 HTTPS 的区别为什么 HTTPS 被称为安全的&#xff1f;配置过程配置自签名证书 前言 首先我们来简单了解一下什么是http和https以及他们的区别所在. 什么是 HTTP&#xff1f; HTTP&#xff0c;全称为“超…

IDEA 怎么编辑文件模板

1.打开设置2.打开编辑者&#xff0c;选择编辑文件模板 3.点击加号4.先随便编译一次5.之后编辑文件模板就有了

电脑浏览器访问华为路由器报错,无法访问路由器web界面:ERR_SSL_VERSION_OR_CIPHER_MISMATCH 最简单的解决办法!

This site can’t provide a secure connection192.168.2.1 uses an unsupported protocol. ERR_SSL_VERSION_OR_CIPHER_MISMATCH 以上是chrome浏览器访问报错 Secure Connection Failed An error occurred during a connection to 192.168.2.1. Peer using unsupported versio…

python 异步执行 apply_async 方法

1.项目需要读取hive表数据&#xff0c;并对返回的数据进行解析&#xff1b; select * from table ; 2.返回数据&#xff0c;根据库、表&#xff0c;对其进行 下一步执行&#xff1b; 中间遇到一个棘手的问题&#xff0c;在python线程池中&#xff0c;使用异步非阻塞 apply_a…

(k8s)kubernetes 挂载 minio csi 的方式(pod挂载pvc存在csi驱动问题,挂载不上)

一、安装Minio&#xff08;Minio分布式集群搭建部署_minio集群最少几台-CSDN博客&#xff09; 生成accessKeyID和secretAccessKey&#xff1a; 二、安装csi-s3插件(在k8s集群上) 首先我们把插件的yaml文件都下载下来&#xff0c;为了保证版本测试的一致性&#xff0c;我们下载…

如何在社交媒体上赚取(可观的)收入

有很多百万富翁是通过社交媒体粉丝建立起他们的财富的&#xff0c;而且其中大部分并不是Instagram网红或YouTube明星。 例如&#xff0c;Nick Huber通过社交媒体粉丝建立了几家企业&#xff0c;这些企业现在每月创造40万美元的收入。 而George Blackman在Twitter上仅有不到8,0…

微信自动回复设置真嘎嘎好用!

无论是商户、个人品牌还是普通用户&#xff0c;及时回应朋友和客户的信息至关重要。然而&#xff0c;手动一一回复既耗时又容易遗漏&#xff0c;这时&#xff0c;微信的自动回复功能就显得尤为重要。 今天&#xff0c;就教大家一招——通过个微管理系统&#xff0c;实现微信自…

怎么在线制作活码二维码?活码在电脑快速制作的方法

怎么制作活码类型的二维码&#xff1f;活码是现在很常用的一种内容展示&#xff0c;将内容通过二维码来展示&#xff0c;可以长期提供内容展示&#xff0c;而且在更新内容无需重新生码&#xff0c;可以直接在原码中修改。与其他方式相比有效提高内容传播的效率&#xff0c;在节…

【信号】SIGCHLD信号--了解

SIGCHLD是多少号信号呢&#xff1f;17号 我们知道用wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作…

iptables实现内外网ip转换

准备三台虚拟机 内网访问外网 网络设置为仅主机&#xff08;关闭DHCP功能&#xff09; 设置一台双网卡机器充当iptables服务器 设置一台内网机 设置一台外网机&#xff0c;下载并开启httpd服务 在iptables服务器上设置iptables 在/etc/sysctl.conf中添加net.ipv4.ip_forwar…

零基础入门大模型,带你构建第一个大模型:实战指南

2017年是机器学习领域历史性的一年。Google Brain 团队的研究人员推出了 Transformer&#xff0c;它的性能迅速超越了大多数现有的深度学习方法。著名的注意力机制成为未来 Transformer 衍生模型的关键组成部分。Transformer 架构的惊人之处在于其巨大的灵活性&#xff1a;它可…

2024年上半年互联网黑灰产研究报告

2024年上半年&#xff0c;黑灰产从业人员人数超过427万&#xff0c;威胁猎人监测到国内作恶手机号数量高达323万&#xff0c;日活跃风险IP数量1136万&#xff0c;涉及洗钱银行卡数量19.5万。 近年来&#xff0c;数字化与实体经济的融合日渐深入&#xff0c;大规模业务线上场景…

Golang开发之路

✨✨ 欢迎大家来到景天科技苑✨✨ &#x1f388;&#x1f388; 养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; &#x1f3c6; 作者简介&#xff1a;景天科技苑 &#x1f3c6;《头衔》&#xff1a;大厂架构师&#xff0c;华为云开发者社区专家博主&#xff0c;…

做谷歌seo,b端跟c端有什么区别吗?

事实上大部分都没有区别&#xff0c;谷歌seo要做的事情其实都差不多&#xff0c;站内优化&#xff0c;站外推广&#xff0c;唯一不同的&#xff0c;就是在关键词的调研以及创建内容的时候不同&#xff0c;不过光是这一点不同&#xff0c;就能导致B端网站跟C端网站的决定性差异&…

HTML + js 生成一个线路走向图,可以标记总共有多少站,用户到达第几站了

文章目录 前言一、用途二、使用步骤1.轨迹代码2.运行前言 HTML + js 生成一个线路走向图 例如:用来记录用户到达那一站了,可以标记总共有多少站,用户到达第几站了 提示:以下是本篇文章正文内容,下面案例可供参考 一、用途 用来记录用户到达那一站了,可以标记总共有多少…

保姆级AI编程Cursor-Vscode使用教程

一: 下载&#xff0c;安装(输入语言后&#xff0c;然后迁移插件) 下载地址&#xff1a;https://www.cursor.com/settings 二: 登录 三. 玩AI--给一张UI图&#xff0c;一键生成需求代码&#xff08;需要自己去小改一下&#xff0c;大部分都可用&#xff09; 四、项目实践-优…

苹果手机管理软件哪个好用 苹果手机如何从安卓手机导入数据

随着科技的发展&#xff0c;手机已经成为我们日常生活中不可或缺的一部分。苹果手机以其稳定的性能和卓越的用户体验受到广大用户的喜爱。然而&#xff0c;如何高效管理苹果手机以及如何从安卓手机导入数据&#xff0c;是许多用户在使用过程中常遇到的问题。本文将围绕“苹果手…

异步和多线程

概念 异步&#xff08;Asynchronous&#xff09;&#xff1a; 异步是一种编程模型&#xff0c;其核心思想是在等待I/O操作&#xff08;如文件读写、网络通信等&#xff09;完成时&#xff0c;不阻塞当前线程的执行&#xff0c;而是允许程序继续执行其他任务。当I/O操作完成后&…

Linux系统调用进程标识符

目录 一、冯诺依曼体系结构 二、操作系统 2.1什么是操作系统&#xff1f; 2.2为什么需要操作系统&#xff1f; 2.3怎么管理&#xff1f; 2.4总结 2.5系统调用 三、进程的理解 3.1进程的基本概念 3.2对进程的描述 3.3对进程的组织 3.4task_struct内容的分类 3.5Linux下…

2024年【危险化学品生产单位安全生产管理人员】考试资料及危险化学品生产单位安全生产管理人员考试试卷

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 2024年危险化学品生产单位安全生产管理人员考试资料为正在备考危险化学品生产单位安全生产管理人员操作证的学员准备的理论考试专题&#xff0c;每个月更新的危险化学品生产单位安全生产管理人员考试试卷祝您顺利通过…