kmp算法记录

news2025/1/10 23:24:49

看了如何更好地理解和掌握 KMP 算法?之后,做的整理

相关知识

尽管普通模式匹配的时间复杂度是O(mn),KMP 算法的时间复杂度是O(m+n),但在一般情况下,普通模式匹配的实际执行时间近似为O(m +n),因此至今仍被采用。KMP算法仅在主串与子串有很多“部分匹配”时才显得比普通算法快得多,其主要优点是主串不回溯。

什么是前缀,后缀?

以字符串“happy”为例

  • 前缀:h,ha,hap,happ 不包括最后一个字符
  • 后缀:appy,ppy,py,y 不包括第一个字符

部分匹配表(Partial Match Table),简称PMT,将其中的值定义为前缀与后缀的集合交集中最长的元素长度

例如对于:aba:

  • 前缀:a,ab
  • 后缀:ba,a

两者交集的最大长度是a字符,长度为1,则对应的PMT值为1

对于字符串"abababca",PMT表为:

在这里插入图片描述

再补充上表中“abab”的PMT值:

  • 前缀:a,ab,aba
  • 后缀:bab,ab,b

交集最大长度为ab字符,长度为2,则对应的PMT值为2

如何使用PMT表加速比较?

在这里插入图片描述

以上图为例:

前边所说的模式字符串 PMT 的性质,主字符串中 i 指针之前的 PMT[j −1] 位就一定与模式字符串的第 0 位至第 PMT[j−1] 位是相同的。

i处发生失配,则s1中的i-j到i与s2中的0到j一定是相同的,在图a中,i和j之前均是ababab。我们可以把s1中阴影部分的abab看作是ababab的后缀,s2中阴影部分的abab看作是ababab的前缀阴影部分相同,所以不需要再去进行比较,从而j直接退回到图b中所在的位置。

阴影部分如何得到? 通过PMT表,PMT[j-1]元素的值就是字符串“ababab”的前后缀交集的最大长度。j-1的原因是,在j处发生失配,s1中的i-j到i与s2中的0到j是相同的,在我看来,这两者相同,PMT表使用起来才有意义。

可以看到如果是在 j 位 失配,那么 j 指针回溯的位置的其实是第 j −1 位的 PMT 值。我们为了编程方便,将PMT数组整体后移一位,空出来0索引的位置,设置为-1,这样做仅仅是为了方便编程!把新数组称为next数组,那么PMT[j-1]==next[j]:

在这里插入图片描述

KMP算法主体

相比于普通模式匹配算法,kmp的优势在于,主串不回溯。

/**
     * kmp算法
     * @param s1 主串
     * @param s2  字串
     * @return 子串在主串中的位置
     */
public static int kmp(String s1,String s2){
    int i=0,j=0;
    int[] next = getNext(s2);
    while (i < s1.length() && j <s2.length()){
        if(j == -1 || s1.charAt(i) == s2.charAt(j)){  //这里和普通的算法一样,当主串与字串中字符相同时,继续往后遍历
            i++;
            j++;
        }else {  //不同之处,发现不匹配时,j退到next[j]
            j = next[j];
        }
    }
    if( j == s2.length()){
        return i-j;
    }
    return -1;
}

如何求next数组?

在这里插入图片描述
在这里插入图片描述

求next数组的过程同样也看成字符串匹配的过程,将上面的s2看成主串,将s2的前缀看成字串。

从主串的第一位(不包括0索引位置)开始对自身进行匹配,能匹配的最大长度就是当前位置的next值。

为什么j=next[j],我的理解是找阴影部分(本文的第二张图)。( j = next[j] == 4 数组的含义,表示在 j 位置字串和主串不匹配的话。j 需要回退到位置为 4 的地方。)

public int[] getNext(String s2) {
        int[] next = new int[s2.length()];
        next[0] = -1;
        int i = 0, j = -1;
        while (i < s2.length() - 1) {
            if (j == -1 || s2.charAt(i) == s2.charAt(j)) {
                i++;
                j++;
                next[i] = j;
            } else {
                j = next[j]; 
            }
        }
        return next;
    }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/21570.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一文弄懂CNN中的BatchNorm

1. 引言 本文重点介绍BatchNorm的定义和相关特性&#xff0c;并介绍了其详细实现和具体应用。希望可以帮助大家加深对其理解。 嗯嗯&#xff0c;闲话少说&#xff0c;我们直接开始吧&#xff01; 2. 什么是BatchNorm&#xff1f; BatchNorm是2015年提出的网络层&#xff0c…

一文讲懂高并发分布式系统,听不懂你来打我

众所周知&#xff0c;在分布式系统的设计与建立中&#xff0c;其中一个要考虑的问题就是高并发。 那么&#xff0c;到底什么是高并发呢? 简单来说高并发就是指通过设计系统&#xff0c;使之实现可以同时处理多个请求的能力。 现在的高并发系统主要存在有两种实现方式&#…

Utilizing Transformer Representations Efficiently

ContentsIntroductionDifferent Pooling StrategiesPooler OutputLast Hidden State OutputHidden States OutputMore...ReferencesIntroduction 在用预训练模型微调时&#xff0c;我们比较习惯于直接用 Transformer 最后一层的输出经过 FC / Bi-LSTM… 后输出最终结果。但实际…

Perforce P4V 资源汇总

Perforce P4V 入门https://download.csdn.net/download/love_xiaozhao/20533522 P4 Command Referencehttps://download.csdn.net/download/love_xiaozhao/20534062 P4V文件状态命令速查表https://download.csdn.net/download/love_xiaozhao/20533404PerforcexHelix分支策略_…

【android Framework 探究】android 13 aosp编译全记录

写在开始 自从关注Framework这一块儿&#xff0c;就有了自己编译aosp刷机的想法&#xff0c;模拟器当然是可以的&#xff0c;但是体验感还不能和真机想比&#xff0c;于是买一个二手piexl的想法就有了&#xff0c;根据预算选定piexl 5&#xff0c;支持最新的android 13&#xf…

编码命名方式知多少

文章目录1.camel case &#xff08;驼峰式&#xff09;2.snake case &#xff08;蛇形式&#xff09;3.kebab case &#xff08;烤串式&#xff09;4.匈牙利命名法5.小结参考文献编码时&#xff0c;命名无处不在。比如我们需要对文件命令&#xff0c;对目录命名&#xff0c;对变…

m低信噪比下GPS信号的捕获算法研究,使用matlab算法进行仿真

目录 1.算法概述 2.仿真效果预览 3.MATLAB部分代码预览 4.完整MATLAB程序 1.算法概述 GPS系统的星座部分是由21颗工作卫星和3颗在轨备用卫星组成&#xff0c;其高度为20183km&#xff0c;这24颗卫星均匀分布在6个等间隔的、相对轨道面倾角为55的近圆轨道上。 ​ GPS卫星的…

处理csv、bmp等常用数据分析操作--python

请先看思维导图&#xff0c;看是否包含你所需要的东西&#xff0c;如果没有&#xff0c;就可以划走了&#xff0c;免得浪费时间&#xff0c;谢谢 条条大路通罗马&#xff0c;我只是介绍了我掌握的这一条&#xff0c;不喜勿喷&#xff0c;谢谢。 目录 一、创建文件夹&#xff0…

一行日志,让整个文件导出服务导出内容都为空..

输出一行日志&#xff0c;却让整个文件上传服务挂了...问题分析小结问题 直接上代码&#xff0c;看看有无眼尖的小伙伴发现问题&#xff1a; // 设置参数 MultiValueMap<String, Object> param new LinkedMultiValueMap<>(); FileSystemResource resource new …

log4cpp初入门

目录下载与安装log4cpp框架CategoryAppenderLayoutPriortyOutput功能日志级别⽇志格式化⽇志输出日志回滚日志配置文件下载与安装 https://sourceforge.net/projects/log4cpp/ tar xvf log4cpp-1.1.3.tar.gz cd log4cpp ./configure make make check make install ldconfig…

轻松玩转树莓派Pico之三、Windows+Ubuntu虚拟机模式下VSCode C语言开发环境搭建

目录 1、VSCode下载与安装 2、VSCode基础插件安装 3、SSH连接与配置 4、SSH免密登录 5、Pico编译 工欲善其事&#xff0c;必先利其器。之前的介绍的Pico流程都是通过命令行编译&#xff0c;没有进行更深入的介绍&#xff0c;本文将介绍Pico的VSCode-C语言开发环境搭建与配…

Rust WASM 与 JS 计算素数性能对比

前言 刚接触Rust wasm&#xff0c;请各看官高抬贵手。 简介 根据网上资料&#xff0c;使用 wasm-pack 搭配wasm-bindgen将Rust代码编译成 wasm。 搭好环境后&#xff0c;想对比一下rust-wasm与js的性能差距。 环境 OS: Deepin 20.7.1 apricotKernel: Linux 5.15.34CPU: Int…

LeetCode单周赛第320场 AcWing周赛第78场总结

1. LeetCode单周赛第320场 1.1 数组中不等三元组的数目 1.1.1 原题链接&#xff1a;力扣https://leetcode.cn/problems/number-of-unequal-triplets-in-array/ 1.1.2 解题思路&#xff1a; 暴力遍历咯。 1.1.3 代码&#xff1a; class Solution { public:int unequalTripl…

JAVA的学习心路历程之JDK基础入门(上)

任务需要&#xff0c;需要我学java调用linux下的动态库&#xff0c;于是搜寻java知识更新这篇。 从我上大学起我就听别人说JAVA&#xff0c;不不&#xff0c;应该是初中&#xff0c;那时候流行带键盘的智能手机&#xff0c;里面有好些个游戏都是JAVA写的&#xff0c;可见JAVA有…

【JavaWeb】HTML

HTML1 HTML概念1.1 超文本1.2 标记语言2 HTML的入门程序3 HTML语法规则4 使用idea创建StaticWeb工程5 HTML的各个标签的使用5.1标题标签5.2段落标签5.3换行标签5.4无序列表标签5.5超链接标签5.6图像标签5.7块标签6.使用表格标签展示数据6.1未合并单元格6.2合并单元格-合并列6.3…

套接字+网络套接字函数+客户端大小写程序

NAT映射 一般来说&#xff1a;源主机和目的主机都属于局域网&#xff0c;也就是ip地址可能相同 但是&#xff1a;路由器一般是公网ip,即整个网络环境可见 每一个路由器会维护一个NAT映射表 路由器的ip一般是固定的公网ip路由器与把与它相连的主机&#xff1a;私有ip端口号映射…

Java-多线程-ThreadPoolExecutor

前言 前面我们讲解线程的时候&#xff0c;讲到了使用Executors创建线程池&#xff0c;但是它里面所有方法可变的参数太少&#xff0c;不能很好的进行自定义设置&#xff0c;以及以后的扩展&#xff0c;更合理的使用cpu线程的操作&#xff0c;所以使用ThreadPoolExecutor创建线程…

SpringBoot集成webservice

前言 之前在工作中&#xff0c;有时候需要去对接第三方的医院&#xff0c;而很多医院的his系统用的都是老技术&#xff08;WebService&#xff09;。一直在对接webservice接口&#xff0c;却不知道webservice接口是怎么实现的&#xff0c;这一次&#xff0c;我们来一探究竟。 …

Android Compose Bloom 项目实战 (一) : 项目说明与配置

1. 项目介绍 Bloom是谷歌 AndroidDevChallenge (Android 开发挑战赛) 中的一期活动&#xff0c;目的是为了推广Compose&#xff0c;非常适合用来练手&#xff0c;通过这个项目&#xff0c;我们可以很好的入门Compose。本文介绍了如何从零开始&#xff0c;开发这个Compose项目。…

计算机系统结构期末复习

名词解释 程序访问局部性 时间局部性是指最近被访问过的数据很可能再次被访问 空间局部性是指最近被访问过的存储空间的附近空间可能会被访问 计算机体系结构 计算机体系结构是程序员所看到的计算机属性&#xff0c;即概念性结构与功能特性 窗口重叠技术 为了能更简单、更直接…