【深度腐蚀】深入聊聊KMP算法

news2024/11/9 9:38:18

思路分析:

主串

str

遍历主串

j

子串

sub

遍历子串

i

KMP算法是一种字符串匹配算法,他通过Next 数组能使i不回退,这样大大减少了无效的比对,提高了字符串匹配的速度。

Next数组:

要想让i不回退,就需要让j回退到合适的位置继续匹配,例如

一开始ptr和str顺利互相匹配,i 和 j 会走到如图位置:

这时我们就不让i回退,而是让j回退到某个特殊位置,这个位置要能够让子串跳过的部分已经和主串相匹配,如图:

如图,i可以不回退j回退到c的位置,这样满足了子串跳过的部分(ab)已经和主串匹配:红色方框区域,我们只需要继续让i和j向后比较即可,我们发现主串和子串又不匹配,因此我们继续让j回退,如图:

这样我们能就很快速的不回退i就找到了对应的字符串。

我们发现,如果不回退i那么j的回退就变得很有讲究,第一次匹配失败后,我们把j回退到了下标为2的位置,我们为什么可以让他回退到下标为2的位置而不是从头开始?

仔细看上图,如果能够走到j位置,就说明红色框框里的都已经匹配上了,进而说明上下两个蓝色框框内容是一样的,如果从头开始还能找到一个蓝色框框,那我们就可以省去比较蓝色框框里的元素,也就是图中的a b 。

其实,j要回退到哪个位置,取决于j之前走到了哪个位置,也取决于子串本身,如上图中的子串,j走到了下标为5的位置,这也就说明前面的元素已经和主串匹配,恰巧在已经匹配了的五个元素中,还有一对相同的串:ab ,这样我们就可以直接让j回退到上图中的位置

因此我们可以得出一个结论:在i 和 j 匹配不上的时候,j应该回退到哪里,取决于子串本身,与主串没有直接关系

由上面的分析我们可以总结一下回退的位置

能在j前面找到两个相同的最大字符串 也就是两个蓝色框框

直接跳转到蓝色框框后面

没在j前面找到两个相同的最大字符串

j回退到第一个位置,从头开始比较

下面我们来看一个新的子串

按照我们的逻辑,下面的数字是j匹配到对应位置后如果不匹配j回退的位置,也就是我们经常说的Next数组(另第一个位置是-1,在程序中在对逻辑进行控制)

观察Next数组,我们会发现一个规律,Next数组中有些位置是递增的,比如1 2 3 4 5

但有些位置却又不是递增的,如1 2 1,这里的规律是什么呢

我们不妨先来观察一下间断的位置,很明显我们能看出来是两个蓝色框框不一样导致了i+1位置没有连续下去:

我们再来观察一下连续的情况:

相信这样很直观的感受到正是因为紫色框框对应的两个元素不一样了,所以才导致没有连续起来,而如果紫色框框处一样,自然就会连续起来。

那没有连续起来的位置怎么知道要回退到什么地方呢?我们知道Next数组中存的数字是要回退的位置也就是找到[0~k][x~i-1]这两个最大且相同的字符串,

其中i-1-x = k-0 由此我们发现:x由k的位置决定,因此我们只需要让k继续回退到能连续的位置即可

代码实现:

讲到这里相信大家已经明白了Next数组的本质和求法,接下来我们用代码来实现一下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/141742.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HTTPS】HTTPS过程详解,tcpdump抓包 全过程分析

RFC中的HTTPS交互过程如下: 抓包分析 Client Hello 客户端支持的TLS最高版本号 客户端生成的随机数 客户端支持的加密套件 主机名server_name cipher suite怎么理解 名字为 ECDH-ECDSA-AES128-SHA256 的CipherSuite 使用 ECDH做密钥交换, 使用ECDS…

21. 反爬工程师都会用的手段,IP限制反爬 - 爬虫训练场

本篇博客我们实现的案例是 IP 限制反爬,翻译过来就是每个 IP 在规定时间内限制访问次数。 例如,可以限制单 IP 每秒访问 5 次,超过之后就会返回 403 错误。 Flask 实现 IP 限制使用 Flask 插件自定义中间件限制 IP自定义请求钩子使用 Flask 插…

CSS3 滤镜效果

文章目录CSS3 滤镜效果概述说明使用案例鬼屋效果代码下载CSS3 滤镜效果 概述 在CSS3中,新增了滤镜效果,可以轻松实现黑白效果、复古效果、亮度效果等。 说明 语法 filter: 取值;filter属性取值 属性值说明brightness(百分比)亮度brightness()方法的…

一款数据可视化分析报表工具

在这个数据信息化时代,每分每秒都产生海量数据,在海量数据中,挖掘出有用的数据,并且能以直观的方式展示这些数据,变得尤为重要,大家或许还在为做报表感到为难,想在众多数据中处理,查…

leetcode-hot链表专题——206. 反转链表

206. 反转链表 递归法 ListNode* reverse(ListNode *pre,ListNode *cur){if(cur NULL) return pre;ListNode *next cur->next;cur->next pre;return reverse(cur,next);}ListNode* reverseList(ListNode* head) {return reverse(NULL,head);}迭代法 ListNode* rever…

Python爬虫编写乱码问题、验证码登录问题和IP代理问题解决

今天继续给大家介绍Python爬虫相关知识,本文主要内容是Python爬虫编写乱码问题、验证码登录问题和IP代理问题解决。 一、乱码问题解决 我们在使用Python爬虫爬取网页信息时,有时会遇上乱码问题(特别是爬取中文网页信息时)&#…

C语言进阶——指针(二)

一. 函数指针 说到指针,我们可以想到的是取地址操作符 int ADD(int a,int b) {return ab; } int main() {printf("%p\n", &ADD);return 0; } 如此,我们便可以得到一个地址 而我们便可以将这个地址存入到一个函数指针中 int(*p)(int,…

各种卷积的说明

一、普通卷积 1、多通道输入,单通道输出 输入为三通道的6*6*3,过滤器也是三通道的分别对应RGB三个通道。其中: 过滤器的通道数需要和被卷积目标的通道数保持一致。输出通道数卷积核个数计算过程包含了先卷积再融合的过程。3个通道各种卷积得…

图像处理:二值掩膜影像去噪与边缘强化

前言这篇博客主要解决的一个问题是掩膜图像的噪声去除和边缘强化,如下图1所示。可以看到掩膜图像上有很多的斑点噪声,而且掩膜的轮廓也不够清晰。所以我们的目标就是一方面尽可能把这些斑点噪声去除,另一方面尽量突出掩膜边界。另外处理后的掩…

c#入门-多播委托,匿名函数

多播委托 委托作为变量,也可以和-。委托可以和方法组相加,但方法组和方法组不能相加。 储存多个函数时,调用委托会按照加的顺序依次执行。但返回值只使用最后绑定的函数。 使用 – 时,如果储存了这个值,那么会移除第一…

深圳电子行业的mes系统的需求分析方法~先达智控

深圳电子行业mes系统的需求分析方法导读:如今,制造业的行业竞争越来越激烈,减少产品成本、提高产品质量,缩短开发周期,已成为当前企业生产与发展中的一个重点方向。而对电子行业而言,厂家着重考虑并解决了产…

我们想要赚钱,就要理解赚钱的本质、要素、公式和障碍

想要赚钱,就要先理解赚钱,只有理解了赚钱,才能够赚到钱。赚钱的本质是商业,而商业的本质是交易,那交易的本质又是什么呢?就是价值交换。价值交换,就是我们怎么能与别人达成合作,并且…

朱江明赋予了零跑新的活力

作为今年风云的智能自主化新能源汽车品牌,零跑汽,一度是人们谈论的热点话题。零跑汽车在今年也取得了非常不错的销量,这么一个响当当的品牌在之前其实发展几度遭遇挫折,而正是创始人朱江明几次将零跑汽车起死回生,赋予…

使用基于python的neurora进行表征相似性分析(RSA)

发现了一款用于表征分析的Python API,还是挺方便的,这里简单介绍一下进行表征相似性分析的使用方法。官方文档见https://neurora.github.io/documentation/index.html下载pip install neurora表征相似性分析的知识可见:https://zhuanlan.zhih…

QSqlDatabase::drivers()输出为空的解决办法

解决问题&#xff1a;今天项目中需要用到QT连接MYSQL数据库进行数据库访问&#xff0c;使用数据库驱动加载代码&#xff1a; qDebug()<<"数据库驱动&#xff1a;"<<QSqlDatabase::drivers();打印出来的结果居然为空“()”。 尝试解决方案&#xff1a; …

逻辑漏洞渗透与攻防(三)之登录前端验证漏洞

目录 前言 登录前端验证漏洞 忘记密码 给邮箱/手机发验证码 前端验证绕过 设置新密码时改他人密码 ​编辑 某网站密码找回功能 链接的形式-链接token参数可逆 服务端验证逻辑缺陷 登录状态下修改密码等验证条件 参数带用户名等多阶段验证 重置密码 重置后的默认密…

软件产品科技成果鉴定需要提供哪些材料?软件测试费用怎么算?

一、软件产品科技成果鉴定是什么? 软件产品科技成果鉴定是有效评价科技成果质量和水平的方法之一&#xff0c;也是鼓励科技成果通过市场竞争等方式得到有效的评价和认可&#xff0c;可以推动科技成果的进步和转化。软件产品科技成果鉴定测试报告是申报国家、省、市科技成果奖…

SQLite Database Introduction

Use SQLite installed on Linux (CentOS7) to introduce.(You can also use python to install SQLite3 for learning.)•SQLite Preface•Introduction to SQLite Features•SQLite Data Type•SQLite Constraint•SQLite Syntax•SQLite Join•SQLite Database & Table•…

第01讲:ElasticSearch安装

一、什么是ElasticSearch 二、ElasticSearch的安装 Elasticsearch 分为 Linux 和 Windows 版本&#xff0c;基于我们主要学习的是 Elasticsearch 的 Java 客户端的使用&#xff0c;所以课程中使用的是安装较为简便的 Windows 版本。 2.1、Windows系统下安装ElasticSearch W…

KubeSphere 使用 OpenLDAP 进行统一认证完全指南

作者&#xff1a;申红磊&#xff0c;青云QingCloud 容器解决方案架构师&#xff0c;开源项目爱好者&#xff0c;KubeSphere Member。 背景 在实际使用中&#xff0c;会有一些用户&#xff0c;在不同场景中经常碰到 OpenLDAP 对接问题&#xff1a; 能否对接 LDAP&#xff1f;对…