【leetcode 力扣刷题】字符串匹配之经典的KMP!!!

news2025/1/18 11:42:13

字符串子串匹配相关

  • 28. 找出字符串中第一个匹配项的下标
    • 暴力求解
    • KMP
  • 459. 重复的子字符串
    • 暴力求解
    • 在S+S中找S

以下是能用KMP求解的算法题,KMP是用于字符串匹配的经典算法【至今没学懂………啊啊啊】

28. 找出字符串中第一个匹配项的下标

题目链接:28. 找出字符串中第一个匹配项的下标
题目内容:
在这里插入图片描述
题意还是很好理解的,要在字符串haystack中查找一个完整的needle,即字符串匹配。

暴力求解

暴力求解就是用两层循环:从haystack的第i个字符开始,needle从第一个字符开始j = 0,之后依次判断needle[j]和haystack[j+i]是否相等。如果不相等,说明haystack中从第i位开始的子串和needle是不匹配的。之后j要回溯到j = 0,i向后移动一位。代码实现(C++):

class Solution {
public:
    int strStr(string haystack, string needle) {
    	//haystack下标最大值
        int n = haystack.size() - needle.size();
        //外层是haystack从下标i开始和needle逐字符比较
        for(int i = 0 ; i <= n; i++){
            int j = 0;
            //needle从j=0开始
            while( j < needle.size()){
            	//如果有相等就退出循环,开启下一轮
                if(haystack[j+i] != needle[j])
                    break;
                j++;
            }
            //如果是遍历完needle都与从i开始的子串相同,就找到了
            if(j == needle.size())
                return i;
        }
        return -1;
    }
};

KMP

暴力求解中,如果当前的needle[j]和haystack[j+i]不匹配,j会回退到0,i回退到i+1,这里是可以优化的,KMP就是为了减少回溯
KMP是用于求解字符串匹配的算法,在当前needle[j]和haystack[j+i]不匹配时,能够快速找到j应该移动到的位置,而不是直接回溯到开头。比如下面图中s[i]和p[j]不匹配后,由于p[j]前面的子串的前缀ab和后缀ab相同,因此j不需要回溯到0,是移动到abc中c的位置,继续和s[i]比较。
在这里插入图片描述
KMP中一个重点是最长相同前后缀长度什么是前缀:一个字符串从第一个字符开始的,不包括最后一个字符的子串;什么是后缀:一个字符串中从最后一个字符开始的,不包括第一个字符的子串。
最长相同前后缀长度,就是一个字符串中相同的前后缀里面,最长的一组的长度。比如下图里对于ababa这个字符串,相同前后缀有两组,但是我们需要最长那组的长度。因为字符串匹配过程中,S[i]和P[j]不匹配时,j是要根据P[j]前面子串的前后缀长度来回退的,选择最长前后缀能够保证不遗漏答案。
在这里插入图片描述
KMP算法需要求模式串P的next数组,实际上这个next数组记录的就是P所有从第一个字符开始的子串的最长相同前后缀的长度:next[i]表示下标0到下标i这段子串的,最长相同前后缀的长度。假设有next[i-1]=m,那么next[i] <= next[i-1]+1,其中取等需要P[next[i-1]] == P[i]。【因为next[i-1]里面存的是长度,当作下标的时候就是最长相同前后缀里面那个前缀后面一个字符;而P[i]就是P[i-1]最长相同前后缀的后缀的后后面一个字符】。
在这里插入图片描述
如果P[next[i-1]] != P[i],那么就要判断P[next[next[i-1]-1]]和P[i]的关系,直到下标回溯到0或者找到了和P[i]匹配的位置。
代码如下(C++):

ector<int> Kmp_Next(string s){
    int n = s.size();
    vector<int>  next(n, 0);
    //next数组中存的是对应下标处子串【包括下标位置】的最长前后缀的长度
    next[0] = 0;
    for(int i = 1; i < n; i++){
        int j = next[i-1];
        while(j>0 && s[j] != s[i]) //不匹配就循环回退
            j = next[j-1];
        if(s[i] == s[j]) //如果匹配,长度在j的基础上+1
            j++;
        next[i] = j;
    }
    return next;        
}

KMP的匹配过程:首先求得了模式串P的next数组,即每个P[0]~P[i]这一段这串中最长的相同前后缀的长度;然后P中的字符从P[j=0]开始,S中的字符也从S[pos=0]开始,判断S[pos]和P[j]是否匹配,如果匹配就j++,pos++向后移动;如果不匹配,j就根据next[j-1]回退,并判断回退后新的下标j对应的P[j]和S[pos]是否匹配,如果不匹配继续回退,直到匹配或者j=0。实现过程如下:

  • 要先找到P中哪个字符和当前的S[pos]匹配。因为如果P[j] != S[pos],j需要根据next数组循环回退j = next[j-1],那么就先找到能够匹配的j,才停止;
while(j>0 && haystack[pos] != needle[j])
	j = next[j-1];
  • 上面循环退出有两种情况,P[j] == S[pos]或者j == 0;如果是前者,自然pos++,j++;如果是后者,就只有pos++;
if(haystack[pos] == needle[j]){
	pos++;
	j++;
 } 
else
	pos++;  
  • 最后停止要么是j遍历到了最后,要么是pos遍历到了最后。只有j遍历到最后才算完全匹配;

完整代码如下(C++):


class Solution {
public:
	//先求needle的next数组
    vector<int> Kmp_Next(string s){
        int n = s.size();
        vector<int>  next(n, 0);
        //next数组中存的是对应下标处子串【包括下标位置】的最长前后缀的长度
        next[0] = 0;
        for(int i = 1; i < n; i++){
            int j = next[i-1];
            while(j>0 && s[j] != s[i])
                j = next[j-1];
            if(s[i] == s[j])
                j++;
            next[i] = j;
        }
        return next;        
    }
    int strStr(string haystack, string needle) {
        vector<int> next = Kmp_Next(needle);
        int pos = 0, j = 0;
        //kmp匹配过程
        while(j < needle.size() && pos < haystack.size()){
            while(j>0 && haystack[pos] != needle[j])
                j = next[j-1];
            if(haystack[pos] == needle[j]){
                pos++;
                j++;
            } 
            else
                pos++;                  
        }
        //needle没有遍历完,pos已经遍历完haystack了,没有匹配的地方
        if(j < needle.size())
            return -1;
        //needle遍历完,有匹配的地方
        else
            return pos - needle.size();
    }
};

459. 重复的子字符串

题目链接:459. 重复的子字符串
题目内容:
在这里插入图片描述

暴力求解

题目要求我们判断字符串S是不是由其某个子串重复构成的。假设子串m能够重复构成S,那么S可以表示m/mm/m/……这样的形势,n个m组成【n≥2】。分析这样的子串有两个特点:

  • 从第一个字符开始;
  • 长度≤S.size()/2;
  • S.size()一定能够被m.size()整除;

根据子串的这两个特点,我们可以去判断所有这样的子串,子串长度从1开始,最多有S.size()/2这么多个。针对每个子串,先判断其长度能否整除S的长度;再判断其能否重复构成S——将S分成和子串m一样长度的k个子串,所有的子串和m对比是否一样,如果有一个不一样就直接break。
代码如下(C++):

class Solution {
public:
    bool repeatedSubstringPattern(string s) {
        int size = s.size();
        //end是子串m的长度
        for(int end = 1; end <= size/2; end++ ){
        	//s长度能够被end整除才继续下面的判断
            if(size % end == 0){
                int i;
                //剩下的子串和m对比
                for(i = end ; i < size ; i += end ){
                    if(s.substr(0,end) != s.substr(i, end))
                        break;
                }
                if(i == size )
                    return true;
            }      
        }
        return false;
    }
};

暴力求解的时间复杂度是O(n^2)。

在S+S中找S

假设S由n个子串m组成【n≥2】,那么S+S中有2n个m,将S+S去头去尾【删除第一个和最后一个元素就能实现去掉一个m和最后一个m】后还有2n-2个m,由于n≥2,2n-2≥n,即S+S去头去尾后还能有至少一个完整的S,就能证明其是由m循环组成的。代码实现(C++)【就一句话】:

class Solution {
public:
    bool repeatedSubstringPattern(string s) {
        return (s+s).find(s,1) != s.size() ? true : false;
    }
};

那么如果不是由子串m循环组成的字符串,S+S去头去尾以后一定找不到一个完整的S吗?【emm需要再研究一下】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/967353.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue学习(三)

一、列表渲染 v-for指令 用于展示列表数据 语法<li v-for"(item, index) in items" :key"index"></li>key可以是index,最好是遍历对象的唯一标识 可遍历&#xff1a;数组、对象 <!DOCTYPE html> <html lang"en">&l…

探究Vue3中的Composition API:优化组件逻辑的新利器

一、toRef函数 在 Vue 3.0 中&#xff0c;引入了一种新的响应式 API,即 toRef。toRef 函数可以将一个普通值转换为响应式引用类型&#xff0c;这样就可以在模板中直接使用这个响应式引用类型的属性&#xff0c;并且当该属性发生变化时&#xff0c;视图会自动更新。 <templat…

【C++代码】用栈实现队列,用队列实现栈--代码随想录

队列是先进先出&#xff0c;栈是先进后出。卡哥给了关于C方向关于栈和队列的4个问题&#xff1a; C中stack 是容器么&#xff1f; 使用的stack是属于哪个版本的STL&#xff1f; 使用的STL中stack是如何实现的&#xff1f; stack 提供迭代器来遍历stack空间么&#xff1f; …

测试开发【Mock平台】09开发:项目管理(五)搜索、删除和Table优化

【Mock平台】为系列测试开发教程&#xff0c;从0到1编码带你一步步使用Spring Boot 和 Antd React框架完成搭建一个测试工具平台&#xff0c;希望作为一个实战项目对各位的测试开发学习之路有帮助&#xff0c;大奇一个专注测试技术干货原创与分享的家伙。 Mock平台系统项目基本…

【大数据实训】基于Hive的北京市天气系统分析报告(二)

博主介绍&#xff1a;✌全网粉丝6W,csdn特邀作者、博客专家、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于大数据技术领域和毕业项目实战✌ &#x1f345;文末获取项目联系&#x1f345; 目录 1. 引言 1.1 项目背景 1 1.2 项目意义 1 2.…

蓝队追踪者工具TrackAttacker,以及免杀马生成工具

蓝队追踪者工具TrackAttacker&#xff0c;以及免杀马生成工具。 做过防守的都知道大HW时的攻击IP量&#xff0c;那么对于这些攻击IP若一个个去溯源则显得效率低下&#xff0c;如果有个工具可以对这些IP做批量初筛是不是更好&#xff1f; 0x2 TrackAttacker获取 https://githu…

[管理与领导-67]:IT基层管理者 - 辅助技能 - 4- 职业发展规划 - 评估你与公司的八字是否相合

目录 前言&#xff1a; 一、概述 二、八字相合的步骤 2.1 企业文化是否相合 2.2.1 企业文化对职业选择的意义 2.2.2 个人与企业三观不合的结果 2.2.3 什么样的企业文化的公司不能加入 2.2 公司的发展前景 2.3 公司所处行业发展 2.4 创始人的三观 2.5 创始人与上司的…

HDMI 输出实验

FPGA教程学习 第十四章 HDMI 输出实验 文章目录 FPGA教程学习前言实验原理实验过程程序设计时钟模块&#xff08;video_pll&#xff09;彩条产生模块&#xff08;color_bar)配置数据查找表模块&#xff08;lut_adv7511&#xff09;I2C Master 寄存器配置模块&#xff08;i2c_c…

692. 前K个高频单词

题目来源&#xff1a;力扣 题目描述&#xff1a; 给定一个单词列表 words 和一个整数 k &#xff0c;返回前 k 个出现次数最多的单词。 返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率&#xff0c; 按字典顺序 排序。 示例 1&#xff1a; 输入:…

css transition 指南

css transition 指南 在本文中&#xff0c;我们将深入了解 CSS transition&#xff0c;以及如何使用它们来创建丰富、精美的动画。 基本原理 我们创建动画时通常需要一些动画相关的 CSS。 下面是一个按钮在悬停时移动但没有动画的示例&#xff1a; <button class"…

【斗罗Ⅱ】最强武魂揭秘,98级玄老、95级言少哲神兽级武魂曝光

Hello,小伙伴们&#xff0c;我是小郑继续为大家深度解析【绝世唐门】 在斗罗大陆动画绝世唐门中&#xff0c;98级玄老已经登场&#xff0c;他是一个很随意的老人&#xff0c;乍眼一看&#xff0c;似乎是一个邋里邋遢、好吃懒做的人&#xff0c;但是实际上他却是史莱克学院重量级…

精心整理了优秀的GitHub开源项目,包含前端、后端、AI人工智能、游戏、黑客工具、网络工具、AI医疗等等,空闲的时候方便看看提高自己的视野

精心整理了优秀的GitHub开源项目&#xff0c;包含前端、后端、AI人工智能、游戏、黑客工具、网络工具、AI医疗等等&#xff0c;空闲的时候方便看看提高自己的视野。 刚开源就变成新星的 igl&#xff0c;不仅获得了 2k star&#xff0c;也能提高你开发游戏的效率&#xff0c;摆…

自建音乐服务器Navidrome之二

6 准备音乐资源 可选 Last.fm Lastfm是 Audioscrobbler 音乐引擎设计团队的旗舰产品&#xff0c;以英国为总部的网络电台和音乐社区。有遍布232个国家超过1500万的活跃听众。据说有6亿音乐资源。 docker-compose.yml 配置 Navidrome 可以从 Last.fm 和 Spotify 获取专辑信息和…

性能测试 —— Jmeter 命令行详细

我们在启动Jmeter时 会看见&#xff1a;Don’t use GUI mode for load testing !, only for Test creation and Test debugging.For load testing, use CLI Mode (was NON GUI) 这句话的意思就是说&#xff0c;不要使用gui模式进行负载测试&#xff0c;gui模式仅仅是创建脚本…

涂鸦智能携手亚马逊云科技 共建“联合安全实验室” 为IoT发展护航

2023年8月31日&#xff0c;全球化IoT开发者平台涂鸦智能&#xff08;NYSE: TUYA&#xff0c;HKEX: 2391&#xff09;在“2023亚马逊云科技re:Inforce中国站”大会宣布与全球领先的云计算公司亚马逊云科技共同成立“联合安全实验室”&#xff0c;旨在加强IoT行业的安全合规能力与…

管理类联考——逻辑——形式逻辑——汇总篇——知识点突破——论证逻辑——假设——否定代入

角度——原理 可以用“否定代入法”验证疑似选项 由于假设是使推理成立的一个必要条件&#xff0c;根据必要条件的性质若Р是S的必要条件&#xff0c;那么┐P → ┐S可知&#xff0c;如果一个推理在没有某一条件时&#xff0c;这个推理必然不成立&#xff0c;那么这个条件就是…

41.岛屿数量(第四期模拟笔试)(BFS练习题)

题目&#xff1a; 给定一个 m 行 n 列的二维地图&#xff0c;初始化每个单元格都是海洋&#xff0c;二维地图外也全是海洋。 操作 addLand 会将单元格&#xff08;col, row&#xff09;变为陆地。 定义一系列相连的被海洋包围的陆地为岛屿&#xff0c; 横向相邻或者纵向相连的…

%temp%

C:\Users\ADMINI~1\AppData\Local\Temp

springboot~静态资源配置

springboot~静态资源配置 springboot的静态资源默认路径给静态资源请求加前缀指定静态资源加载的包欢迎页 springboot的静态资源默认路径 请求效果见图 给静态资源请求加前缀 有时需要用拦截器对某些请求进行拦截后再处理相关的业务代码&#xff0c;此时我们就要对请求进行…

2023年智能算法之淘金优化器,MATLAB代码免费获取

今天为大家带来一期淘金优化算法(Gold rush optimizer.,GRO)。 GRO算法是受淘金热启发&#xff0c;模拟了淘金者在淘金热时期如何利用淘金的三个关键概念进行淘金&#xff1a;迁移、协作和淘金。 原理详解 ①金矿勘探阶段&#xff1a; 与大多数智能算法相似&#xff0c;就是随机…