[入门必看]数据结构4.2:串的模式匹配

news2025/1/7 18:44:13

[入门必看]数据结构4.2:串的模式匹配

  • 第四章 串
  • 4.2 串的模式匹配
    • 知识总览
      • 4.2.1_朴素模式匹配算法
      • 4.2.2_1_KMP算法
      • 4.2.2_2_求next数组
      • 4.2.3_KMP算法的进一步优化
    • 4.2.1_朴素模式匹配算法
      • 什么是字符串的模式匹配
      • 朴素模式匹配算法
      • 通过数组下标实现朴素模式匹配算法
        • 代码实现:
    • 4.2.2_1_KMP算法
      • 优化思路 - 模式串的最后一个位置不匹配
      • 优化思路 - 其他位置不匹配
      • 上节例子对比
      • 对例子进行改造
      • KMP算法
        • 利用next数组进行匹配
      • 朴素模式匹配 v.s. KMP算法
    • 4.2.2_2_求next数组
      • 练习1:
        • 手算next数组
        • 使⽤next数组进⾏模式匹配
      • 练习2:
      • 练习3:
    • 4.2.3_KMP算法的进一步优化
      • 例1:第三个位置失配
      • 例2:第五个位置失配
      • 练习1:
      • 练习2:
      • 优化KMP算法
        • 优化前:
        • 优化后:
  • 知识回顾与重要考点
    • 4.2.1_朴素模式匹配算法
    • 4.2.2_1_KMP算法
    • 4.2.2_2_求next数组
    • 4.2.3_KMP算法的进一步优化


第四章 串

小题考频:2
大题考频:0


4.2 串的模式匹配

难度:☆☆☆☆☆

知识总览

4.2.1_朴素模式匹配算法

4.2.2_1_KMP算法

在这里插入图片描述

4.2.2_2_求next数组

4.2.3_KMP算法的进一步优化


4.2.1_朴素模式匹配算法

什么是字符串的模式匹配

——在字符串内搜索某一段内容
在这里插入图片描述

查找功能

在这里插入图片描述

搜索引擎

在这里插入图片描述

  • 字符串模式匹配:在主串中找到与模式串相同的⼦串,并返回其所在位置。

有可能匹配不到模式串:在这里插入图片描述

子串——主串的一部分,一定存在
模式串——不一定在主串中找到


朴素模式匹配算法

——暴力解决问题
在主串中找出所有有可能与模式串相匹配的子串,并将这些子串和模式串一一进行对比
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
主串长度为n,模式串长度为m

朴素模式匹配算法:将主串中所有长度为m的子串依次与模式串对比,直到找到一个完全匹配的子串,或所有的子串都不匹配为止。

最多对比 n - m + 1 个子串

上一节中Index(S,T)函数的实现,采用的就是朴素模式匹配算法的思想。
在这里插入图片描述
1)int i=1 - 指明当前要匹配的子串是从哪个位置开始的;
2)(i<=n-m+1) - 表示最多对比n-m+1个子串;
3)SubString(sub,S,i,m); - 从主串S中,取出从位置i开始,长度为m的子串,放到sub里;
4)if(StrCompare(sub,T)!=0) ++i; - 子串和模式串对比,若不匹配,则匹配下一个子串
5)若能匹配,返回当前子串的起始位置i;
6)若都不能匹配,返回0

上述代码使用了:1)取子串的基本操作;2)对比两个字符串的基本操作

接下来:不使用字符串的基本操作,直接通过数组下标实现朴素模式匹配算法。


通过数组下标实现朴素模式匹配算法

设置两个扫描指针i和j,这两个指针指到哪就要把字符对比到哪。

Step1:
开始匹配第1个子串
对比主串和模式串的第1个字符
在这里插入图片描述
Step2:
如果指向的字符相等,那么让指针i和j分别后移
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Step3:
到了第6个位置时,i和j所指向的字符不相等,则认为第一个子串匹配失败
在这里插入图片描述
若当前⼦串匹配失败,则主串指针 i 指向下⼀个⼦串的第⼀个位置,模式串指针 j 回到模式串的第⼀个位置

i = i - j + 2
(i - j:指针指向当前子串的前一个位置;+2:指向下一个子串的起始位置)
j = 1

Step4:
第1个子串匹配失败后:
i的值回到2
j的值回到1
然后开始匹配第2个子串
在这里插入图片描述
在这里插入图片描述
匹配失败,则主串指针 i 指向下⼀个⼦串的第⼀个位置,模式串指针 j 回到模式串的第⼀个位置

Step4:
匹配下一个子串
在这里插入图片描述
失败,i 指向下一个子串的第一个位置,j 指向模式串第一个位置,开始匹配下一个子串。

Step5:
匹配成功!
在这里插入图片描述
若 j 指针大于模式串长度,j > T.length(模式串字符全部匹配成功),则当前⼦串匹配成功,返回当前⼦串第⼀个字符的位置 —— i - T.length

代码实现:

在这里插入图片描述
设主串⻓度为 n,模式串⻓度为 m,则
最坏时间复杂度 = O(nm)
在这里插入图片描述
最坏的情况,每个⼦串都要对⽐ m 个字符,共 n-m+1 个⼦串,复杂度 = O((n-m+1)m) = O ( n m ) O(nm) O(nm)

注:很多时候,n >> m,
保留数量级更大的项,把 O ( n m − m 2 + m ) O(nm-m^2+m) O(nmm2+m)简化为 O ( n m ) O(nm) O(nm)


4.2.2_1_KMP算法

——由D.E.Knuth,J.H.Morris和V.R.Pratt提出,因此称为KMP算法

对于朴素模式匹配算法,⼀旦发现当前这个⼦串中某个字符不匹配,就只能转⽽匹配下⼀个⼦串(从头开始)
在这里插入图片描述

因为我们并不知道主串里面这些字符到底是什么,所以我们必须从子串开头的第一个字符开始匹配。

如果匹配模式串时,在最后一个字符匹配失败,那么主串中之前这些字符就和模式串中的字符对应

那么在主串中匹配失败的位置,的之前的字符,是已知的,和模式串时保持一致的。
在这里插入图片描述
不匹配的字符之前,一定是和模式串一致的

朴素模式匹配算法中,匹配失败后只能从第2个子串开始重新匹配:
在这里插入图片描述
但是匹配第2个子串时,已知了主串中的前面这几个字符,发现刚开始就已经不匹配了,所以根本没有必要去检查和匹配。
在这里插入图片描述
第3个子串一样,已经知道了主串前面的几个字符,对不上,也没有必要去检查和匹配了。
在这里插入图片描述
匹配第4个子串时,主串里已知部分和模式串是能够匹配的,其他部分能否匹配现在还不知道,那么在这个子串中,可以从未知部分往后进行检查和匹配:
在这里插入图片描述


优化思路 - 模式串的最后一个位置不匹配

在这里插入图片描述
①不匹配的字符之前,一定是和模式串一致的;
②所以没有必要检查已知部分模式串不匹配的子串;
已知部分模式串相匹配的子串中,已经匹配的部分(已知部分)也不用再次对比;
④直接从【已知部分模式串相匹配的子串】的未知部分开始匹配。
在这里插入图片描述

跳过了中间几个子串的对比,也调过了当前子串已知的部分的对比,提高了算法效率

对于模式串 T = ‘abaabc’,当第6个元素匹配失败时,可令主串指针 i 不变(指向当前失配的字符),模式串指针 j=3(从模式串的第3个字符向后依次匹配)

得到的结论只和模式串有关,与匹配到主串的哪个位置没有关系。

验证(从第5个位置开始匹配):
在这里插入图片描述
匹配到当前子串的最后一个字符时,字符失配。
那么前面的字符就和模式串保持一致,即已知部分。
在这里插入图片描述
使用之前的结论:

对于模式串 T = ‘abaabc’,当第6个元素匹配失败时,可令主串指针 i 不变(指向当前失配的字符),模式串指针 j=3(从模式串的第3个字符向后依次匹配)

在这里插入图片描述
验证了该结论对模式串’abaabc’具有通⽤性,和主串没有半⽑钱关系。

以上是对于模式串T = ’abaabc’的第6个元素匹配失败的情况。


优化思路 - 其他位置不匹配

考虑其他位置的情况。

对于模式串 T = ‘abaabc’,当第5个元素匹配失败时? 怎么搞?

  • 第5个元素匹配失败,可以知道主串中前面4个元素的信息,与模式串保持一致

在这里插入图片描述

第2个子串也不能匹配上:
在这里插入图片描述

第3个子串也不能匹配上:
在这里插入图片描述

第4个子串可以匹配上:
在这里插入图片描述

此时可令主串指针i不变,模式串指针j = 2
从模式串的第二个元素开始匹配即可

  • 第4个元素匹配失败,可以知道主串中前面3个元素的信息,与模式串保持一致

在这里插入图片描述

第2个子串不能匹配上:
在这里插入图片描述

第3个子串可以匹配上:
在这里插入图片描述

此时可令主串指针i不变,模式串指针j = 2
从模式串的第二个元素开始匹配即可

  • 第3个元素匹配失败,可以知道主串中前面2个元素的信息,与模式串保持一致

在这里插入图片描述

第2个子串不能匹配上:
在这里插入图片描述

所以从第3个子串开始重新匹配:
在这里插入图片描述

此时可令主串指针i不变,模式串指针j = 1
从模式串的第一个元素开始匹配即可

  • 第2个元素匹配失败,可以知道主串中前面1个元素的信息,与模式串保持一致

在这里插入图片描述

所以从第2个子串开始重新匹配:
在这里插入图片描述

此时可令主串指针i不变,模式串指针j = 1
从模式串的第一个元素开始匹配即可

  • 第1个元素匹配失败,只能尝试匹配下一个子串:
    在这里插入图片描述

尝试匹配下一个子串:
在这里插入图片描述

结论:
对于模式串 T = ‘abaabc’
第6个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=3
第5个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第4个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第3个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第2个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第1个元素匹配失败时,匹配下⼀个相邻⼦串,令 j=0, i++, j++


上节例子对比

在这里插入图片描述
第六个字符匹配失败:
在这里插入图片描述
如果用朴素模式匹配算法:
在这里插入图片描述

朴素模式匹配算法,此时应令i = i - j + 3,j = 1;

如果用优化思路:
在这里插入图片描述

第6个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=3
第5个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第4个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第3个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第2个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第1个元素匹配失败时,匹配下⼀个相邻⼦串,令 j=0, i++, j++

在这里插入图片描述

优化之后,主串指针不需要回溯。
采用这种策略,效率大幅度提高。


对例子进行改造

第5个元素改成c:
在这里插入图片描述
第5个元素发生失配:
在这里插入图片描述
优化思路:
在这里插入图片描述

第6个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=3
第5个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第4个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第3个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第2个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第1个元素匹配失败时,匹配下⼀个相邻⼦串,令 j=0, i++, j++

此时第2个元素仍匹配失败:
在这里插入图片描述

第6个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=3
第5个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第4个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第3个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第2个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第1个元素匹配失败时,匹配下⼀个相邻⼦串,令 j=0, i++, j++

此时第1个元素仍匹配失败:
在这里插入图片描述

第6个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=3
第5个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第4个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第3个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第2个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第1个元素匹配失败时,匹配下⼀个相邻⼦串,令 j=0, i++, j++

在这里插入图片描述

此时第1个元素匹配,第2个元素匹配失败:
在这里插入图片描述

第6个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=3
第5个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第4个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第3个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第2个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第1个元素匹配失败时,匹配下⼀个相邻⼦串,令 j=0, i++, j++

在这里插入图片描述
此时第3个元素匹配失败:
在这里插入图片描述

第6个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=3
第5个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第4个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第3个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第2个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第1个元素匹配失败时,匹配下⼀个相邻⼦串,令 j=0, i++, j++

此时第1个元素匹配失败:
在这里插入图片描述

第6个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=3
当#pic_center第5个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第4个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=2
第3个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第2个元素匹配失败时,可令主串指针 i 不变,模式串指针 j=1
第1个元素匹配失败时,匹配下⼀个相邻⼦串,令 j=0, i++, j++

最终因为指针j超出模式串的范围而停止:
在这里插入图片描述
完成匹配工作。
整个过程中i不用回溯。

怎么⽤代码实现这个处理逻辑?
对于模式串T = ‘abaabc’
用数组来表示模式串指针需要修改的信息
在这里插入图片描述

特别地,第1个元素失配时,要将j = 0 再让 i++, j++

if (S[i] != T[j]) //模式串在第几个位置失配时,使用第几个位置的指针修改信息
	j = next[j];

if(j == 0) {i++; j++} //第1个位置时,匹配下一个相邻子串

KMP算法

是的,这就是KMP算法。
在这里插入图片描述
KMP算法的整体流程就是在进行模式匹配之前,需要先进行一个预处理

  1. 分析模式串,求出和模式串相对应的这个next数组
  2. 然后再利用next数组来进行模式匹配,整个匹配的过程主串的指针i是不需要回溯的。

利用next数组进行匹配

在这里插入图片描述

传入主串的值S、模式串的值T、和模式串相对应的这个next数组;
从主串的1和模式串的1位置开始往后匹配;
如果,主串的当前元素和模式串的当前元素相等的话,即匹配成功,i和j同时++;
并且当j == 0时,也需要让i和j同时++
否则,说明i和j所指元素不匹配,失配时让j = next[j]即可。


朴素模式匹配 v.s. KMP算法

在这里插入图片描述
对比发现,其实修改的部分即黄色框所框出部分,和需要传入一个next数组
有了next数组后,当主串和模式串发生失配时,不需要再修改主串的指针i让其回溯,只需要修改模式串的j指针即可。

朴素模式匹配算法,最坏的时间复杂度 O ( m n ) O(mn) O(mn)
KMP算法,最坏的时间复杂度 O ( m + n ) O(m+n) O(m+n)

其中,求 next 数组时间复杂度 O(m)
模式匹配过程最坏时间复杂度 O(n)

需要掌握手算next数组的方法。


4.2.2_2_求next数组

——(⼿算练习)
next数组的作⽤:当模式串的第 j 个字符失配时,从模式串的第 next[j] 继续往后匹配

练习1:

手算next数组

在这里插入图片描述的next数组:
在这里插入图片描述
next数组的下标与字符串的下标一一对应,1~6。

  • next[1]:
    【当模式串的第一个字符匹配失败时,模式串指针j应该指向什么位置】

在这里插入图片描述
当第一个字符匹配失败时,直接让i++,j++,即开始匹配后一个子串和模式串:
在这里插入图片描述

该逻辑对于任何一个模式串都是一样的,只要第1个字符发生了不匹配的情况,只能让他匹配下一个子串。
所以所有的模式串next[1]肯定都是0
在这里插入图片描述

  • next[2]:
    【当模式串的第二个字符匹配失败时,模式串指针j应该指向什么位置】
    在这里插入图片描述
    此时,只能让模式串往后滑动一位,即指向1位置:
    在这里插入图片描述

该逻辑对于任何一个模式串都是一样的,只要第2个字符发生了不匹配的情况,应尝试匹配模式串的第1个字符。
所以所有的模式串next[2]肯定都是1
在这里插入图片描述

  • next[3]:
    【当模式串的第三个字符匹配失败时,模式串指针j应该指向什么位置】

在这里插入图片描述

在不匹配的位置前划出分界线,左边的部分是已知的,右边是未知的。
尝试让模式串一步一步往右移,过程中,观察分界线左边部分能否匹配上。
直到分界线之前“能对上”,或模式串完全跨过分界线为止
此时j指向哪儿,next数组值就是多少。

往右移动一步:在这里插入图片描述
发现分界线左边的g和o失配,说明模式串右移一步不够。
继续往右移动一步:
在这里插入图片描述

此时整个模式串跨过了分界线,此时要继续向后检查模式串的j和右边位置未知元素i是否匹配。
此时j的值为1,那么next[3] = 1
在这里插入图片描述

  • next[4]:
    【当模式串的第四个字符匹配失败时,模式串指针j应该指向什么位置】

在这里插入图片描述
Step1:分界线
在这里插入图片描述

分界线左边的值是可以确定的,逐步向右移动模式串看是否匹配,或者模式串跨过分界线。

Step2:右移一步
在这里插入图片描述
失配。

Step3:右移两步
在这里插入图片描述
失配。

Step4:右移三步
在这里插入图片描述

此时模式串跨过分界线,j指向1,next[4] = 1
在这里插入图片描述

  • next[5]:
    【当模式串的第五个字符匹配失败时,模式串指针j应该指向什么位置】

在这里插入图片描述
重复以上步骤,逐步向右移动模式串,找匹配部分。

最终找到了分界线左边的匹配部分,接下来检查右边i和j是否匹配:
在这里插入图片描述

此时j指向2,next[5] = 2
在这里插入图片描述

  • next[6]:
    【当模式串的第六个字符匹配失败时,模式串指针j应该指向什么位置】

在这里插入图片描述
重复以上步骤,逐步向右移动模式串,找匹配部分。

最终模式串跨过分界线,之后需要检查i和模式串第1个字符能否匹配:
在这里插入图片描述

此时j指向1,next[6] = 1
在这里插入图片描述

使⽤next数组进⾏模式匹配

给出主串S为googlo goo google,在其中找到模式串google:
在这里插入图片描述
已经手算得到next数组:
在这里插入图片描述

开始进行模式匹配
Step1:第6个元素匹配失败
在这里插入图片描述

j = 6 时失配,此时让 j = next[j],即 j = next[6],
接下来让 j = 1

在这里插入图片描述
Step2:第1个元素匹配失败

j = 1 时失配,此时让 j = next[j],即 j = next[1],
接下来让 j = 0

在这里插入图片描述
j = 0时让i和j都++
在这里插入图片描述
Step3:第5个元素匹配失败
在这里插入图片描述

j = 5 时失配,此时让 j = next[j],即 j = next[5],
接下来让 j = 2

在这里插入图片描述
Step4:匹配成功
在这里插入图片描述

练习2:

求模式串T = ababaa的next数组
模式串长度是6,next组数有next[1]~next[6]在这里插入图片描述
总结规则:
在这里插入图片描述
Step1:next[1]=0和next[2]=1
在这里插入图片描述
Step2:求next[3]
在这里插入图片描述

模式串跨过分界线,此时j = 1,next[3] = 1
在这里插入图片描述

Step3:求next[4]
在这里插入图片描述

分界线左边匹配成功,此时j = 2,next[4] = 2
在这里插入图片描述

Step4:求next[5]
在这里插入图片描述

分界线左边匹配成功,此时j = 3,next[5] = 3
在这里插入图片描述

Step5:求next[6]
在这里插入图片描述

分界线左边匹配成功,此时j = 4,next[6] = 4
在这里插入图片描述

练习3:

在这里插入图片描述
在这里插入图片描述
求next数组:
在这里插入图片描述


4.2.3_KMP算法的进一步优化

——求nextval数组

KMP算法优化的思路:
以之前小节中的模式串abaabc为例,已经求出了这个模式串的next数组。
在这里插入图片描述
模式串abaabc的next数组:
在这里插入图片描述


例1:第三个位置失配

如果第三个位置发生失配时,让j指针指回next[3]
在这里插入图片描述
此时说明主串中第三个字符和模式串的第三个字符a是肯定不相等的。
主串中第三个字符肯定不是a
在这里插入图片描述
如果此时按照next数组中在这里插入图片描述next[3] = 1,来进行匹配,那么这一次匹配也一定是失败的。

因为模式串中的第一个字符为a,而且已经知道了主串中的第三个字符不为a
这次匹配失败后,那么应该让j指针等于next[j],也就是等于0。

所以当第3个字符匹配失败的时候,让j = 0,即next[3] = 0。

优化后:
在这里插入图片描述
第3个位置失配时:
在这里插入图片描述

直接让j = next[3] = 0
在这里插入图片描述

那么下一个匹配的位置就会直接跳过这个字符,因为会让i和j同时++
在这里插入图片描述


例2:第五个位置失配

假设模式串在第5个位置失配,那么KMP算法会让j = next[5] = 2。
在这里插入图片描述

虽然暂时不知道主串i指针所指位置的字符是什么,但是肯定不是b。
在这里插入图片描述
所以如果按照刚才让j指针指向2位置,接下来的这次匹配一定是失败的,因为字符2和字符5都是b,然后还需要让j = next[2] = 1。

所以干脆就一步到位,让next[5] =next[2]的值:
即j = next[5] = 1:
在这里插入图片描述

此时回到上面的情况,如果字符5发生失配,j = next[5],直接就j = 1,节约了一个步骤,没有必要再让next[5] = 2,即比较第二个字符,因为肯定匹配不上。

这就是优化。

当然不是所有next数组都可以优化,优化思路为:
需要判断next数组所指的字符和原本失配的字符是否相等

  • 如果这两个字符不相等,那么next数组保持不变;
  • 如果这两个字符相等,那么next数组就可以进行优化。

在这里插入图片描述
将next数组优化成nextval,然后再KMP算法匹配的时候,用nextval数组替代next数组,其他一样。


练习1:

对于这个模式串:
在这里插入图片描述
求出其next数组:

在这里插入图片描述
然后手算其nextval数组:
在这里插入图片描述
首先,nextval[1]的值直接写=0;
然后,如果当前的next[j]所指字符,和目前j所指的字符不相等,就让nextval的值等于next的值,所以nextval[2]应该等于1。

  • 如,next[2] = 1,所指字符为第1个,即a,和目前j所指的第2个字符b不相等,那么nextval[1] = next[1] = 1
    在这里插入图片描述
  • 如,next[3] = 1,所指字符为第1个,即a,但是目前j所指第3个字符为a相等,那么就让nextval[3] = nextval[next[3]] = nextval[1] = 0,即跳到1对比失败的那个next,即next[1] = 0。

也就是说直接把next[3]的值优化为next[1]的值,即0。
在这里插入图片描述
同样的,第四个字符b失配时,next[4] = 2,跳到第二个字符b时相等,那么
nextval[4] = nextval[next[4]] = nextval[2] = 1
在这里插入图片描述
第五个字符a失配时,next[5] = 3,跳到第三个字符a时相等,那么
nextval[5] = nextval[next[5]] = nexvalt[3] = 0

第六个字符a失配时,next[6] = 4,跳到第四个字符b时不相等,那么
nextval[6] = next[6] = 4
在这里插入图片描述
最终求出了nextval数组:
在这里插入图片描述


练习2:

对于模式串:
在这里插入图片描述
其next数组是:
在这里插入图片描述
nextval[1] = 0;
第二个字符和next[2]所指字符相等,nextval[2] = nextval[next[2]] = 0;
第三个字符和next[3]所指字符相等,nextval[3] = nextval[next[3]] = 0;
第四个字符和next[4]所指字符相等,nextval[4] = nextval[next[4]] = 0;
第五个字符和next[5]所指字符不相等,nextval[5] = [next[5] = 4。

所以求得其nextval数组为:

在这里插入图片描述


优化KMP算法

——感受一下优化的力量

优化前:

在这里插入图片描述
此时匹配到第4个字符,失配。到next[4] = 3:
在这里插入图片描述
此时第3个字符依然失配。到next[3] = 2:
在这里插入图片描述
此时第2个字符依然失配。到next[2] = 1:
在这里插入图片描述
此时第1个字符依然失配。到next[1] = 0:
在这里插入图片描述
j = 0时,i和j同时++:
在这里插入图片描述
此时匹配成功:
在这里插入图片描述

优化后:

在这里插入图片描述
此时匹配到第4个字符,失配。到nextval[4] = 0:
在这里插入图片描述
j = 0时,i和j同时++:
在这里插入图片描述

此时就跳过了刚才中间部分的对比。

接下来匹配成功:
在这里插入图片描述

把next数组优化为nextval数组之后,中间减少了很多没有必要的对比。


知识回顾与重要考点

4.2.1_朴素模式匹配算法

在这里插入图片描述

  • 暴力解法:把所有有可能的子串遍历一遍
  • 最坏时间复杂度 = O ( n m ) O(nm) O(nm)
    ——每一个子串前面所有元素都和模式串匹配,只有最后一个元素和模式串不匹配

4.2.2_1_KMP算法

  • 需要掌握手算next数组的方法
  • 记住KMP算法的整体时间复杂度 O ( m + n ) O(m+n) O(m+n)
    ——预处理(next数组)时间复杂度 O ( m ) O(m) O(m);模式匹配时间复杂度 O ( n ) O(n) O(n)

4.2.2_2_求next数组

在这里插入图片描述


4.2.3_KMP算法的进一步优化

在这里插入图片描述

  • 串在考试中的地位

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/436873.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

http(1)

主要介绍http 1.0 我们在浏览器中输入一个网址&#xff0c;稍等片刻就看见了网页 客户端会发送一个http请求&#xff0c;要求返回cn.bing.com这个网址&#xff0c;服务器收到请求后就会返回一个html页面 &#xff08;服务器根据请求找到客户端想要的资源&#xff0c;然后把这个…

[LeetCode]路径总和

给你二叉树的根节点 root 和一个表示目标和的整数 targetSum 。判断该树中是否存在 根节点到叶子节点 的路径&#xff0c;这条路径上所有节点值相加等于目标和 targetSum 。如果存在&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 叶子节点 是指没有子节点…

【并发编程】线程池的原理和源码分析

线程使用上可能的问题 我们一般通过new Thread().start();来创建和运行一个线程&#xff0c;如果在业务过程中有大量场景需要使用多线程来并发&#xff0c;那么就会有以下问题 需要频繁的创建和销毁线程 &#xff0c;需要消耗CPU资源如果创建和销毁的线程的数量过多(大于CPU核…

CMOS图像传感器——从传感器冗余说起

在这先抛出一个概念,什么是成像圈?众所周知,相机的镜头近似于圆柱体,光线透过圆筒子投射出的大都是圆形。我们可以拿一个镜头演示一下,当这个圆圈投在传感器所在焦平面时,我们称之为像场。像场的边界我们称之为成像圈,成像圈是圆的,但是传感器是矩形,天圆地方的怎么放…

Lombok插件下载与离线安装

Lombok插件下载与离线安装 首先你既然搜要离线安装或下载&#xff0c;那么肯定也是在IDEA工具里面&#xff0c;无法搜索到&#xff0c;或者自动下载安装失败吧&#xff1f; 安装包下载地址 记得和 idea版本一样&#xff0c; 如果不知道啥版本看下面

CleanMyMac X4.15重大更新 新功能菜单发布

CleanMyMac&#xff0c;一款电脑清理软件&#xff0c;可以帮助你清理垃圾文件、优化系统性能、管理应用程序等。它就像你的电脑管家&#xff0c;让你的电脑始终保持最佳状态。无论是手机还是电脑&#xff0c;在使用一段时间之后都可能会发生卡顿的现象&#xff0c;很多小伙伴会…

C++ 高级数据结构————[ 单调栈 ]

每周一篇的算法文章来了 今天讲解的是高级数据结构中的——单调栈 单调栈&#xff0c;顾名思义&#xff0c;就是升级版的栈&#xff08;&#xff09; 先回顾一下栈把 栈&#xff0c;是一种线性表&#xff0c;它的特点是只能从一边进出&#xff0c;并且先进后出&#xff0c;后进…

Windows入门篇一之MSDN手册的使用和第一个窗口程序

Windows入门篇之MSDN手册的使用和第一个窗口程序 MSDN手册MSDN手册是什么MSDN手册的下载和安装MSDN手册的使用 第一个窗口程序项目的创建第一个简单的窗口程序 MSDN手册 MSDN手册是什么 MSDN手册是VS中的一个帮助手册&#xff0c;帮助初学者学习Windows编程&#xff0c;来查找…

opencv实现卡尔曼滤波

卡尔曼滤波是一种递归的估计&#xff0c;即只要获知上一时刻状态的估计值以及当前状态的观测值就可以计算出当前状态的估计值&#xff0c;因此不需要记录观测或者估计的历史信息。 卡尔曼滤波器分为两个阶段&#xff1a;预测与更新。在预测阶段&#xff0c;滤波器使用上一状态…

VScode配置远端服务器深度学习项目

前提准备已安装VScode。 1.安装插件Remote Development 安装完成后左侧就多了远程资源管理器图标&#xff1a; 1.点击远程资源管理器。 2.点击小齿轮&#xff08;配置&#xff09;。 3.选择config配置文件&#xff0c;如果没有自己按照相似路径新建config文件后重复1、2、3步骤…

组合总和III

组合总和III 题目 力扣题目链接:https://leetcode.cn/problems/combination-sum-iii/ 代码 class Solution {public:vector<vector<int

小航助学答题系统编程等级考试scratch一级真题2023年3月(含题库答题软件账号)

青少年编程等级考试scratch真题答题考试系统请点击 电子学会-全国青少年编程等级考试真题Scratch一级&#xff08;2019年3月&#xff09;在线答题_程序猿下山的博客-CSDN博客_小航答题助手 1.下列说法不正确的是&#xff1f;&#xff08; &#xff09; A.可以从声音库中随机…

【JSP学习笔记】7.JSP 过滤器

JSP 过滤器 JSP 和 Servlet 中的过滤器都是 Java 类。 过滤器可以动态地拦截请求和响应&#xff0c;以变换或使用包含在请求或响应中的信息。 可以将一个或多个过滤器附加到一个 Servlet 或一组 Servlet。过滤器也可以附加到 JavaServer Pages (JSP) 文件和 HTML 页面。 过…

20230419 | 704.二分查找、27.移除元素

1、数组基础理论 int a[m][n]; 数组长度表示&#xff1a;a[0].length 数组宽度表示&#xff1a;a.length 2、704.二分查找 特征&#xff1a;数组是升序的找某个数&#xff0c;那就使用二分法。时间复杂度O(log n)&#xff0c;空间复杂度O(1) 我使用左闭右闭区间 计算中点&…

22、原理解析

文章目录 1、Profile功能1、application-profile功能2、Profile条件装配功能3、profile分组 2、外部化配置1、外部配置源2、配置文件查找位置3、配置文件加载顺序&#xff1a;4、指定环境优先&#xff0c;外部优先&#xff0c;后面的可以覆盖前面的同名配置项 3、自定义starter…

P600旗舰视觉款正式发布,重新定义视觉追踪与精准定位!

P600旗舰视觉款无人机是一款准行业级无人机&#xff0c;搭载RTK定位系统&#xff0c;定位精度可达厘米级&#xff0c;飞行路径更精准、姿态更稳定&#xff1b;机身搭载Allspark机载计算机&#xff0c;算力可达21TOPS&#xff0c;可运行大部分主流算法&#xff1b;配置G1三轴吊舱…

共模电感是如何抑制共模信号的

这是一个共模电感&#xff0c;外观它和我们常用的电感最大的区别就是共模电感有四个引脚&#xff0c;共模电感的磁芯上绕着两组线圈&#xff0c;这两个线圈匝数和材料都是一样的。 共模电感最主要的作用就是能抑制共模信号&#xff0c;一般用在电源或信号的EMI电路中。 首先来…

【ROS实操3服务调用添加乌龟数量】

需求描述 编码实现向turtlesim 发送请求&#xff0c;在乌龟显示节点的窗体指定位置生成一乌龟&#xff0c;这是一个服务请求操作。 实现分析 1.首先&#xff0c;需要启动乌龟显示节点。 2.要通过ROS命令&#xff0c;来获取乌龟生成服务的服务名称以及服务消息类型。 3.编写服…

C++基础入门——语法详解篇(上)

文章目录 一、什么是 C 呢&#xff1f; 二、为什么要学 C 呢&#xff1f; 三、C 基础语法 3、1 C 关键字 3、2 命名空间 3、2、1 为什么要引入命名空间 3、2、2 命名空间的定义 3、2、3 命名空间的使用 3、3 C的输入和输出 3、4 函数重载 3、4、1 函数重载的概念 3、4、2 C支持…

【WAF】雷池安装及使用体验

文章目录 前言一、雷池介绍二、安装及使用1.下载链接2.下载3. 安装waf测试 前言 长亭一直是我比较喜欢的一家公司&#xff0c;像业界比较出名的扫描器xray还有rad等很多工具都是他们开发的&#xff0c;使用起来非常的nice&#xff0c;联动其他安全工具可以实现自动漏洞挖掘&am…