力扣 28找到字符串中第一个匹配项的下标 KMP算法

news2024/12/28 7:58:51

思路：

朴素匹配有很多步骤是多余的

KMP算法能够避免重复匹配

KMP算法主要是根据子串生成的next数组作为回退的依据，它记录了模式串与主串(文本串)不匹配的时候，模式串应该从哪里开始重新匹配。

这里讲一下为什么用模式串的最大公共前后缀求解NEXT数组，参考B站木子喵NEKO的视频【【neko算法课】KMP算法【7期】】 https://www.bilibili.com/video/BV1234y1y7pm/?share_source=copy_web&vd_source=5fc45b3a16cefaa9c36d42d5626cd9e6

用例子思考时，我们可以肉眼看到，需要移动的位置是根据B向后移动几个可以最大化的对齐A(在i之前），意味着找到i前面文本子串(A)与模式子串(B)中重合的部分。

既然i前面都是重合（因为i这里发生了不匹配，前面都匹配），直白说就是一样的，那就不用看文本串了，直接看模式串前后是否有重合的部分，也就是看模式串的最大公共前后缀。如果没看懂可以往下看。

kmp整体上分两步

1计算前缀表

2根据前缀表移动两个指针进行匹配

1计算前缀表，就是求解文本串指针回退的位置，

ps:文本串用i指针，模式串用j指针，

以下分别用A,B代指文本串与模式串。

A串中i指针前面（第一次循环时AB发生不匹配的位置）前，用A子串与B子串代称。

当A,B遇到不匹配的字符时，j指针回退，回退依据是当前不匹配位置前一位最大前后缀的长度，

为什么呢？通俗的说就是，不匹配了，看前面有哪些已经最大化的匹配上了，不匹配位置前一位的next值，代表了B自身前后一致的最大长度，根据前面讲的，A子串等效B子串，也就代表了AB子串前后一致的最大长度，也就代表了A子串的后面与B子串的前面一致的最大长度，也就是B需要向后移动几个字符，而j指针的移动代表着B向后移动，也就是j指针要移动到的位置。

j回退到上次最大化匹配的位置

如果还不匹配，再次查看不匹配位置前一位next的值。

如果匹配，j加一，也就意味着j向后移动一位，i向后移动写在了for循环里。

同时每次更新next[i]

void getNext(string s,int next[])
{
    int j = 0;
    next[0] = 0;
    for(int i = 1;i<s.size();i++)
    {
        while(j>0 && s[i] != s[j]) j = next[j-1];
        if(s[i] == s[j]) j++;
        next[i] = j;
    }
}

2 模拟匹配过程

如果不匹配，按着next数组回退j指针，如果匹配，J增一

最后如果j指向了模式串的末尾，说明找到了完整匹配，返回匹配的起始下标

int strStr(string s,string t)
{
    if(t.size()==0) return 0;
    get_Nxt(t,next);
    int j = 0;
    for(int i = 0;i<s.size();i++)
    {
    while(j>0 && s[i]!=s[j]) j = next[j-1];
    if(s[i] == t[j]) j++;
    if(j == t.size()) return (i - t.size()+1);
    }
}

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1939659.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！