题目描述
给出两个字符串 s_1s1 和 s_2s2,若 s_1s1 的区间 [l, r][l,r] 子串与 s_2s2 完全相同,则称 s_2s2 在 s_1s1 中出现了,其出现位置为 ll。
现在请你求出 s_2s2 在 s_1s1 中所有出现的位置。定义一个字符串 ss 的 border 为 ss 的一个非 ss 本身的子串 tt,满足 tt 既是 ss 的前缀,又是 ss 的后缀。
对于 s_2s2,你还需要求出对于其每个前缀 s's′ 的最长 border t't′ 的长度。输入格式
第一行为一个字符串,即为 s_1s1。
第二行为一个字符串,即为 s_2s2。输出格式
首先输出若干行,每行一个整数,按从小到大的顺序输出 s_2s2 在 s_1s1 中出现的位置。
最后一行输出 |s_2|∣s2∣ 个整数,第 ii 个整数表示 s_2s2 的长度为 ii 的前缀的最长 border 长度。输入输出样例
输入 #1复制
ABABABC ABA输出 #1复制
1 3 0 0 1说明/提示
样例 1 解释
。
对于 s_2s2 长度为 33 的前缀
ABA
,字符串A
既是其后缀也是其前缀,且是最长的,因此最长 border 长度为 11。数据规模与约定
本题采用多测试点捆绑测试,共有 3 个子任务。
- Subtask 1(30 points):|s_1| \leq 15∣s1∣≤15,|s_2| \leq 5∣s2∣≤5。
- Subtask 2(40 points):|s_1| \leq 10^4∣s1∣≤104,|s_2| \leq 10^2∣s2∣≤102。
- Subtask 3(30 points):无特殊约定。
对于全部的测试点,保证 1 \leq |s_1|,|s_2| \leq 10^61≤∣s1∣,∣s2∣≤106,s_1, s_2s1,s2 中均只含大写英文字母。
1.这个题目用到了KMP算法。
2.刚开始我写的是KMP算法,但是后面只AC了三个,其他都TLE了,我就开始寻求优化。
3.我们通常写的KMP算法,我发现每次都需要取判断母串和子串是否相等,再去判断不相等的情况,我们可以知道,如果是相等的情况,我们是可以开循环继续往下比较的,不必在主循环消耗时间,出来之后肯定是遇到了子串和母串不相等的情况,此时我们可以先判断是否子串已经走完,我们可以输出位置。
4.继而就是,令他往回靠近,也就是j=nex[j-1],还有一个情况是如果 j 在子串一直是 0 的位置,而且此时子串和母串是不相等的情况,我们可以一直让 i++,使它到能够相等的情况。
5.在处理next数组时我们也可以使用这种方法。
C代码如下:
#include<stdio.h>
#include<string.h>
#define N 1000010
char s1[N],s2[N];
int nex[N],n,m;
int next()
{
int i,j=0;
for(i=1;i<n;)
{
while(s2[i]==s2[j])
{
j++;
nex[i]=j;
i++;
}
j=nex[j-1];
while(j==0&&s2[i]!=s2[j]) i++;
}
return 0;
}
int kmp()
{
int i,j=0;
next();
for(i=0;i<n;)
{
// puts("*");
while(s1[i]==s2[j]&&j<m)
{
i++;
j++;
}
if(j>=m) printf("%d\n",i-m+1);
j=nex[j-1];
while(j==0&&s1[i]&&s1[i]!=s2[j]) i++;
}
return 0;
}
int main()
{
scanf("%s%s",s1,s2);
n=strlen(s1),m=strlen(s2);
kmp();
for(int i=0;s2[i];i++)
{
printf("%d ",nex[i]);
}
return 0;
}
C++代码如下:
#include<iostream>
#include<bits/stdc++.h>
#include<cstring>
using namespace std;
const int N=1000010;
char s1[N],s2[N];
int nex[N],n,m;
int next()
{
int i,j=0;
for(i=1;i<n;)
{
while(s2[i]==s2[j])
{
j++;
nex[i]=j;
i++;
}
j=nex[j-1];
while(j==0&&s2[i]!=s2[j]) i++;
}
return 0;
}
int kmp()
{
int i,j=0;
next();
for(i=0;i<n;)
{
while(s1[i]==s2[j]&&j<m)
{
i++;
j++;
}
if(j>=m) cout << i-m+1 << endl;
j=nex[j-1];
while(j==0&&s1[i]&&s1[i]!=s2[j]) i++;
}
return 0;
}
int main()
{
cin >> s1 >> s2;
n=strlen(s1),m=strlen(s2);
kmp();
for(int i=0;s2[i];i++)
{
cout << nex[i] << " ";
}
return 0;
}