题目描述
给你一个字符串 s_1s1,它是由某个字符串 s_2s2 不断自我连接形成的。但是字符串 s_2s2 是不确定的,现在只想知道它的最短长度是多少。
输入格式
第一行一个整数 LL,表示给出字符串的长度。
第二行给出字符串 s_1s1 的一个子串,全由小写字母组成。
输出格式
仅一行,表示 s_2s2 的最短长度。
输入输出样例
输入 #1复制
8 cabcabca输出 #1复制
3说明/提示
样例输入输出 1 解释
对于样例,我们可以利用 \texttt{abc}abc 不断自我连接得到 \texttt{abcabcabc}abcabcabc,读入的 \texttt{cabcabca}cabcabca,是它的子串。
规模与约定
对于全部的测试点,保证 1 < L \le 10^61<L≤106。
1.这个题目 用的是kmp算法。
2.这个题目是很巧妙的。
我们可以发现无论它以什么形式出现,我们最后通常都会有一个递增序列(也有可能没有的,那就是字符串本身的长度了)。这个就说明他已经遇到了在该字符串里面循环的一个串了,也就是公共的前缀和后缀,而最长的公共串是就是后缀这个子串。然后后缀最长通常是不包括前面前缀不能构成一个最小串使它相等,然后往后增长,前面的那一段不是递增的序列就是该字符串最短的“流水串”。
不要去求前面非递增序列的长度(因为我最后一个测试点没有AC),其实我们有一个更好的方法,就是去求 n-next[n-1](就是字符串长度减去最后一个next数组对应的值)。
因为当到最后一般都会记录当前的最长后缀,而next[n-1]记录的就是最大后缀,而不包括的那些,就是“流水串”的长度。也就是我们需要求的答案。
C代码如下:
#include<stdio.h>
#define N 1000010
int n,nxt[N];
char s[1000010];
int next()
{
int i,j;
for(i=1,j=0;i<n;)
{
while(i<n&&s[i]==s[j])
{
j++;
nxt[i]=j;
i++;
}
if(i>=n) break;
j=nxt[j-1];
while(i<n&&s[i]!=s[j]&&j==0)
{
i++;
}
}
}
int kmp()
{
int i,j=1;
next();
printf("%d",n-nxt[n-1]);
}
int main()
{
scanf("%d",&n);
scanf("%s",s);
kmp();
}
C++代码如下:
#include<stdio.h>
#include<iostream>
#include<bits/stdc++.h>
using namespace std;
const int N=1000010;
int n,nxt[N];
char s[N];
int nextz()
{
int i,j;
for(i=1,j=0;i<n;)
{
while(i<n&&s[i]==s[j])
{
j++;
nxt[i]=j;
i++;
}
if(i>=n) break;
j=nxt[j-1];
while(i<n&&s[i]!=s[j]&&j==0)
{
i++;
}
}
}
int main()
{
cin >> n ;
cin >> s ;
cout << n-nxt[n-1] << endl;
return 0;
}