本文已收录于专栏
🌲《educoder数据结构与算法_大耳朵宋宋的博客-CSDN博客》🌲
任务描述
本关的编程任务是补全 step2/kmp.cpp 文件中的KmpGenNext
函数,以实现 KMP 字符串匹配。该函数生成给定字符串的next
数组。
相关知识
第 1 关中实现的朴素的字符串匹配算法在实际应用系统中效率低,而 KMP 字符串匹配算法可以实现高效的匹配。
假设长字符串为t
,短字符串为p
。为了进行 KMP 匹配,首先需要计算字符串p
的next
数组,后面实现了计算该数组的函数void KmpGenNext(char* p, int* next)
。对于 “abcabcab” ,计算出的next
数组如下图:
其中:next[i]
给出如下信息:从左到右将p
的字符与t
的字符进行比对时,若在p
的i
号位置出现不匹配,就将字符串p
相对t
右移i-next[i]
位;若next[i]>=0
,则右移后比对位置从next[i]
号位置开始,否则从0
号位置开始。下图 1 给出了一个匹配示例:
本关涉及两个函数:
void KmpGenNext(char* p, int* next)
// 生成p的next数组, next数组长度大于等于字符串p的长度加1。
int KmpFindSubWithNext(char* t, char* p, int* next)
// 从t中查找子串p的第一次出现的位置。
// 若找到,返回出现的位置,否则返回-1。
编程要求
本关的编程任务是补全 step2/kmp.cpp 文件中的KmpGenNext
函数,以实现 KMP 字符串匹配。该函数生成给定字符串的next
数组,生成算法请你查阅相关资料。
- 具体请参见后续测试样例。
本关涉及的代码文件 kmp.cpp 的代码框架如下:
#include <stdio.h>
#include <stdlib.h>
#include "kmp.h"
///
void KmpGenNext(char* p, int* next)
// 生成p的next数组, next数组长度大于等于字符串p的长度加1
{
// 请在此添加代码,补全函数KmpGenNext
/********** Begin *********/
/********** End **********/
}
int KmpFindSubWithNext(char* t, char* p, int* next)
// 从t中查找子串p的第一次出现的位置
// 若找到,返回出现的位置,否则返回-1
{
int i=0, j=0;
while(p[i]!=0 && t[j]!=0) {
if(p[i]==t[j]) {
i++;
j++;
}
else if (next[i]>=0) {
i = next[i];
}
else {
i=0;
j++;
}
}
if(p[i]==0) return j-i; //found
else return -1; //not found
}
评测说明
本关的测试文件是 step2/Main.cpp ,测试过程如下:
- 平台编译 step2/Main.cpp ,然后链接相关程序库并生成 exe 可执行文件;
- 平台运行该 exe 可执行文件,并以标准输入方式提供测试输入;
- 平台获取该 exe 可执行文件的输出,然后将其与预期输出对比,如果一致则测试通过;否则测试失败。
输入输出格式: 输入格式: 第一行输入母串 第二行输入子串
输出格式: 输出Location
: #
,其中#是子串在母串中的位置编号
以下是平台对 step2/Main.cpp 的样例测试集: 样例输入: stringabcedf1stringabcdef2stringabcdef3stringabcdef4stringabcdef5stringabcdef6stringabcdef7
stringabcdef7
样例输出: Location: 78
开始你的任务吧,祝你成功!
AC_Code
//字符串 实现文件
//
#include <stdio.h>
#include <stdlib.h>
#include "kmp.h"
/
void KmpGenNext(char* p, int* next)
//生成p的next数组, next数组长度大于等于字符串p的长度加1
{
// 请在此添加代码,补全函数KmpGenNext
/********** Begin *********/
next[0]=-1;
int k=-1;
for(int i=1;p[i-1]!=0;i++)
{
while(k>=0&&p[k]!=p[i-1])
{
k=next[k];
k=k+1;
if(p[i]==p[k])
{
next[i]=next[k];
}
else
{
next[i=k];
}
}
}
/********** End *********/
}
int KmpFindSubWithNext(char* t, char* p, int* next)
//从t中查找子串p的第一次出现的位置
//若找到,返回出现的位置,否则返回-1
{
int i=0, j=0;
while(p[i]!=0 && t[j]!=0) {
if(p[i]==t[j]) {
i++;
j++;
}
else if (next[i]>=0) {
i = next[i];
}
else {
i=0;
j++;
}
}
if(p[i]==0) return j-i; //found
else return -1; //not found
}