kmp算法详解+next数组求解

news2024/12/25 3:33:51

 KMP算法是一种高效的字符串匹配算法,其核心思想是利用已经匹配的部分信息,尽可能减少匹配次数。KMP算法通过预处理阶段计算一个最大前后缀长度数组(也称为“部分匹配表”或“失败函数”),用于在匹配失败时确定模式串应该跳转到哪个位置进行下一次匹配。

下面是一个KMP算法的图解示例:

假设模式串为"ABCDAB",文本串为"ABCABCDAB"。

  1. 预处理阶段:

首先,计算最大前后缀长度数组。对于模式串中的每个位置i,最大前后缀长度[i]表示模式串中从位置0到位置i-1的最大前后缀长度。前缀指除最后一个字符除外,字符串的所有头部字串。后缀指除第一个字符外,字符串的素有尾部子串。

对于模式串"ABCDAB":

  • 对于位置0,最大前后缀长度为0(因为没有前后缀)。
  • 对于位置1,最大前后缀长度为0(因为前缀为"A",后缀为"A"的长度为1,但是模式串中没有两个连续的"A")。
  • 对于位置2,最大前后缀长度为0(因为前缀为"AB",后缀为"AB"的长度为2,但是模式串中没有两个连续的"AB")。
  • 对于位置3,最大前后缀长度为0(因为前缀为"ABC",后缀为"ABC"的长度为3,但是模式串中没有两个连续的"ABC")。
  • 对于位置4,最大前后缀长度为0(因为前缀为"ABCD",后缀为"ABCD"的长度为4,但是模式串中没有两个连续的"ABCD")。
  • 对于位置5,最大前后缀长度为1(因为前缀为"ABCDA",后缀为"BCDA"的长度为4,但是模式串中没有两个连续的"BCDA",所以取前一个最大前后缀长度为1)。
  • 对于位置6,最大前后缀长度为2(因为前缀为"ABCDAB",后缀为"BCDAB"的长度为5,但是模式串中没有两个连续的"BCDAB",所以取前一个最大前后缀长度为2)。

因此,最大前后缀长度数组为[0, 0, 0, 0, 0, 1, 2]。

  1. 匹配阶段:

接下来,开始进行字符串匹配。从模式串的第一个字符开始,依次与文本串中的字符进行匹配。

第一次匹配失败(模式串的第一个字符'A'与文本串的第一个字符'A'不匹配),此时根据最大前后缀长度数组可知,模式串应该跳转到位置1进行下一次匹配。

第二次匹配失败(模式串的第二个字符'B'与文本串的第二个字符'B'不匹配),此时根据最大前后缀长度数组可知,模式串应该跳转到位置2进行下一次匹配。

以此类推,直到匹配成功或模式串中的所有字符都匹配完毕。

kmp算法的代码实现

int kmpsuanfa(char str1[8], char str2[], int sz1, int sz2) {
    int count = 0;
    int i = 0;
    int j = 0;
    while (i <= sz1) {
        // 如果当前字符匹配成功,将i和j都向后移动一位
        if (str2[j] == str1[i])
        {
            ++i;
            ++j;
        }
        else
        {
            // 如果匹配失败,根据KMP算法,将i和j回溯到指定位置
            // i退回到之前匹配成功的下一个位置
            // j退回到模式串的开头位置
            i = i - j + 1;
            j = 0;
        }
        // 当模式串全部匹配完成,即j超过了模式串的长度时,说明匹配成功
        // 此时,i和j需要更新,以继续寻找下一个出现位置
        if (j > sz2 - 1)
        {
            i = i - j + 2;
            j = 0;
            count++; // 匹配次数自增
        }
    }
    return count; // 返回总匹配次数
}

完整测试代码

#include <stdio.h>
// KMP算法,计算模式串在主串中的出现次数
int kmpsuanfa(char str1[8], char str2[], int sz1, int sz2) {
    int count = 0;
    int i = 0;
    int j = 0;
    while (i <= sz1) {
        // 如果当前字符匹配成功,将i和j都向后移动一位
        if (str2[j] == str1[i])
        {
            ++i;
            ++j;
        }
        else
        {
            // 如果匹配失败,根据KMP算法,将i和j回溯到指定位置
            // i退回到之前匹配成功的下一个位置
            // j退回到模式串的开头位置
            i = i - j + 1;
            j = 0;
        }
        // 当模式串全部匹配完成,即j超过了模式串的长度时,说明匹配成功
        // 此时,i和j需要更新,以继续寻找下一个出现位置
        if (j > sz2 - 1)
        {
            i = i - j + 2;
            j = 0;
            count++; // 匹配次数自增
        }
    }
    return count; // 返回总匹配次数
}
int main() {
    char str1[8] = { 'a', 'b', 'a', 'b', 'a', 'b', 'a', 'b' };//主串
    char str2[] = { 'a', 'b','a' };//模式串
    int sz1 = sizeof(str1) / sizeof(str1[0]);//计算str1的长度
    int sz2 = sizeof(str2) / sizeof(str2[0]);//计算str2的长度
    int sum = kmpsuanfa(str1, str2, sz1, sz2); // 计算str1中有多少个str2字符
    printf("主串中有%d个模式串", sum); // 输出匹配的次数
    return 0;
}

用str1[8] = { 'a', 'b', 'a', 'b', 'a', 'b', 'a', 'b' };//主串
   str2[] = { 'a', 'b','a' };//模式串

测试结果为

求next数组值的代码如下

void getnext(char str1[],int sz1, int next[])
{
    int i = 1;
    int j = 0;
    next[1] = 0;
    while (i < sz1)
    {
        if (j==0 || str1[i] ==str1[j])
        {
            ++i;
            ++j;
            next[i] = j;
        }
        else
        {
            j = next[j];
        }
    }
}

还是需要测试一下的

#include <stdio.h>
void getnext(char str1[],int sz1, int next[])
{
    int i = 1;
    int j = 0;
    next[1] = 0;
    while (i < sz1)
    {
        if (j==0 || str1[i] ==str1[j])
        {
            ++i;
            ++j;
            next[i] = j;
        }
        else
        {
            j = next[j];
        }
    }
}
int main() {
    char str1[8] = { 'a', 'b', 'a', 'b', 'a', 'b', 'a', 'b' };//主串
    int next[10];
    getnext(str1, sz1,next);
    printf("\nstr1的next数组为:");
    for (int k = 1; k < sz1+1; k++)
        printf("%d ", next[k]);
    return 0;
}

用str1[8] = { 'a', 'b', 'a', 'b', 'a', 'b', 'a', 'b' }测试的结果为

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1183546.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

互联网Java工程师面试题·Spring篇·第七弹

目录 36、什么是基于 Java 的 Spring 注解配置? 给一些注解的例子. 37、什么是基于注解的容器配置? 38、怎样开启注解装配&#xff1f; 39、Required 注解 40、Autowired 注解 41、Qualifier 注解 42、在 Spring 框架中如何更有效地使用 JDBC? 43、JdbcTemplate 44…

网络安全(黑客)-零基础自学

想自学网络安全&#xff08;黑客技术&#xff09;首先你得了解什么是网络安全&#xff01;什么是黑客&#xff01; 网络安全可以基于攻击和防御视角来分类&#xff0c;我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术&#xff0c;而“蓝队”、“安全运营”、“安全…

NowCoder | 环形链表的约瑟夫问题

NowCoder | 环形链表的约瑟夫问题 OJ链接 思路&#xff1a; 创建带环链表带环链表的删除节点 代码如下&#xff1a; #include<stdlib.h>typedef struct ListNode ListNode; ListNode* ListBuyNode(int x) {ListNode* node (ListNode*)malloc(sizeof(ListNode));node…

基于springboot+vue的图书馆管理系统

图书馆管理系统 springboot32阿博图书馆管理系统 源码合集&#xff1a; www.yuque.com/mick-hanyi/javaweb 源码下载&#xff1a;博主私 摘 要 随着社会的发展&#xff0c;计算机的优势和普及使得阿博图书馆管理系统的开发成为必需。阿博图书馆管理系统主要是借助计算机&…

vue3高德地图+搜索+点击获取经纬度

首先 安装依赖 npm i amap/amap-jsapi-loader --save html&#xff08;设置一个容器&#xff09;点击位置控制台可以打印到数据 如果想要回显到input 只需在input内绑定v-modal即可 <template><div><input style"width: 80%; height: 30px" v-mode…

Java进阶篇--线程池之ScheduledThreadPoolExecutor

目录 ScheduledThreadPoolExecutor简介 构造方法 特有方法 可周期性执行的任务-ScheduledFutureTask DelayedWorkQueue 什么是DelayedWorkQueue&#xff1f; 为什么要使用DelayedWorkQueue呢&#xff1f; DelayedWorkQueue的数据结构 ScheduledThreadPoolExecutor执行…

uniApp页面通讯

Uniapp 是一款基于 Vue.js 开发的框架&#xff0c;它可以用来开发多端应用&#xff0c;包括微信小程序、H5、APP 等。在 Uniapp 中&#xff0c;页面通讯分为三种方式&#xff1a;事件总线、Vuex 和 uni.$emit。 事件总线&#xff08;EventBus&#xff09;&#xff1a;事件总线是…

挖掘非结构化数据潜能——向量数据库的探索之路

“ 摸着石头过河&#xff0c;一直向前&#xff0c;不断尝试 ” 整理 | 小白 出品&#xff5c;极新 IDC 预测&#xff0c;到 2025 年&#xff0c;中国的数据量将增长到 48.6ZB&#xff0c;80% 是非结构化数据&#xff0c;并且将成为全球最大的数据圈。在我们的日常生活中&…

rancher或者其他容器平台使用非root用户启动jar

场景&#xff1a; java程序打成镜像&#xff0c;在rancher上运行&#xff0c;默认是root账户&#xff0c;发现hdfs或者hive不允许root账户操作&#xff1b;所以打算用费root账户启动jar&#xff0c;使其具有hive和hdfs的操作权限。 Dockerfile entrypoint.sh 思路就是上面这样…

git and svn 行尾风格配置强制为lf

git CLI配置&#xff1a; // 提交时转换为LF&#xff0c;检出时转换为CRLF git config --global core.autocrlf true // 提交时转换为LF&#xff0c;检出时不转换 git config --global core.autocrlf input // 提交检出均不转换 git config --global core.autocrlf f…

C# wpf 实现任意控件(包括窗口)更多拖动功能

系列文章目录 第一章 Grid内控件拖动 第二章 Canvas内控件拖动 第三章 任意控件拖动 第四章 窗口拖动 第五章 附加属性实现任意拖动 第六章 拓展更多拖动功能&#xff08;本章&#xff09; 文章目录 系列文章目录前言一、添加的功能1、任意控件MoveTo2、任意控件DragMove3、边…

19 款Agent产品工具合集

原文&#xff1a;19 款Agent产品工具合集 什么是Agent? 你告诉GPT完成一项任务&#xff0c;它就会完成一项任务。 如果你不想为GPT提出所有任务怎么办&#xff1f;如果你想让GPT自己思考怎么办&#xff1f; 想象一下&#xff0c;你创建了一个AI&#xff0c;你可以给它一个…

第一章:IDEA

系列文章目录 文章目录 系列文章目录前言一、IDEA 的使用1.1 IDEA 工作界面1.2 IDEA 的基本介绍和使用1.3 IDEA 使用技巧和经验1.4 IDEA编译与源文件1.5 IDEA 常用快捷键1.6 IDEA模板/自定义模板 总结 前言 IDEA 全称 IntelliJ IDEA&#xff0c;在业界被公认为最好的 Java 开发…

C++进阶-模板

模板 模板的概念函数模板函数模板语法函数模板注意事项案例-实现数据的排序函数模板与普通函数的区别普通函数与函数模板的调用规则 模板的局限性类模板的基本语法类模板与函数模板的区别类模板中成员函数创建时机类模板对象做函数参数类模板与继承类模板成员函数类外实现类模板…

模拟量指令

这里写自定义目录标题 模拟量scale指令导入模拟量输入原理硬件组态 指令运用信号发生器使用S_ITR(integer to real) 整数转换浮点数 模拟量输入信号输出信号标准信号非标准信号RTD&#xff08;Resistance Temperature Detector&#xff0c;热电阻&#xff09;实物图接线方法 TC…

顶板事故防治vr实景交互体验提高操作人员安全防护技能水平

建筑业在我国各行业中属危险性较大且事故多发的行业&#xff0c;在建筑业“八大伤害”(高处坠落、坍塌、物体打击、触电、起重伤害、机械伤害、火灾爆炸及其他伤害)事故中&#xff0c;高处坠落事故的发生率最高、危险性极大。工地现场培训vr坠落体验利用虚拟现实技术还原各种情…

数据结构(c语言版) 栈

顺序栈 要求&#xff1a;实现顺序栈的入栈&#xff0c;出栈&#xff0c;显示栈 代码 #include <stdio.h> #define MAXSIZE 100struct liststack{int data[MAXSIZE];int top; };//初始化栈 void init(struct liststack * LS){LS->top -1; }//入栈操作 void instack…

小程序制作(超详解!!!)第十四节 计时器

1.案例描述 设计一个实现倒计时功能的小程序&#xff0c;小程序运行后&#xff0c;首先显示空白界面&#xff0c;过2秒后才显示计时界面点击“开始计时”按钮后开始倒计时&#xff0c;点击“停止计时”按钮后停止计时。 2.index.wxml <view class"box" hidden&…

Docker安装、卸载,以及各种操作

docker是一个软件&#xff0c;是一个运行与linux和windows上的软件&#xff0c;用于创建、管理和编排容器&#xff1b;docker平台就是一个软件集装箱化平台&#xff0c;是一个开源的应用容器引擎&#xff0c;让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中&#xf…

服务器数据恢复—云服务器mysql数据库表被truncate的数据恢复案例

云服务器数据恢复环境&#xff1a; 阿里云ECS网站服务器&#xff0c;linux操作系统mysql数据库。 云服务器故障&#xff1a; 在执行数据库版本更新测试时&#xff0c;在生产库误执行了本来应该在测试库执行的sql脚本&#xff0c;导致生产库部分表被truncate&#xff0c;还有部…