KMP算法图解解析(C语言)

news2024/12/16 8:15:24

文章目录

  • 一.引言
  • 二.KMP算法解析
  • 三.代码实现
    • 1.对目标子串的处理(创建next数组)
    • 二.寻找子串的KMP算法实现

一.引言

kmp算法是由三位大牛共同研究提出的,全称为Knuth-Morris-Pratt算法,简写为KMP算法。

kmp算法用来解决子串的问题,
比如说有一串字符串–abcdefg,求解abc是否为该字符串的子串。
一般情况下,我们可能会想到使用暴力遍历的方法,暴力求解,但是这种方法的时间复杂度为O(n*m),也就是说如果主串和子串的长度足够长,那么暴力遍历的方法就会十分低效。
这个时候,KMP算法的优势就出来了,他的时间复杂度只有O(m+n)
接下来,我们详细的介绍这种方法。

二.KMP算法解析

在我们开始的时候,我们先去理解KMP的原理:
如果我们一个字符串为
c d c d e
我们需要求解
c d e是否为子串
请添加图片描述

我们的跳跃遍历是有错误的,有风险的,如果出现目标子串为abac的时候
这个方法就会失败!!!
请添加图片描述

所以KMP算法中有一个next值(前缀函数)帮我们解决了这一个问题
他定义:
一个字符串如果前面部分与后半部分相同那么
这个前半部分(=后半部分)的长度就是next(前缀函数)

例如:
a b a c a b a

-
a0
a b0
a b a1(正着为a,反着也是a)
a b a c0
a b a c a1
a b a c a b2(正反的ab和ab)
a b a c a b a3(同理)

有了这个next的值,那么我们在遇到不匹配时优先考虑回溯,再继续向后遍历,可以省下许多时间减小复杂度。请添加图片描述

回溯的原因就是因为我们的子串如果前缀与后缀相同,可以直接继续遍历减少复杂度

三.代码实现

1.对目标子串的处理(创建next数组)

我们不妨思考一下,如果每次我们遍历的时候都去计算一下我们的目标字串应该回溯的值,那么这回非常复杂,麻烦且没必要。
所以这三位大佬创建了一个数组来存储这个目标子串的每一位的回溯值,KMP算法的精髓就在这里
我们可能会想到用暴力遍历这个子串,来求出他的next数组但是KMP算法有一种更精妙的方法来建立next数组
好了我们来处理吧:
请添加图片描述
代码实现如下:

void setnext(char* p, int* next)
{
	int sz = strlen(p);
	int i = 0, j = 0;
	next[0] = 0;
	for (i = 1; i < sz; i++)//i在后面,j在前面
	{
		while (j > 0 && p[i] != p[j])//当j没回溯到开头或者p[i]!=p[j]的时候
		{
			j = next[j - 1];
		}
		if (p[j] == p[i])
		{
			j++;
		}
		next[i] = j;//因为每一次遍历都会让i向后走一步,所以赋值写在最后
	}
}

二.寻找子串的KMP算法实现

由以上的思路我们合并在一起,就能得到我们的寻找子串的代码:

#include <stdio.h>
#include <string.h>

void setnext(char* p, int* next)
{
	int sz = strlen(p);
	int i = 0, j = 0;
	next[0] = 0;
	for (i = 1; i < sz; i++)//i在后面,j在前面
	{
		while (j > 0 && p[i] != p[j])//当j没回溯到开头或者p[i]!=p[j]的时候
		{
			j = next[j - 1];
		}
		if (p[j] == p[i])
		{
			j++;
		}
		next[i] = j;//因为每一次遍历都会让i向后走一步,所以赋值写在最后
	}
}
int _strstr(char*p,char*dest)
{
	int* next = NULL;
	int sz = strlen(p);
	next = (int*)malloc(sizeof(int) * sz);
	setnext(p, next);
	int m =strlen(dest);
	int j = 0;
	for (int i = 0; i < m; i++)
	{
		while (j > 0 && p[j] != dest[i])
		{
			j = next[j - 1];
		}
		if (dest[i] == p[j])
		{
			j++;
			if (j == sz)
			{
				free(next);
				return 1;
			}
		}
		
	}
	return 0;
}
int main() {
    const char* pattern = "abababb";
	char* p2 = "ababadasdawdasdabababbsabb";
    
    printf("Y or N:%d", _strstr(pattern,p2));

    return 0;
}

新人博主用词不严谨请多多指教。
创作不易,恳请留赞(๑´ڡ๑)(๑´ڡ๑)(๑´ڡ`๑)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2260383.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据冒险、控制冒险、结构冒险

计算机组成原理 数据冒险、控制冒险、结构冒险 对所有用户&#xff08;所有程序员&#xff09;可见&#xff1a;PSW、PC、通用寄存器 PSW&#xff08;条件转移需要用到&#xff0c;程序员使用CMP指令的时候也需要用到所以是对用户可见&#xff09;PC&#xff08;跳转指令需要…

Python机器学习笔记(七、深度学习-神经网络)

深度学习算法经过精确调整&#xff0c;只适用于特定的使用场景。先学习较为简单的深度学习算法&#xff0c;用于分类和回归的多层感知机&#xff08;multilayer perceptron&#xff0c;MLP&#xff09;&#xff0c;它可以作为研究更复杂的深度学习方法的起点。MLP 也被称为&…

Kylin麒麟操作系统 | Nginx服务部署

目录 一、理论储备1. Nginx概述2. Nginx与Apache的区别3. Nginx的服务配置 二、任务实施任务1 Nginx的编译安装1. Server配置2. 客户端测试 任务2 Nginx反向代理1. Server1配置2. Server2配置3. 客户端测试 一、理论储备 1. Nginx概述 Nginx是一个轻量级的web服务器&#xff…

【html网页页面012】html+css制作品牌主题宏宝莱网页含视频、留言表单(7页面附效果及源码)

品牌主题宏宝莱网页制作 &#x1f964;1、写在前面&#x1f367;2、涉及知识&#x1f333;3、网页效果完整效果(7页)&#xff1a;代码目录结构&#xff1a;page1、首页page2、衍生品page3、包装设计page4、视频介绍page5、留言板page6、联系我们page7、详情页&#xff08;三层页…

机器学习之交叉熵

交叉熵&#xff08;Cross-Entropy&#xff09;是机器学习中用于衡量预测分布与真实分布之间差异的一种损失函数&#xff0c;特别是在分类任务中非常常见。它源于信息论&#xff0c;反映了两个概率分布之间的距离。 交叉熵的数学定义 对于分类任务&#xff0c;假设我们有&#…

0001.基于springmvc简易酒店管理系统后台

一.系统架构 springmvcjsplayuimysql 二.功能特性 简单易学习&#xff0c;虽然版本比较老但是部署方便&#xff0c;tomcat环境即可启用&#xff1b;代码简洁&#xff0c;前后端代码提供可统一学习&#xff1b;祝愿您能成尽快为一位合格的程序员&#xff0c;愿世界没有BUG; …

无限次使用 cursor pro

github地址 cursor-vip 使用方式 在 MacOS/Linux 中&#xff0c;请打开终端&#xff1b; 在 Windows 中&#xff0c;请打开 Git Bash。 然后执行以下命令来安装&#xff1a; 部分电脑可能会误报毒&#xff0c;需要关闭杀毒软件/电脑管家/安全防护再进行 方式1&#xff1a;通过…

AI 语言模型产业的投资困境与发展困境分析

https://benn.substack.com/p/do-ai-companies-work 巨额投资与成本困境 大型语言模型&#xff08;LLM&#xff09;的开发成本惊人。根据报道&#xff0c;OpenAI 正在筹集 65 亿美元资金&#xff0c;每年约消耗 70 亿美元用于研究、开发新的 AI 服务和扩充团队。Anthropic 预计…

tryhackme——Pre Security(安检前)-Offensive Security(进攻性安全)

这里我用的edge的插件闪击翻译。这里我英语不好&#xff0c;所以用这个可以顺便学习下英语。 任务一&#xff1a;What is Offensive Security?&#xff08;什么是进攻性安全?&#xff09; 很简单啊&#xff0c;通过阅读&#xff0c;知道以下哪个选项更能代表您模拟黑客操作…

[论文阅读] |智能体长期记忆与反思

写在前面&#xff1a;10月份的时候&#xff0c;联发科天玑9400发布&#xff0c;搭载这款旗舰 5G 智能体 AI 芯片的荣耀MagicOS9.0实现了一句话让手机自动操作美团点咖啡。很快商场实体店里便能看到很多品牌手机已经升级为智能体语音助手。下一步&#xff0c;这些智能体或许便能…

CQRS Design Pattern in Microservices - CQRS模式

原文链接 CQRS Design Pattern in Microservices - GeeksforGeeks 【文章看起来像是AI写的。。。 &#x1f602;&#x1f602;&#x1f602;】 简介 实现步骤 1&#xff0c;识别有界上下文&#xff1a;&#xff08;Identify Bounded Contexts:&#xff09; 2&#xff0c;命…

《拉依达的嵌入式\驱动面试宝典》—C/CPP基础篇(二)

《拉依达的嵌入式\驱动面试宝典》—C/CPP基础篇(二) 你好,我是拉依达。 感谢所有阅读关注我的同学支持,目前博客累计阅读 27w,关注1.5w人。其中博客《最全Linux驱动开发全流程详细解析(持续更新)-CSDN博客》已经是 Linux驱动 相关内容搜索的推荐首位,感谢大家支持。 《拉…

RPC远程服务调用详解和gRPC简介

RPC (Remote Procedure Call)是远程过程调用&#xff0c;比如说现在有两台服务器A, B&#xff0c;一个在A服务器上的应用想要调用B服务器上的应用提供的某个&#xff0c;由于不在两个方法不在一个内存空间&#xff0c;不能直接调用&#xff0c;需要通过网络表达调用的语义和传达…

计算机网络知识点全梳理(三.TCP知识点总结)

目录 TCP基本概念 为什么需要TCP 什么是TCP 什么是TCP链接 如何唯一确定一个 TCP 连接 TCP三次握手 握手流程 为什么是三次握手&#xff0c;而不是两次、四次 为什么客户端和服务端的初始序列号 ISN 不同 既然 IP 层会分片&#xff0c;为什么 TCP 层还需要 MSS TCP四…

PDFMathTranslate,PDF多语言翻译,批量处理,学术论文,双语对照(WIN/MAC)

分享一个非常实用的PDF文档翻译项目——PDFMathTranslate。作为一个经常逛GitHub的开发者&#xff0c;我总喜欢翻看各种项目附带的论文&#xff0c;虽然大多时候是瞎研究&#xff0c;但却乐在其中。该项目能够完美保留公式、图表、目录和注释&#xff0c;对于需要阅读外文文献的…

前端成长之路:CSS元素显示模式

元素显示模式 网页中的标签非常的多&#xff0c;在不同的地方会使用到不同类型的标签&#xff0c;了解这些标签的特点可以更好的布局我们的网页。 元素显示模式就是元素&#xff08;标签&#xff09;按照什么方式进行显示&#xff0c;比如&#xff1a;div标签会自己独占一行&a…

如何在 Ubuntu 22.04 上使用 vnStat 监控网络流量

简介 vnStat是一个免费的、开源的、基于控制台的Linux操作系统网络流量监控工具。通过vnStat&#xff0c;你可以在不同的时间段监控网络统计数据。它简单、轻量级&#xff0c;并且消耗的系统资源很小。vnStat允许你按小时、日、月、周和日生成网络流量数据。本教程将向你展示如…

解决pip下载慢

使用pip下载大量安装包&#xff0c;下载速度太慢了 1、问题现象 pip安装包速度太慢 2、解决方案 配置国内源 vi /root/.config/pip/pip.conf[global] timeout 6000 index-url https://mirrors.aliyun.com/pypi/simple/ trusted-host mirrors.aliyun.com

RabbitMQ中的Publish-Subscribe模式

在现代分布式系统中&#xff0c;消息队列&#xff08;Message Queue&#xff09;是实现异步通信和解耦系统的关键组件。RabbitMQ 是一个功能强大且广泛使用的开源消息代理&#xff0c;支持多种消息传递模式。其中&#xff0c;Publish/Subscribe&#xff08;发布/订阅&#xff0…

专业140+总分410+浙江大学842信号系统与数字电路考研经验浙大电子信息与通信工程,真题,大纲,参考书。

考研落幕&#xff0c;本人本中游211&#xff0c;如愿以偿考入浙江大学&#xff0c;专业课842信号系统与数字电路140&#xff0c;总分410&#xff0c;和考前多次模考预期差距不大&#xff08;建议大家平时做好定期模考测试&#xff0c;直接从实战分数中&#xff0c;找到复习的脉…