BF算法,KMP算法

news2024/11/15 13:42:03

前言:今天我们来学习两种算法,BF算法和KMP算法。相信会让许多小伙伴们打开新世界的大门。

1 BF算法

实践是检验真理的唯一标准。举一个例子说明BF算法。现在我们要在一个主串中找子串的位置。那我们该如何解决这个问题呢?最简单的办法自然是使用C语言中的库函数strstr。

#include<stdio.h>
#include<string.h>
int main()
{
	char str1[20] = "abbbcdef";
	char str2[20] = "bbc";
	char* ret = strstr(str1, str2);
	char* ps = strncpy(ret, "hello", 5);
	printf("%s\n", str1);
	return 0;
}

但现在我们不使用C语言中的库函数strstr,是否有办法可以解决呢?当然是有的。

#include<stdio.h>
#include<assert.h>
#include<string.h>
char* BF(char* str1, char* str2)
{
	assert(str1 != NULL && str2 != NULL);
	char* s1 = str1;//遍历主串
	char* s2 = str2;//遍历子串
	char* cur = str1;//记录可能开始匹配的位置
	while (*cur)
	{
		//完成一次匹配
		s1 = cur;
		s2 = str2;
		while (*s1 && *s2 && *s1 == *s2)
		{
			s1++;
			s2++;
		}
		if (*s2 == '\0')
		{
			return cur;
		}
		cur++;
	}
	return NULL;
}
int main()
{
	char str1[20] = "abbbcdef";
	char str2[20] = "bbc";
	char* ret = BF(str1, str2);
	char* ps = strncpy(ret, "world", 5);
	printf("%s\n", str1);
}

画图分析

*s1=a,*s2=b。此时 *s1 != *s2,说明从cur这个位置匹配失败,那么下一次就要从cur++的位置开始匹配,同时将s1的位置更改为新的cur

在这里插入图片描述


*s1=b,*s2=b。此时*s1==*s2,说明从当前cur的位置是有可能匹配成功的。那么就执行s1++,s2++的操作,比较下一对字符的内容

在这里插入图片描述


在这里插入图片描述


*s1=b,*s2=c。此时*s1!=*s2,说明从cur的位置匹配失败,进一步更新cur的位置,同时将s1的位置更新为新的cur的位置,s2回到起始位置。重新进行下一次的匹配

在这里插入图片描述


更新之后新的cur和s1的位置以及s2的位置

在这里插入图片描述


这里省略了相同的步骤,直接演示最后的结果。

在这里插入图片描述

这就是所谓的BF算法。大家是否理解了呢?接下来就让我们一起来学习更加高深莫测的KMP算法。大家做好准备哦。

2 KMP算法

依然是在主串中找寻子串的位置。这一次使用KMP算法实现。

什么是KMP算法呢?

KMP算法是一种改进的字符串匹配算法KMP算法的核心思想是利用主串与模式串(子串)匹配失败后的信息,尽量减少模式串(子串)与主串匹配的次数以达到快速匹配的目的。具体实现是通过一个next数组实现,数组本身包含了子串的局部匹配信息。KMP算法的时间复杂度O(m+n)

KMP算法与BF算法的区别是:主串的i并不会回退,子串的j不一定回退到0位置

画图分析

从当前 i 的位置开始匹配,匹配成功就执行 i++,j++的操作,接着匹配下一对字符的内容

在这里插入图片描述


这里省略了相同的步骤,直接演示最后的结果。此时匹配失败,i不会进行回退,j回退到一个随机的位置

在这里插入图片描述

该回退到哪里呢?这是一个值得深思的问题。在这个位置匹配失败就意味着 i 前面和 j 前面有一部分是相同的。那我们来研究一下 j 到底该回退到哪里呢?

在这里插入图片描述

假设1与3的内容相同,2与3的内容相同。那么1与2的内容就相同。如果此时下标 i 与下标 j 的内容不匹配,j 应该回退到哪里去呢?j 应该回退到子串中下标为2的位置去。为什么呢?还记得KMP算法的核心思想吗。需要尽量减少模式串与主串匹配的次数以达到快速匹配的目的1与3的内容相同,就没有必要再进行重复的匹配,因此 j 应该回退到子串中下标为2的位置。如果依然匹配失败,就继续回退

那新的问题又来了,我们要怎么得到回退的位置呢?根据上面的图分析,假设子串叫做p,如果p[0]~p[1]之间的内容等于p[3]~p[4]之间的内容,我们会发现相等部分的长度为2,刚好是 j 要回退的位置。那不就出来了。next数组的作用就是保存子串中某个位置匹配失败后,要回退的位置

KMP的精髓就是next数组,也就是用next[j]=k来表示,不同的j表示不同的k值,这个k就是你将来要移动的j要移动的位置

k值的求法:

. 找到匹配成功部分的两个相等的真子串(不包含本身),一个以下标0的字符开始,另一个以下标为 j-1 的字符结尾。这两个真子串的长度就是k值

. 不管什么数据,next[0]=-1,next[1]=0

接下来的问题就是已知next[j-1]=k,如何求next[j]=?

在这里插入图片描述


在这里插入图片描述

next数组的特点:相邻的k值如果是增加的,一定是逐步加1的过程

KMP算法的实现

#include<stdio.h>
#include<assert.h>
#include<string.h>
#include<stdlib.h>
//str代表主串
//sub代表子串
//pos代表主串开始匹配的位置
void GetNext(int* next, char* sub, int LenSub)
{
	assert(next != NULL && sub != NULL && LenSub);
	next[0] = -1;
	next[1] = 0;
	int i = 2;
	int k = 0;//保存前一项的k值
	while (i < LenSub)
	{
		if (-1 == k || sub[i - 1] == sub[k])
		{
			next[i] = k + 1;
			i++;
			k++;
		}
		else
		{
			k = next[k];//有可能回退到-1,子串进行访问时会出现越界访问
		}
	}
}
int KMP(char* str, char* sub, int pos)
{
	assert(str != NULL && sub != NULL);
	int LenStr = (int)strlen(str);
	int LenSub = (int)strlen(sub);
	if (0 == LenStr || 0 == LenSub)
	{
		return -1;
	}
	if (pos < 0 || pos >= LenStr)
	{
		return -1;
	}
	int* next = (int*)malloc(sizeof(int) * LenSub);
	if (NULL == next)
	{
		perror("空间开辟失败的原因是");
		return -1;
	}
	GetNext(next, sub, LenSub);
	int i = pos;//遍历主串
	int j = 0;//遍历子串
	while (i < LenStr && j < LenSub)
	{
		if (-1 == j || str[i] == sub[j])
		{
			i++;
			j++;
		}
		else
		{
			j = next[j];//有可能回退到-1,子串进行访问时会出现越界访问
		}
	}
	if (j >= LenSub)
	{
		return i - j;
	}
	else
	{
		return -1;
	}
	free(next);
	next = NULL;
}
int main()
{
		printf("%d\n", KMP("abbbcdefg", "bbc", 0));//2
		printf("%d\n", KMP("abbcdef", "ab", 0));//0
		printf("%d\n", KMP("abccdef", "bcd", 0));//-1
	
		printf("%d\n", KMP("abbcdabcdef", "abc", 0));//5
		printf("%d\n", KMP("abbccddef", "abcde", 0));//-1
		printf("%d\n", KMP("abcddef", "ab", 0));//0
	return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2055606.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据结构-哈希前缀】力扣2845. 统计趣味子数组的数目

给你一个下标从 0 开始的整数数组 nums &#xff0c;以及整数 modulo 和整数 k 。 请你找出并统计数组中 趣味子数组 的数目。 如果 子数组 nums[l…r] 满足下述条件&#xff0c;则称其为 趣味子数组 &#xff1a; 在范围 [l, r] 内&#xff0c;设 cnt 为满足 nums[i] % mod…

springboot打包找不到主类

1.打包jar包 idea中点击项目结构project stucture ,选择artfacts 2.

机器学习辅助复合材料预测,性能管理优化创新材料,这种王炸般的组合,还真是大开眼界!

在人工智能与复合材料技术融合的背景下&#xff0c;复合材料的研究和应用正迅速发展&#xff0c;创新解决方案层出不穷。从复合材料性能的精确预测到复杂材料结构的智能设计&#xff0c;从数据驱动的材料结构优化到多尺度分析&#xff0c;人工智能技术正以其强大的数据处理能力…

网络空间安全考研方向:5大专业值得选择,你喜欢哪一个?

网络空间安全考研方向包括网络与信息安全、信息安全工程、信息对抗技术、信息安全与管理、网络安全与执法等专业&#xff0c;旨在培养网络安全领域的高级专业人才&#xff0c;涵盖网络攻击与防御、信息加密与解密、信息安全评估与管理等核心知识与技能&#xff0c;为国家和社会…

4、物品抓取(6自由度机械臂逆运动学)

目录 1.坐标系建立 2.运用解析法计算各个舵机旋转角度 ​3.举例 1.坐标系建立 采用笛卡尔坐标系图1&#xff0c;即由三个互相垂直的坐标轴所组成的坐标系&#xff0c;以机械臂正向为X轴方向&#xff0c;横向为Y轴方向&#xff0c;纵向为Z轴方向。 图1 笛卡尔坐标系 2.运用…

实现qt的多语言转换

前言&#xff1a;qt实现多语言转换主要&#xff0c;用到lrelease.exe&#xff0c;在QT下运行图片和语言转换&#xff0c;需要对对应格式的内容进行转换。图片和语言&#xff0c;甚至是字体均是通过添加.qrc配置&#xff0c;来转换。图片转换成.rcc格式。而语言通过在.excel编辑…

觉飞内衣洗衣机怎么样?各维度专业剖析觉飞、希亦、由利三大机型

由于我们的内衣、内裤和袜子等等贴身小件衣物的清洁频率比一般的衣物要高。而且&#xff0c;如果我们人工手洗的话&#xff0c;不仅会大大浪费了我们的时间&#xff0c;而且还不能进行对这些贴身的以为进行深层消毒和除菌。这种情况下&#xff0c;就得需要一台专门用于清洗内衣…

Passware Kit Mobile

Passware Kit Mobile Passware Kit Mobile年度许可证最多支持 300 次成功移动设备提取&#xff0c;并且每年可续订。年度试用许可证最多支持 5 次成功提取。 从移动设备提取和解密用户数据的取证工具。 最先进的移动取证工具 Passware 取证产品被世界顶级执法机构用于破获需要解…

编译Android使用的ffmpeg库

1 下载NDK 官网&#xff1a;NDK 下载 | Android NDK | Android Developers 2 下载ffmpeg 官网&#xff1a;FFmpeg 3 下载配置msys2 在我之前的博客中有写windows下编译ffmpeg 最详细教程_windows 编译 ffmpeg-CSDN博客 4 编写编译脚本 在ffmpeg的路径下新建一个脚本…

【原创教程】电气电工06:打孔攻丝篇

打孔攻丝,是我们电气电工工作中经常遇到的,比如我们要在某个地方安装一个传感器,我们需要固定在底板上,这时候就需要我们会这个基本技能;我们在柜内布局安装板时,也需要进行打孔攻丝。 下面我们介绍一下这项技能。 首先我们先要熟悉钻头和丝锥,我们来…

STM32标准库学习笔记-11.I2C通信

参考教程&#xff1a;【STM32入门教程-2023版 细致讲解 中文字幕】 I2C通信 I2C&#xff08;Inter IC Bus&#xff09;是由Philips公司八十年代推出的一种通用数据总线两根通信线&#xff1a;SCL&#xff08;Serial Clock&#xff09;、SDA&#xff08;Serial Data&#xff0…

适用于所有Android手机的5个最佳Android手机解锁工具

在当今互联互通的世界中&#xff0c;我们移动设备的安全至关重要。但是&#xff0c;由于忘记密码、屏幕破裂或其他不可预见的问题&#xff0c;用户可能会发现自己被锁定在 Android 设备之外。为了满足这一需求&#xff0c;出现了各种 Android 解锁工具&#xff0c;提供创新的解…

CMake编译不同文件目录下的C++文件

由于我们构建一个项目的时候&#xff0c;通常不会将所有的源文件放在一个文件目录下&#xff0c;这样既不方便开发&#xff0c;也不方便源码阅读&#xff0c;我们通常会对项目文件进行分层&#xff0c;比如分为include、src、res、lib这些目录&#xff0c;src下又分为model、co…

解决怎样在使用Signal Tap进行在线调试时,单独编译工程没有报错,而在Signal tap添加了信号之后进行时编译报错。

问题 如下图所示&#xff0c;我们在Signal Tap中添加完相应的信号之后对于工程进行重新编译时&#xff0c;显示报错信息&#xff1a; 报错原因 这里错误显示的时我们使用的设备只有30个 类型为M9K的RAM位置。然而&#xff0c;当前设计需要超过30个位置才能成功适配。意思就是…

<Linux> 进程控制

目录 一、进程创建 1. fork函数 2. fork函数返回值 3. 写时拷贝 4. fork常规用法 5. fork调用失败原因 6. 如何创建多个子进程&#xff1f; 二、进程终止 1. 进程退出场景 2. 进程退出码 3. errno 4. 进程异常退出 5. 进程常见退出方法 5.1 return退出 5.2 exit退出 5.3 _ex…

JavaFX入门01 制作简易计算器

目录 利用JavaFX Scene Builder 2.0制作图形界面将fxml文件导入IDEA中&#xff0c;并添加JavaFX相关依赖定义启动类&#xff0c;呈现界面定义控制类&#xff0c;实现具体逻辑运行代码&#xff0c;进行测试 利用JavaFX Scene Builder 2.0制作图形界面 制作完成后&#xff0c;将其…

C语言之“ 数组 ”

&#x1f339;个人主页&#x1f339;&#xff1a;喜欢草莓熊的bear &#x1f339;专栏&#x1f339;&#xff1a;C语言基础 目录 前言 一、数组 二、一维数组 2.1 一维数组的创建和初始化 数组创建 数组初始化 数组类型 2.2 一维数组的使用 数组下标 数组打印 数组输…

Spring由于后端逻辑,前端无法展示数据

1.Spring由于后端逻辑&#xff0c;前端无法展示数据 1.代码详情 后端逻辑&#xff1a;在ctroller层&#xff0c;调用getList方法返回的是List列表 使用枚举类来定义了状态码&#xff1a; 状态码SUCCESS返回result类 前端代码&#xff0c;if条件里面是根据自定义的状态码来进…

RM集团在造船中应用虚拟现实辅助工程技术

船舶内饰中的虚拟现实辅助工程 设计船舶内饰是一项资源密集型任务&#xff0c;全球范围内有数百名工程师参与到大型造船项目中。如今&#xff0c;作为船舶内饰设计领域的专家&#xff0c;R&M集团正在利用虚拟现实辅助工程(VAE)技术&#xff0c;优化开发流程。 从游轮上的餐…

浅谈如何克服编程学习中的挫折感

目录 1.概述 2.心态调整 3.学习方法 3.1. 基础知识的打牢 3.2. 分解问题 3.3. 理论与实践相结合 3.4. 利用在线资源和社区 3.5. 教学 3.6. 定期复习与总结 3.7. 持续学习和适应新技术 3.8. 解决实际问题 4.成功经验 5.总结 1.概述 在编程学习的过程中&#xff0c…