【字符串匹配算法】KMP、哈希

news2025/1/19 23:25:29

STL O(mn)

C++中提供子串查询的函数可以使用std::string类的相关方法来实现。 

  1. find函数:可以查找一个子串在原字符串中的第一个出现位置。它返回子串的起始索引,如果找不到则返回std::string::npos
  2. substr函数:可以提取原字符串中的一个子串,根据起始位置和长度来确定子串的范围。
  3. compare函数:可以比较两个字符串是否相等或者大小关系
#include<bits/stdc++.h>
const int N=1e5+10;
signed main()
{
	std::string s1="hello world"; 
	std::string s2="hello";
	
	//find函数 
	if(s1.find(s2)!=std::string::npos)//如果是子串 
	{
		std::cout<<"yes"<<'\n';
	}else{
		std::cout<<"no"<<'\n';
	}
	
	//substr提取子串
	std::string s3=s1.substr(0,5);
	std::cout<<s3<<'\n';
	
	//比较字符串大小关系
	
	if(s1.compare(s3)==0) // 字符串相等
	{
		std::cout<<"equl"<<'\n';
		
	}else if(s1.compare(s3)<0){// str1小于str2
	
    	std::cout<<"s1 is less than s3"<<'\n';
    	
	}else{ // str1大于str2
   		std::cout<<"s3 is less than s1"<<'\n';
	} 
	return 0;
}

 find函数的时间复杂度取决于字符串的长度和待查找的子串的长度。在C++标准库中,std::stringfind函数使用的是一种称为"Boyer-Moore-Horspool"算法的快速字符串搜索算法。

在最坏情况下,算法的时间复杂度为O(mn),其中n是字符串的长度,m是待查找的子串的长度。这种情况发生在待查找的子串中的每个字符都与字符串进行了比较,但最终没有匹配成功。

时间复杂度是不如KMP的


KMP算法 O(m+n)

KMP算法是对暴力算法的优化

在暴力算法中我们定义两个指针i,j从0开始,

        如果s[i]==x[j],则i++,j++

        否则j=0(将子串移到开头,重新比较)

KMP算法则是在s[i]!=x[j]的情况下进行优化,如果不相等不将j移到0,而是根据预处理的结果来确定。

比如:

s  BBC ABCDAB ABCDABCDABDE

x  ABCDABD

比如到这一步时,x[j]!=s[i] 

这是暴力做法:

 

这是KMP算法: 

 

我们利用了ABCDAB中 后面的AB等于前面AB这一信息。

字符串头部和尾部会有重复。比如,"ABCDAB"之中有两个"AB"。我们需要学的就是如何利用这一信息。

n e [ i ] = j 的定义是p [ 1 , j ] = p [ i - j + 1 , i ]

对ne数组求解时,要牢抓定义

ne【1】=0,因此i从2开始计算,j从0开始,记录前后缀相等的最大长度

字符串匹配的KMP算法 - 阮一峰的网络日志 (ruanyifeng.com)

如果p【i】==p【j+1】,那么j++

否则j一直往前找,直到p【i】==p【j+1】

最后p【i】==p【j+1】,ne【i】=j

代码 

#include<bits/stdc++.h>
using namespace std;
const int N=1e6+10;
char p[N],s[N];
int m,n;
int ne[N];

signed main()
{
	cin>>n>>p+1>>m>>s+1;
	
	for(int i=2,j=0;i<=n;i++)
	{
		while(j&&p[i]!=p[j+1]) j=ne[j];
		if(p[i]==p[j+1]) j++;
		ne[i]=j;	
	}
	
	for(int i=1,j=0;i<=m;i++)
	{
		while(j&&s[i]!=p[j+1]) j=ne[j];
		if(s[i]==p[j+1]) j++;
		if(j==n)
		{
			std::cout<<i-j<<" ";
			j=ne[j]; 
		}
	}
	 
	return 0;
}

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1107155.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

代码随想录二刷 Day42

62.不同路径 简单题目自己就可以写出来&#xff0c;注意下创建二维vector的方法就可以&#xff0c; dp table如下 class Solution { public:int uniquePaths(int m, int n) {vector<vector<int>> dp(m,vector<int>(n,0));for (int i 0; i < n; i ) {dp[…

消息队列项目创建第二部分

消息队列项目创建第二部分 一、在硬盘上存储信息使用文件存储消息具体存放策略 垃圾回收&#xff08;JVM&#xff09;创建文件管理类——MessageFileManger创建统计文件数据和文件统计文件的读写操作创建消息对应的文件和目录创建一个统一处理异常 消息文件的读写消息的序列化和…

算法通关村第一关——链表经典问题之合并有序链表三种方法一层一层优化

算法通关村第一关——链表经典问题之合并有序链表三种方法一层一层优化 题目描述 将两个升序的链表合并为一个新的升序链表并返回&#xff0c;新链表是通过拼接两个给定的两个链表的所有节点组成的。 解题思路 第一种 新建一个链表&#xff0c;然后分别遍历两个链表&#…

记一次edu站点并拿下的过程cnvd

0x01 jeecg-boot介绍 JeecgBoot是一款基于代码生成器的低代码开发平台&#xff0c;零代码开发&#xff01;采用前后端分离架构&#xff1a;SpringBoot2.x&#xff0c;Ant Design&Vue&#xff0c;Mybatis-plus&#xff0c;Shiro&#xff0c;JWT。强大的代码生成器让前后端代…

k8s-17 k8s调度

调度器通过 kubernetes 的 watch 机制来发现集群中新创建且尚未被调度到 Node上的 Pod。调度器会将发现的每一个未调度的 Pod 调度到一个合适的 Node 上来运行。 kube-scheduler 是 Kubernetes 集群的默认调度器&#xff0c;并且是集群控制面的一部分如果你真的希望或者有这方面…

python如何连接数据库 ?一文详解pymysql的用法 。

使用Python连接数据库是常用的操作 &#xff0c;那么在Python代码中取操作数据库呢 &#xff1f; 接下来介绍一个包 &#xff1a;pymysql .它能帮我们在代码中连接MySQL数据库进行各种操作。 1.常用数据库模块 在做自动化测试时&#xff0c;我们经常会查库的需求 &#xff0c;…

解剖—顺序表相关OJ练习题

目录 一、删除有序数组中的重复项&#xff0c;返回出现一次元素的个数。 二、原地移除数组中所有数值等于val的元素 三、合并两个有序数组 四、旋转数组 五、数组形式的整数加法 一、删除有序数组中的重复项&#xff0c;返回出现一次元素的个数。 26. 删除有序数组中的重…

Service Mesh和Kubernetes:加强微服务的通信与安全性

文章目录 什么是Service Mesh&#xff1f;Service Mesh的优势1. 流量控制2. 安全性3. 可观测性 Istio&#xff1a;Service Mesh的领军者流量管理安全性可观测性 Linkerd&#xff1a;轻量级Service Mesh流量管理安全性可观测性 Istio vs. Linkerd实际应用结论 &#x1f388;个人…

vscode中4个json的区别和联系

在vscode中快捷键ctrlshiftp&#xff0c;然后输入setting&#xff0c;会出现下图几个选项 当不同设置之间出现冲突时&#xff0c;听谁的&#xff1a; Open Workspace Settings(JSON) > Open Settings(JSON) Open User Settings > Open Default Settings(JSON) Open Wo…

openstack 云主机 linux报 login incorrect

还未输入密码就提示login incorrect 不给输密码位置 完全不给输密码的机会 关机进入单用户 检查登录安全记录 vi /var/log/secure 发现 /usr/lib64/security/pam_unix.so 报错 将正常的机器提取/usr/lib64/security/pam_unix.so 比对MD5一致&#xff0c; 另外判断 libtir…

车载开发学习——CAN总线

CAN总线又称为汽车总线&#xff0c;全程为“控制器局域网&#xff08;Controller Area Network&#xff09;”&#xff0c;即区域网络控制器&#xff0c;它将区域内的单一控制单元以某种形式连接在一起&#xff0c;形成一个系统。在这个系统内&#xff0c;大家以一种大家都认可…

市值缩水90%以上,泛生子何以败退美股?

癌症是人类面临的最大健康威胁之一&#xff0c;也是医学界最难攻克的难题之一。随着科技的发展&#xff0c;癌症精准医疗逐渐成为治疗癌症的新方向&#xff0c;癌症精准医疗能通过对癌细胞的基因检测和分析&#xff0c;为患者提供个性化的治疗方案。然而&#xff0c;这一领域的…

redis(其它操作、管道)、django中使用redis(通用方案、 第三方模块)、django缓存、celery介绍(celery的快速使用)

1 redis其它操作 2 redis管道 3 django中使用redis 3.1 通用方案 3.2 第三方模块 4 django缓存 5 celery介绍 5.1 celery的快速使用 1 redis其它操作 delete(*names) exists(name) keys(pattern*) expire(name ,time) rename(src, dst) move(name, db)) randomkey() type(na…

VBA技术资料MF71:查找所有空格并替换为固定字符

我给VBA的定义&#xff1a;VBA是个人小型自动化处理的有效工具。利用好了&#xff0c;可以大大提高自己的工作效率&#xff0c;而且可以提高数据的准确度。我的教程一共九套&#xff0c;分为初级、中级、高级三大部分。是对VBA的系统讲解&#xff0c;从简单的入门&#xff0c;到…

实现实时美颜:主播直播美颜SDK的技术细节

在今天的数字时代&#xff0c;直播和实时互动成为了日常生活的一部分&#xff0c;而主播直播美颜SDK的出现为用户提供了更加精美的视觉体验。这项技术的背后有着复杂的技术细节&#xff0c;从图像处理到机器学习&#xff0c;本文将深入探讨主播直播美颜SDK的技术细节&#xff0…

四边形不等式

区间dp问题&#xff0c;状态转移方程&#xff1a; dp[i][j] min( dp[i][k] dp[k1][j] w[i][j] ) //w[i][j]是从i到j的&#xff0c;一个定值 不随k改变&#xff0c;而且w的值只和i j有关&#xff0c;是它们的二元函数。 其中i<k<j ,初始值dp[i][i]已知。 含义&#x…

第三类医疗器械经营许可证经营范围

在我国&#xff0c;医疗器械监督管理条例规定:医械经营企业要依据主营产品办理相应许可证。医疗器械根据其风险性又分为三类&#xff0c;一类医疗器械实行产品备案管理&#xff0c;第二类、第三类医疗器械实行产品注册管理&#xff0c;经营第二类、第三类医疗器械应当持有《医疗…

Day 2 Qt

#include "my_widget.h" #include "ui_my_widget.h"My_Widget::My_Widget(QWidget *parent): QWidget(parent), ui(new Ui::My_Widget) {ui->setupUi(this);//窗口的相关设置 // this -> resize(800,500);this -> setWindowTitle("QQ聊天…

APP备案公钥、证书MD5指纹/签名MD5值获取方法

本文只详细讲解android app获取方法&#xff0c;三种方式&#xff1a; 1. 你的应用已安装到手机&#xff0c;android应用市场搜索下载安装 APP备案助手&#xff0c;此app可直接获取所有已安装app的公钥、证书MD5指纹/签名MD5值&#xff0c;示例&#xff1a;获取 抖音app公钥、…

每日一练 | 华为认证真题练习Day120

1、MPLS域中的LER全称为Label Egress Router。 A. 对 B. 错 2、如果一个以太网数据帧的Type/Length字段的值为0x0800&#xff0c;则此数据帧所承载的上层报文首部长度范围为20-60B。 A. 对 B. 错 3、在VRP平台上&#xff0c;可以通过下面哪种方式访问上一条历史命令&#x…