⭐每天一道leetcode:28.找出字符串中第一个匹配项的下标(简单;暴力解;KMP算法,有难度)

news2024/11/26 10:26:46

⭐今日份题目

给你两个字符串 haystackneedle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1

示例1

输入:haystack = "sadbutsad", needle = "sad"
输出:0
解释:"sad" 在下标 0 和 6 处匹配。
第一个匹配项的下标是 0 ,所以返回 0 。

示例2

输入:haystack = "leetcode", needle = "leeto"
输出:-1
解释:"leeto" 没有在 "leetcode" 中出现,所以返回 -1 。

提示

  • 1 <= haystack.length, needle.length <= 104

  • haystackneedle 仅由小写英文字符组成

⭐题目思路

还是先提取一下题目特征点:

  • 完全匹配(与needle相等的部分)

  • 第一个匹配项

  • 返回下标

😭先说说我刚开始的错误思路:

我想的是从头到尾遍历,然后找到最长匹配子串长度,如果和needle的长度相等,那么就是找到了,其中,只要有一个位置不匹配,那么就将匹配子串长度设为0。但我忽略了一个问题,如haystack=mississippi和needle=issip,从第二个字母开始匹配,匹配到issis时发现不是,长度置为0,但是其中包含了needle的is部分,那么长度应该为2且下一个字母应该与needle的第三个字母判断是否相等,所以就出错了。

🍟暴力求解

接下来说说暴力求解的方法:

暴力求解的思路就是生成haystack中所有长度与needle相同的子串,然后找到第一个匹配项,返回其下标。

⭐暴力求解代码
class Solution 
{
public:
    int strStr(string haystack, string needle) 
    {
        int n=haystack.size(), m=needle.size();
        for (int i=0;i+m<=n;i++) //遍历所有子串的开头所在的位置
        {
            int flag=1;
            for(int j=0;j<m;j++)//遍历子串中的所有字母 
            {
                if(haystack[i+j]!=needle[j])//该子串与needle不匹配了 
                {
                    flag=0;
                    break;
                }
            }
            if(flag==1) return i;//该子串匹配了,直接返回开头下标即可
        }
        return -1;//遍历完所有子串了,还没有return下标,说明没有匹配的子串,返回-1
    }
};
暴力求解提交结果

🌮KMP算法

Knuth-Morris-Pratt 算法的核心为前缀函数,记作 π(i),其定义如下:

对于长度为 m 的字符串 s,其前缀函数 π(i)(0≤i<m) 表示 s 的子串 s[0:i] 的最长的相等的真前缀与真后缀的长度。特别地,如果不存在符合条件的前后缀,那么 π(i)=0。其中真前缀与真后缀的定义为不等于自身的的前缀与后缀。

举例说明:字符串aabaaab的前缀函数值依次为0,1,0,1,2,2,3。

π(0)=0,因为 a 没有真前缀和真后缀,根据规定为 0(可以发现对于任意字符串 π(0)=0 必定成立);
​
π(1)=1,因为 aa 最长的一对相等的真前后缀为 a,长度为 1;
​
π(2)=0,因为 aab 没有对应真前缀和真后缀,根据规定为 0;
​
π(3)=1,因为 aaba 最长的一对相等的真前后缀为 a,长度为 1;
​
π(4)=2,因为 aabaa 最长的一对相等的真前后缀为 aa,长度为 2;
​
π(5)=2,因为 aabaaa 最长的一对相等的真前后缀为 aa,长度为 2;
​
π(6)=3,因为 aabaaab 最长的一对相等的真前后缀为 aab,长度为 3。

有了前缀函数,我们就可以快速地计算出模式串在主串中的每一次出现。

(KMP算法解析来自leetcode官方,更多解析欢迎到leetcode官网进行查询)

本题解法:

记字符串 haystack 的长度为 n,字符串 needle 的长度为 m。

我们记字符串 str=needle+#+haystack,即将字符串 needle 和 haystack 进行拼接,并用不存在于两串中的特殊字符 # 将两串隔开,然后我们对字符串 str 求前缀函数。

因为特殊字符 #\ 的存在,字符串 str 中 haystack 部分的前缀函数所对应的真前缀必定落在字符串 needle 部分,真后缀必定落在字符串 haystack 部分。当 haystack 部分的前缀函数值为 m 时,我们就找到了一次字符串 needle 在字符串 haystack 中的出现(因为此时真前缀恰为字符串 needle)。

实现时,我们可以进行一定的优化,包括:

  • 为了节约空间,我们无需真正地创建str,只需顺序遍历字符串needle、#和haystack即可

  • 无需保存所有前缀函数的结果,只需要保存字符串needle部分的前缀函数即可(#的前缀函数必定为0,这样我们计算 π(i) 时,j=π(π(π(…)−1)−1) 的所有的取值中仅有 π(i−1) 的下标可能大于等于 m。我们只需要保存前一个位置的前缀函数,其它的 j 的取值将全部为字符串 needle 部分的前缀函数)

  • 无需特别处理特殊字符 #\,只需要注意处理字符串 haystack 的第一个位置对应的前缀函数时,直接设定 j 的初值为 0 即可

这样我们可以将代码实现分为两部分:

  • 第一部分是求 needle 部分的前缀函数,我们需要保留这部分的前缀函数值。

  • 第二部分是求 haystack 部分的前缀函数,我们无需保留这部分的前缀函数值,只需要用一个变量记录上一个位置的前缀函数值即可。当某个位置的前缀函数值等于 m 时,说明我们就找到了一次字符串 needle 在字符串 haystack 中的出现(因为此时真前缀恰为字符串 needle,真后缀为以当前位置为结束位置的字符串 haystack 的子串),我们计算出起始位置,将其返回即可。

KMP算法代码
class Solution 
{
public:
    int strStr(string haystack, string needle) 
    {
        int n=haystack.size(),m=needle.size();
        if(m==0) return 0;
        vector<int> pi(m);
        for(int i=1,j=0;i<m;i++) //求needle部分的前缀函数
        {
            while(j>0&&needle[i]!=needle[j]) 
            {
                j=pi[j-1];
            }
            if(needle[i]==needle[j]) j++;
            pi[i]=j;
        }
        for(int i=0,j=0;i<n;i++) 
        {
            while(j>0&&haystack[i]!=needle[j]) 
            {
                j=pi[j-1];
            }
            if (haystack[i]==needle[j]) j++;
            if (j==m) 
            {
                return i-m+1;
            }
        }
        return -1;
    }
};

这个算法有难度,欢迎大佬们评论区留言⭐~

KMP算法提交结果

理论上KMP算法的时间复杂度比暴力求解小,内存消耗比暴力求解大,但可能是因为测评数据或者其他原因,导致提交结果如上两图所示。

欢迎大家提供更高效的代码,如果过后有更优化的思路我还会继续更新的,大家评论区见!

点赞收藏不迷路⭐~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1494078.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3.6作业

作业要求&#xff1a;数据库操作的增、删、改 程序代码&#xff1a; #include<myhead.h> int main(int argc, const char *argv[]) {//定义数据库句柄指针sqlite3 * ppDb NULL;//打开数据库&#xff0c;如果数据库不存在&#xff0c;则创建数据库//将数据库句柄由参数…

移动开发:图像查看器

一、新建ImageViewer模块&#xff0c;添加p1-p9图片(注意mdpi后缀) 二、相关代码 1.MainActivity.java文件代码 package com.example.imageviewer;import androidx.appcompat.app.AppCompatActivity;import android.os.Bundle; import android.view.MotionEvent; import and…

Jacob使用教程--通过宏来寻找变量名

说明: 这里做个随比,参考资料请见前面的系列文章 问题展示: 对于一个操作,当我们不知道怎么利用jacob写代码时,而且网上也找不到,可以按照如下操作: 比如,我们要删除 word中的文本框 我们根本不知道文本框,这个变量叫什么,在Microsoft文档哪个父目录下面, 可以通过…

【MySQL】事务?隔离级别?锁?详解MySQL并发控制机制

目录 1.先理清一下概念 2.锁 2.1.分类 2.2.表锁 2.3.行锁&#xff08;MVCC&#xff09; 2.4.间隙锁 2.5.行锁变表锁 2.6.强制锁行 1.先理清一下概念 所谓并发控制指的是在对数据库进行并发操作时如何保证数据的一致性和正确性。在数据库中与并发控制相关的概念有如下几…

测试遍历1e5,1e8数组耗时

1e8大概0.38秒&#xff0c;即380ms 1e5耗时1ms左右&#xff1a; 代码使用方式来自&#xff1a;clock - C Reference (cplusplus.com)

MicroPython ADX51x读取ID和ADC值

from machine import Pin, SoftSPI import timedef ID(agreement):#txbuf 需要将16进制转换为10进制rxbuf bytearray(3) # create a bufferspi SoftSPI(baudrate200000, polarity1, phase0, mosiPin(16), misoPin(4), sckPin(2))spi.init(baudrate125000) # set the bau…

【前端系列】vue

这里写目录标题 一、Vue简介1.1 主流前端框架/库简介 二、下载和安装Vue2.1 下载2.2 安装完成后&#xff0c;检查2.3创建全局安装目录和缓存日志目录2.4 为了下载包快速&#xff0c;改源为淘宝镜像2.5 查看npm配置修改是否成功 三、配置环境变量环境变量—用户变量—选中Path—…

(C语言)深入理解指针1基础

指针是C语言中的一个难点&#xff0c;但如果真正理解了指针&#xff0c;其实没有很难&#xff0c;本篇文章介绍了指针的基础知识&#xff0c;后面还会继续更行指针的内容。感谢支持。 目录 1. 内存和地址 1.1 内存 1.2 究竟该如何理解编址 2. 指针变量和地址 2.1 取地址操…

Midjourney是个什么软件?midjourney订阅教程

数字时代&#xff0c;AI的应用正在不断推动各个领域的发展。其中&#xff0c;AI在艺术和设计领域的运用引起了广泛的关注。作为一款爆火的AI绘画软件&#xff0c;Midjourney通过其独特的原理和便捷的使用方法&#xff0c;为创作者提供了一个创作逼真绘画作品的全新平台 1、AI绘…

初阶数据结构:二叉树

目录 1. 树的相关概念1.1 简述&#xff1a;树1.2 树的概念补充 2. 二叉树2.1 二叉树的概念2.2 二叉树的性质2.3 二叉树的存储结构与堆2.3.1 存储结构2.3.2 堆的概念2.3.3 堆的实现2.3.3.1 堆的向上调整法2.3.3.2 堆的向下调整算法2.3.3.3 堆的实现 1. 树的相关概念 1.1 简述&a…

Java多线程——信号量Semaphore是啥

目录 引出信号量Semaphore &#xff1f;Redis冲冲冲——缓存三兄弟&#xff1a;缓存击穿、穿透、雪崩缓存击穿缓存穿透缓存雪崩 总结 引出 Java多线程——信号量Semaphore是啥 信号量Semaphore &#xff1f; Semaphore 通常我们叫它信号量&#xff0c; 可以用来控制同时访问特…

Day36 网络概述、IP划分、网络模型

文章目录 网络发展史局域网和广域网局域网&#xff08;LAN&#xff09;广域网&#xff08;Wan&#xff09; 光猫路由器 IP地址基本概念地址划分特殊地址&#xff08;后续编程使用&#xff09;IP地址转换端口字节序 网络模型网络模型OSI模型&#xff08;了解&#xff09;TCP/IP模…

15:Zookeeper高可用集群|分布式消息队列Kafka|搭建高可用Hadoop集群

Zookeeper高可用集群&#xff5c;分布式消息队列Kafka&#xff5c;搭建高可用Hadoop集群 Zookeeper集群Zookeeper角色与特性Zookeeper角色与选举Zookeeper的高可用Zookeeper可伸缩扩展性原理与设计Zookeeper安装zookeeper集群管理 Kafka概述在node节点上搭建3台kafka 高可用Had…

Vue.js+SpringBoot开发高校学院网站

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 学院院系模块2.2 竞赛报名模块2.3 教育教学模块2.4 招生就业模块2.5 实时信息模块 三、系统设计3.1 用例设计3.2 数据库设计3.2.1 学院院系表3.2.2 竞赛报名表3.2.3 教育教学表3.2.4 招生就业表3.2.5 实时信息表 四、系…

循环队列--C语音实现

目录 一、循环队列的特点&#xff1a; 二、普通的队列的缺点&#xff1a; 三、循环队列实现原理&#xff1a; 四、循环队列是实现步骤&#xff1a; 1.循环队列的头文件&#xff1a; 2.循环队列的源文件&#xff1a; 3.注意点&#xff1a; 一、循环队列的特点&#xff1…

灯塔:CSS笔记(1)

CSS&#xff1a;层叠样式表 所谓层叠 即叠加的意思&#xff0c;表示样式可以一层一层的层叠覆盖 css写在style标签中&#xff0c;style标签一般写在head标签里面&#xff0c;title标签下面 <!DOCTYPE html> <html lang"en"> <head><meta cha…

java 从环境变量中获取参数及值

window直接在这设置&#xff1a; linux在/etc/profile文件里存放&#xff1a; export keyvalue 然后立即生效&#xff1a;source /etc/profile 代码获取值这样获取&#xff1a; System.getenv("key");

C++初阶篇----类与对象中卷

目录 引言1. 构造函数1.1概念1.2 特性 2. 析构函数2.1 概念2.2 特性 3. 拷贝构造函数3.1 概念3.2特征 4. 赋值运算符重载4.1 运算符重载4.2 赋值运算符重载4.3 前置和后置重载 5.日期类的实现6.const成员7.取地址及const取地址操作符重载 引言 当一个类既没有成员变量又没有成…

【特征选择】CMA-ES(协方差矩阵适应进化策略)

导 读 当将模型拟合到数据集时&#xff0c;可能需要执行特征选择&#xff1a;由于多种原因&#xff0c;仅保留某些特征子集来拟合模型&#xff0c;而丢弃其余特征具有一定的必要性&#xff0c;如下&#xff1a; 保持模型的可解释性&#xff08;特征太多会使解释变得更加困难&am…

css-解决Flex布局下居中溢出滚动截断问题

css-解决Flex布局下居中溢出滚动截断问题 1.出现的问题2.解决方法2.1 Flex 布局下关键字 safe、unsafe2.2 使用 margin: auto 替代 justify-content: center2.3 额外嵌套一层 1.出现的问题 在页面布局中&#xff0c;我们经常会遇到/使用列表内容水平居中于容器中&#xff0c;一…