算法导论【字符串匹配】—朴素算法、Rabin-Karp、有限自动机、KMP

news2026/2/10 2:16:58

算法导论【字符串匹配】—朴素算法、Rabin Karp、有限自动机、KMP

朴素字符串匹配算法
Rabin-Karp算法
有限自动机
KMP算法

在这里插入图片描述

朴素字符串匹配算法

预处理时间：0
匹配时间：O((n-m+1)m)

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Rabin-Karp算法

预处理时间：Θ(m)，需要预先算出匹配串的哈希值
匹配时间：O((n−m+1)m)，匹配过程与朴素算法类似，但是不需要逐个比对，先比对哈希值，这样可以减少字符匹配次数，计算待匹配的m个字符的哈希值，采用特定方法可以只要常数时间
Rabin-Karp算法的预处理时间为 $\Theta(m)$ ，在最坏情况下，运行时间为 $\Theta((n-m+1)m)$
Rabin-Karp算法比较字符串的哈希值，而不是字符串本身。为了提高效率，可以从当前位置的哈希值轻松计算文本中下一个位置的哈希
简单说就是：每次计算m个字符的字符串的哈希值，然后与匹配串的哈希值对比，如果不相等那这两个字符串肯定不一样，如果哈希值相等，那么再逐个匹配字符，这样可以减少不必要的匹配
如果哈希值不相等，算法将计算下一个M字符序列的哈希值。如果哈希值相等，算法将比较模式和M字符序列。这样，每个文本子序列只有一个比较，只有当哈希值匹配时才需要字符匹配
Rabin Karp算法的预处理阶段包括计算哈希 $H a s h (P)$ 。它可以在恒定的空间和 $O (m)$ 时间内完成。
在搜索阶段，将哈希 $H a s h (P)$ 与哈希 $H a s h (T [j .. j + m - 1])$ 比较就足够了。如果找到了一个等式，仍然需要逐个字符检查等式 $P = T [j .. j + m - 1]$ 。
Rabin Karp算法的时间复杂度为 $Θ ((n - m + 1) m) = Θ (mn)$ (例如，当在n中搜索m时)。当有效点很小时，例如 $O (1)$ ，其预期的文本字符比较数为 $O (n + m) = O (n)$ 。

有限自动机

预处理时间：O(|mΣ|)，|Σ|为待匹配串的字母表大小
匹配时间：Θ(n)，预处理完后只需要扫描一遍字符串即可找到匹配串

KMP算法

预处理时间：Θ(m)
匹配时间：Θ(n)
关键在于计算出前缀 $\pi$ 数组， $\pi$ 就是文本串中在该位置能够得到最长的前后缀长度，举个例子：
预处理过程：- 匹配过程：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/354976.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Lua脚本执行redis指令报错【java.lang.IllegalStateException】

Lua脚本执行redis指令报错【java.lang.IllegalStateException】

Lua脚本执行redis指令报错【java.lang.IllegalStateException】问题出现背景今天在学习redis时，为了让redis的多条指令（取锁、比锁、释放锁）保障原子性，我通过使用一个lua脚本统一去执行redis的的多条指令。在执行lua脚本时报错…

阅读更多...

Python3 File(文件) 方法讲解

Python3 File(文件) 方法讲解

open() 方法 Python open() 方法用于打开1个文件，并返回文件对象。在对文件进行处理过程都需要使用到这个函数，如果这个文件无法被打开，会抛出 OSError。注意：使用 open() 方法一定要保证关闭文件对象，即调用 clo…

阅读更多...

vrrp+mstp+osfp经典部署案例

vrrp+mstp+osfp经典部署案例

LSW1和LSW2和LSW3和LSW4上面启用vrrpmstp组网： vlan 10 全走LSW1出再走AR2到外网，vlan 20 全走LSW2出再走AR3到外网配置注意：mstp实例的根桥在哪，vrrp的主设备就是谁 ar2和ar3上开nat ar2和ar3可以考虑换成两台防火墙来做&…

阅读更多...

Java基础 -- List集合

Java基础 -- List集合

Java基础 -- List集合1. Introduction1.1 好处1.2 常用泛型2. 交集，差集等2.1 自身的方法2.2 1.8jdk stream 新特性2.3 Apache的CollectionUtils工具类（推荐）3. 限定泛型范围4. Awakening1. Introduction 1.1 好处代码复用，多种…

阅读更多...

分布式任务处理：XXL-JOB分布式任务调度框架

分布式任务处理：XXL-JOB分布式任务调度框架

文章目录1.业务场景与任务调度2.任务调度的基本实现2.1 多线程方式实现2.2 Timer方式实现2.3 ScheduledExecutor方式实现2.4 第三方Quartz方式实现3.分布式任务调度4.XXL-JOB介绍5.搭建XXL-JOB —— 调度中心5.1 下载与查看XXL-JOB5.2 创建数据库表5.3 修改默认的配置信息5.4 启…

阅读更多...

斐波那契数列(递归+迭代)

斐波那契数列(递归+迭代)

目录什么是斐波那契数列递归写法使用递归写法的缺点迭代写法(效率高)什么是斐波那契数列斐波那契数列（Fibonacci sequence），又称黄金分割数列，因数学家莱昂纳多斐波那契（Leonardo Fibonacci）以兔子繁殖为例…

阅读更多...

Redis：数据结构

Redis：数据结构

简单动态字符串SDS Redis没有直接使用C语言传统的字符串表示(以空字符结尾的字符数组，以下简称C字符串)，而是自己构建了一种名为简单动态字符串(simple dynamic string, SDS)的抽象类型，并将SDS用作Redis的默认字符串表示。 SDS 的实现…

阅读更多...

aws lambda rust的sdk和自定义运行时

aws lambda rust的sdk和自定义运行时

rust的aws sdk 参考资料 https://docs.aws.amazon.com/sdk-for-rust/latest/dg/getting-started.htmlhttps://awslabs.github.io/aws-sdk-rust/https://github.com/awslabs/aws-sdk-rusthttps://github.com/awsdocs/aws-doc-sdk-examples/tree/main/rust_dev_preview rus sd…

阅读更多...

XlsReadWriteII EXCEL Cell Font 单元字体设置

XlsReadWriteII EXCEL Cell Font 单元字体设置

XlsReadWriteII EXCEL Cell Font 单元字体设置通过XLSReadWriteII5在写EXCEL时，由于XLSReadWriteII5中使用的是个性化的TFont，因而通过参数带入TFont，不能完整地将TFont带入Cell的Font，问题解决如下： 一、问题说明 1、…

阅读更多...

Python学习-----模块2.0（常用模块之时间模块--＞time）

Python学习-----模块2.0（常用模块之时间模块--＞time）

目录前言： time简介导入模块 1.时间戳 2.时间元组 （1）把时间戳转换为元组形式 （2）元组转换为时间戳输出 （3）把元组转换为格式化时间 （4）把时间戳转换为格式化时间…

阅读更多...

【深度学习】模型评估

【深度学习】模型评估

上一章——多分类问题和多标签分类问题文章目录算法诊断模型评估交叉验证测试算法诊断如果你为问题拟合了一个假设函数，我们应当如何判断假设函数是否适当拟合了？我们可以通过观察代价函数的图像，当代价函数达到最低点的时候，此…

阅读更多...

手机/移动端的UI框架-Vant和NutUI

手机/移动端的UI框架-Vant和NutUI

下面推荐2款手机/移动端的UI框架。其实还有很多的框架，各个大厂都有UI框架。目前，找来找去，只有腾讯的移动端是setup语法写的TDesign，其他大厂，虽然都是VUE3写的，但是都还未改成setup的语法，而…

阅读更多...

张晨光-JAVA零基础保姆式JDBC技术教程

张晨光-JAVA零基础保姆式JDBC技术教程

JDBC文档 JDBC概述 JDBC概述 Java DataBase Connectivity Java 数据库连接技术 JDBC的作用通过Java语言操作数据库，操作表中的数据 SUN公司为**了简化、**统一对数据库的操作，定义了一套Java操作数据库的规范，称之为JDBC JDBC的本质是官方…

阅读更多...

【JavaSE专栏10】Java的顺序结构、选择结构和循环结构

【JavaSE专栏10】Java的顺序结构、选择结构和循环结构

作者主页：Designer 小郑作者简介：Java全栈软件工程师一枚，来自浙江宁波，负责开发管理公司OA项目，专注软件前后端开发（Vue、SpringBoot和微信小程序）、系统定制、远程技术指导。CSDN学院、蓝桥云…

阅读更多...

金融错配程度/信贷错配程度/资本错配程度/资本资源错配程度（1998-2021年）

金融错配程度/信贷错配程度/资本错配程度/资本资源错配程度（1998-2021年）

数据来源：根据沪深A股上市公司数据进行测算时间跨度：1998-2021年区域范围：沪深A股上市公司指标说明： 参考邵挺(2010)、周煜皓和张胜勇(2014)的研究，运用金融错配负担水平来衡量信贷错配（Fd&#xff…

阅读更多...

Redis-哨兵模式以及集群

Redis-哨兵模式以及集群

在开始这部分内容之前需要先说一下复制功能，因为这是Redis实现主从数据同步的实现方式。复制功能如果存在两台服务器的话，我们可以使用redis的复制功能，让一台服务器去同步另一台服务器的数据。现在我启动了两台redis服务器，一个端…

阅读更多...

【大数据】HADOOP-Yarn集群界面UI指标项详解（建议收藏哦）

【大数据】HADOOP-Yarn集群界面UI指标项详解（建议收藏哦）

目录首页（Cluster）节点信息Scheduler Metrics：集群调度信息节点信息详解（Nodes）应用列表信息（applications）队列详情页（Scheduler）指标详细说明（非常重要&…

阅读更多...

斯坦福：chatGPT可能有了人类心智，相当于9岁儿童！

斯坦福：chatGPT可能有了人类心智，相当于9岁儿童！

chatGPT已经具备了人类独心智，这话不是我说的，是一位来自斯坦福大学计算机科学家说的。很多玩过chatGPT的人都见识过他的”无所不知”，但是，我觉得最让我吃惊的是，他比以前我们用过那些对话机器人最大的差别就是你甚至…

阅读更多...

「数据科学」数据科学家为什么应该学习PostgreSQL？

「数据科学」数据科学家为什么应该学习PostgreSQL？

SQL是成为数据科学家的必要条件吗?答案是肯定的。数据科学已经发展了，虽然许多数据科学家仍然使用CSV文件(值以逗号分隔的文本文件)，但它们不是最好的选择。Python Panda库允许从CSV文件加载数据，但是这些文件有许多约束。例如，它…

阅读更多...

各种常用C/C++集成开发环境的安装与配置

各种常用C/C++集成开发环境的安装与配置

新学期又开始了，帮助又一堆菜鸟安装和配置C/C集成开发环境是一件恼人的工作。本文引用自作者编写的下述图书; 本文允许以个人学习、教学等目的引用、讲授或转载，但需要注明原作者"海洋饼干叔叔"；本文不允许以纸质及电子出版为目的…

阅读更多...

推荐文章

最新文章