数据结构(邓俊辉)学习笔记】串 15——BM_GS算法:综合性能

news2024/11/24 11:54:47

1.BM之性能

在这里插入图片描述

接下来,针对已经综合了 bc 和 gs 两种策略的 BM 算法,标定它对应的复杂度,并将这种算法与此前的 KMP 以及蛮力算法在性能上做一个综合的对比分析。

首先是 BM 算法本身的性能。

  1. 在空间方面,除了模式串和文本串本身,我们还需要附加一张 bc 表以及另一张 gs 表,前者的规模线性正比于字母表的规模,而后者的规模则线性正比于模式串本身。
  2. 预处理的成本主要消耗于这两张表的构造过程。我们知道它们都各自可以在线性的时间内完成。

就我们最为关心的查找操作而言,我们已经看到,哪怕仅仅是凭借 bc 策略,我们也可以在最好情况下实现 O(n/m) 的性能。尽管在只采用 bc 策略时,我们在最坏情况下有可能会退化到 O(n * m)的时间效率,但在平行的引入了 gs 策略之后,这种最坏情况将会得到杜绝。

实际上,更为精细的分析表明,在同时兼顾了 bc 和 gs 策略之后,BM算法即便在最坏情况下的运行时间,也不会超过线性。

2.各算法纵览

在结束本节之前,让我们通过这样一组图,来对串匹配的各种典型算法,在性能上,作一对比。
在这里插入图片描述

这里的纵轴表示运行时间,而这3个标尺由低到高分别表示 n/m,n +m 以及 n *m。

正如我们已经知道的,对于蛮力算法而言:在最坏情况下的运行时间将达到最多的n*m。然而,我们也曾指出,蛮力算法在最好情况下的运行时间也大致在线性的幅度。在在这两种极端情况之间,最大的一个影响因素,实际上是某个概率。也就所谓单次比对成功概率,就蛮力算法而言,这个概率越高,它也就越容易误入歧途,从而导致非常高的时间复杂度。反过来,在这个概率并不是很高的时候,蛮力算法的性能将很自然地接近于线性。

实际上,在通常的意义上。决定这一概率值的最大因素莫过于字母表本省的规模。实际上,单次匹配成功的概率大致与字母表的规模成反比

我们再来看 KMP算法:我们已经证明,无论在什么情况下,它的性能都始终稳定在线性的水平

由此可见,只有在字符表规模非常小的情况下,KMP算法相对于蛮力算法在性能上的优势才会充分地体现出。

这幅图(由左至右第三个)是仅采用 bc 策略的 BM 算法,可以看到,它非常适用于大字符集。当单词匹配成功的概率极低时,它的性能将接近于O(n/m)。当然在字符表规模很小时,bc 策略依然很容易误入歧途,从而导致极高的 n*m 的复杂度。

而只有在将 bc 策略与 gs 策略联合使用时(由左至右第四个),二者才可以相得益彰。可以看到,联合使用这两种策略,在最好情况下,我们依然可以实现O(n/m)的运行时间。同时, BC 策略的缺点也会得到有效地抑制,并保证在最坏情况下,运行时间也不超过线性。

也可以从性能的维度,从最低到最高,划分为3个阶次。

  1. 这是蛮力算法(BF),它在最好情况下也不过线性。而在一般,甚至最坏情况下,它都需要O(n * m) 的时间。
  2. 这里是 bc 策略,可以看到,它的性能变化幅度极大,从最好的O(n /m) 一直到最坏的O(n * m)。
  3. 而 KMP在这,可以看到,它是中规中矩的,始终保持线性的时间复杂度。
  4. 最后是融合了 bc 和 gs 两种策略的 BM 算法,我们可以看到,在最坏的情况下,它也只需线性的运行时间。而在最好的情况下,它甚至可以达到 O(n /m) 。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2087103.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Qt:玩转QPainter序列十

前言 最后的一个解读QPainter源码的系列,剩下的源码全部都是内联函数,自己看看就好。 正文 渲染相关 void setRenderHint(RenderHint hint, bool on true); 功能: 启用或禁用特定的渲染提示。参数: hint:指定要设置的渲染提示,…

基于Leaflet Legend的图例数据筛选实践-以某市教培时空分布为例

目录 前言 一、关于Leaflet.Legend组件 1、Legend组件的主要参数 2、相关参数 二、Legend图例可视化控制 1、违规教培信息的管理 2、违规培训信息时空可视化及图例渲染控制 3、成果展示 三、总结 前言 在很多的地理时空分析系统中,我们经常会遇到一些需求。…

运维-3.分库分表

分库分表 1.介绍2.Mycat概述3.Mycat入门4.Mycat配置4.1 schema.xml4.1.1 schema标签4.1.2 dataNode标签4.1.3 dataHost标签 4.2 rule.xml4.3 server.xml4.3.1 system标签4.3.2 user标签 5.Mycat分片5.1 垂直拆分5.2 水平拆分5.3 分片规则5.3.1 范围分片5.3.2 取模分片5.3.3 一致…

若依微服务Admin控制台不显示ruoyi-file问题解决

本地启动完若依微服务,发现Admin控制台只显示了6个服务,其中ruoyi-file启动成功,但是没有在Admin控制台中显示处理,本章问题,给出这个问题的解决办法。 一、什么是服务监控 监视当前系统应用状态、内存、线程、堆栈、日志等等相关信息,主要目的在服务出现问题或者快要出…

机器学习和深度学习·贝叶斯优化和optuna

贝叶斯优化 贝叶斯优化的思想 先验:取点 似然:假设分布 取了n个点之后… 后验:近似取得极值 贝叶斯优化的数学过程 在贝叶斯优化的数学过程当中,我们主要执行以下几个步骤: 1 定义需要估计的 f ( x ) f(x) f(x)以及…

零基础学习Python(七)

1. 字符串常用方法 lower()、upper():转换为小写字符串、大写字符串 split(str):按照指定字符串str进行分割,结果为列表: email "123qq.com" print(email.split("")) [123, qq.com] count(str)&#xf…

MySQL 系统库

文章目录 一. 概念二. performance_schema1. 概念 2. 检查当前数据库版本是否支持3. performance_schema表分类5. 配置与使用6. 查看执行失败的SQL语句7. 查看最近事务执行信息8. 小结 三. sys系统库1. 使用须知2. 使用3. 查看慢SQL语句慢在哪4. 小结 四. Information_schema1.…

中国城市经济韧性数据集(2007-2022年)

数据来源:数据来自历年《中国城市统计NJ》、各省市《统计NJ》及《中国区域经济统计NJ》 时间范围:2007-2022年 数据范围:中国地级市样例数据: 包含内容: 全部内容下载链接(原始数据计算代码最终数据&…

Spring Boot DevTools:简化开发,实现热部署

Spring Boot DevTools:简化开发,实现热部署 1、如何集成?MavenGradle 2、主要特性3、注意事项 💖The Begin💖点点关注,收藏不迷路💖 Spring Boot DevTools是开发者的得力助手,它通过…

AR 眼镜之-系统通知定制(通知弹窗)-实现方案

目录 📂 前言 AR 眼镜系统版本 系统通知定制 1. 🔱 技术方案 1.1 技术方案概述 1.2 实现方案 1)实现系统通知的监听 2)系统通知显示:通知弹窗 2. 💠 实现系统通知的监听 2.1 继承 NotificationLi…

全场景——(六)Moubus 功能码详解

文章目录 一、功能码概要二、(0x01)读取线圈2.1 功能说明2.2 查询报文2.3 响应报文 三、 (0x02) 读取离散量输入值3.1 功能说明3.2 查询报文3.3 响应报文 三、(0x03)读取保持寄存器值3.1 功能说明3.2 查询报文3.3 响应报文 五、 (…

LabVIEW项目中硬件选型与长期需求沟通

在LabVIEW项目中,选择合适的硬件和有效的需求沟通是成功的关键。大品牌硬件通常具备更高的稳定性和完善的售后服务,而小品牌虽然看似便宜,却可能带来通讯不稳定、技术支持不足等问题,增加开发难度。同时,在科研类项目中…

光性能 -- OSNR Loss均衡

什么是OSNR? OSNR(Optical Signal Noise Ratio )即光信噪比。它是指传输链路中的信号光功率与噪声光功率的比值,OSNR计算公式如下所示: OSNR是决定波分系统性能的最主要因素之一。它决定了传输性能的最高值&#xff0c…

ZaKi:Ingonyama的Prover market基础设施

1. 引言 Ingonyama团队预计在不久的将来会出现大量去中心化证明市场(Prover market)。这些市场的独特之处在于高可用性和高性能的基础设施,以及强大的安全性和透明度保障。 2. 证明市场的出现 零知识 (ZK) Rollups,如 Starknet…

望繁信科技亮相2024数博会:以流程智能引领数字化转型新未来

在全球瞩目的2024中国国际大数据产业博览会(以下简称“数博会”)上,上海望繁信科技有限公司(简称“望繁信科技”)作为大数据流程智能领域的领军企业,隆重亮相并展示了其在数字化转型与人工智能领域的最新科…

如何使用WebSafeCompiler进行网站优化和知识产权保护

关于WebSafeCompiler WebSafeCompiler是一款功能强大的Web安全与优化工具,该工具基于Node.js开发,可以帮助广大研究人员编译静态网站以进行优化或知识产权保护。 WebSafeCompiler(WSC)是一款高级Node.js实用程序,旨在…

Python 处理 PDF 文件(PyPDF2, ReportLab)

Python 是一门强大的编程语言,在处理PDF文件方面有着丰富的库支持,其中最常用的两个库是 PyPDF2 和 ReportLab。PyPDF2 主要用于读取、拆分、合并和修改已有的PDF文件,而 ReportLab 则擅长生成新的PDF文件。 一、PyPDF2 1. PyPDF2 概述 Py…

Mysql剖析(四)----Mysql的行锁、表锁、间隙锁详解

目录 一丶Mysql的锁分类 二丶乐观锁和悲观锁 三丶共享锁和排它锁 四丶表锁页锁和行锁 五丶Mysql锁超时 简介:编程中的锁是一种同步机制,用于控制对共享资源的访问,确保同一时间只有一个线程可以访问共享资源,从而避免竞态条件…

通信协议——Modbus 讲明白了

目 录 Modbus通信协议一、说明1.1 描述1.2 查询1.3 响应 二、异常三、功能码 Modbus通信协议 Modbus由Modicon公司(也是现在的施耐德电气)于1979年开发,是一种工业现场总线协议标准。最初是为使用PLC(可编程逻辑控制器&#xff0…

[激光原理与应用-126]:傅里叶变化与频域分析

目录 一、什么是傅里叶变换 1.1 基本概念 (1)首先,先看时域图像: (2)接下来,频域波形 (3)傅里叶变换 1.2 应用 (1)离散傅里叶变换在图像处…