Sunday 算法详解

news2024/9/22 7:23:10

Sunday 算法

Sunday算法是Daniel M.Sunday于1990年提出的字符串模式匹配。其核心思想是:在匹配过程中,模式串发现不匹配时,算法能跳过尽可能多的字符以进行下一步的匹配,从而提高了匹配效率。

一、匹配机制

匹配机制非常容易理解:

  • 目标字符串 String
  • 模式串 Pattern
  • 当前查询索引 idx (初始为 0)
  • 待匹配字符串 str_cut : String [ idx : idx + len(Pattern) ]

每次匹配都会从 目标字符串中 提取 待匹配字符串模式串 进行匹配:

  • 若匹配,则返回当前 idx
  • 不匹配,则查看 待匹配字符串 的后一位字符 c
    1. c 存在于 Pattern 中,则 idx = idx + 偏移表[c]
    2. 否则,idx = idx + len(pattern)

循环上述匹配过程直到 idx + len(pattern) > len(String)

二、偏移表

偏移表的作用是存储每一个在 模式串 中出现的字符,在 模式串 中出现的最右位置到尾部的距离 +1,例如 aab:

  • a 的偏移位就是 len(pattern)-1 = 2
  • b 的偏移位就是 len(pattern)-2 = 1
  • 其他的均为 len(pattern)+1 = 4

综合一下:

s h i f t [ w ] = { m − m a x { i < m ∣ p [ i ] = w } if w is in P[0..m-1] m + 1 otherwise shift[w] = \begin{cases}m-max\{i<m|p[i]=w\}\quad \text {if w is in P[0..m-1]} \\ m+1\quad \text{otherwise} \end{cases} shift[w]={mmax{i<mp[i]=w}if w is in P[0..m-1]m+1otherwise

三、举例

String: checkthisout Pattern: this

Step 1:
在这里插入图片描述

  • idx = 0
  • 待匹配字符串为:chec
  • 因为 chec != this
  • 所以查看 chec 的下一个字符 k
  • k 不在 Pattern 里
  • 所以查看 偏移表idx = idx + 5

Step 2:
在这里插入图片描述

  • idx = 5
  • 待匹配字符串为:this
  • 因为 this == this
  • 匹配,所以返回 5

四、算法分析

时间复杂度: 最坏情况 O ( n m ) O(nm) O(nm) ,平均情况 O ( n ) O(n) O(n)
空间复杂度: O ( c ) O(c) O(c),c为位移表长度

五、代码实现

class Solution:
    def strStr(self, haystack, needle):
        haystack_length = len(haystack)
        needle_length = len(needle)
        return self.sunday(haystack, haystack_length, needle, needle_length)

    def sunday(self, s, s_len, p, p_len):
        bc_move_dict = self.badChatMove(p, p_len)
        now = 0
        # 如果匹配字符的位置到达两字符串长度的差值,则不可能存在匹配字串,则退出循环
        while now <= s_len - p_len:
        	# 比对当前位置的子串是否和模式串匹配
            if s[now: now+p_len] == p:
                return now
            # 如果以及到达两字符串长度的差值,那么这将是最后一个可能匹配到的子串
            # 经过上面的比对没有匹配的话,直接返回-1
            if now == s_len - p_len:
                return -1
            # 更新下标,如果模式串不包含匹配串后面的第一个字符,则移动 p_len+1 个位数
            now += bc_move_dict.get(s[now+p_len], p_len+1)
        return -1
	
	# 坏字符移动数量计算
    def badChatMove(self, p, p_len):
        bc_move_dict = dict()
        for i in range(p_len):
        	# 记录该字符在模式串中出现的最右位置到尾部的距离+1
            bc_move_dict[p[i]] = p_len - i
        return bc_move_dict

参考文章

<<Sunday 解法>>

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/69438.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PyTorch笔记 - 开发技巧与爱因斯坦标示法(einops)

欢迎关注我的CSDN:https://blog.csdn.net/caroline_wendy 本文地址:https://blog.csdn.net/caroline_wendy/article/details/128222398 NLP seq2seq代码编写技巧 数据 tokenization,离散符号,翻译,划分tokentoken2idx,将token变成idxadd SoS&EoS,开头和结尾添加标识…

代码随想录算法训练营第五十七天| LeetCode647. 回文子串、LeetCode516. 最长回文子序列

一、LeetCode647. 回文子串 1&#xff1a;题目描述&#xff08;647. 回文子串&#xff09; 给你一个字符串 s &#xff0c;请你统计并返回这个字符串中 回文子串 的数目。 回文字符串 是正着读和倒过来读一样的字符串。 子字符串 是字符串中的由连续字符组成的一个序列。 具有不…

Unity3d C#获取海康/大华摄像头在萤石平台直播视频流功能(含源码)

前言 实现该功能主要是因为之前硬件实施工程是给我的视频流地址总是失效&#xff0c;原因就是视频流地址其实都有一个过期时间&#xff08;类似于&#xff1a;rtmp://rtmp01open.ys7.com:/v3/openlive/_1_1?expire1669341172&id***&t8cb15956b1ca09770d1496bff3b8ccb…

电子书小程序源码

资源简介 价值8k的的电子书资料文库文集ip打造流量主小程序系统源码 个人即可搭建&#xff0c;附上此系统源码以及详细的‘’一小时的小白手把手教搭建教程‘’ 下面开始系统介绍&#xff1a; 无意中在群里刷到一个文集小程序 点击立即学习里面&#xff0c;是电子书。 点击了…

虹科分享|基于CAN/CAN FD技术的机器狗是什么样的?

机器狗是一种结合了仿生学和人工智能的仿生四足机器人&#xff0c;其外形与四足动物相似&#xff0c;由于其运动摆脱了轮式和履带式的设计&#xff0c;机器狗的机动性更为强大&#xff0c;能够灵活地完成多种复杂的运动&#xff0c;并能够在不同的地理环境中自主行走&#xff0…

oracle 定时任务删除数据

这几天在工作中遇到一个问题就是&#xff1a;要删除表在备份表中已存在的数据&#xff08;2000多万数据&#xff09;&#xff0c;这个数据是SQL查出来的&#xff0c;例如&#xff1a; select count(1) from JY_SALE_FULLORDER_DTL where LINE_NUM in (select b.LINE_NUMfrom JY…

osgEarth示例分析——osgearth_splat

前言 osgearth_splat示例&#xff0c;展示如何加载图片贴在地球上&#xff0c;且通过分类&#xff0c;贴文理绘制森林、草地等。 执行命令&#xff1a;osgearth_splatd.exe 效果 整个地球的影像&#xff0c;加载的一张贴图。黑白点点&#xff0c;是不同的贴图。当拉进放大后…

云计算与传统计算的区别有哪些?

目前&#xff0c;许多企业依赖传统计算&#xff0c;而一些企业也正在迁移到云计算。原因是两者都有各自的优势点&#xff0c;这就是为什么对企业来说&#xff0c;在两者之间进行选择可能会变得有点困难。 什么是传统计算? 传统计算的概念是不言而喻的。传统上&#xff0c;物理…

[附源码]Python计算机毕业设计Django兴达五金日杂批发商店管理系统

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

微服务框架 SpringCloud微服务架构 21 RestClient 操作文档 21.5 批量导入文档

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式&#xff0c;系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 SpringCloud微服务架构 文章目录微服务框架SpringCloud微服务架构21 RestClient 操作文档21.5 批量导入文档21.5.1 批量导入文档21 RestClie…

【Java面试】说一说JDK1.6之后对synchronized的优化

文章目录为什么synchronized性能低下&#xff1f;JDK1.6对synchronized的优化偏向锁(无锁状态)轻量级锁(自旋)重量级锁(阻塞)这些锁的优缺点早期JDK对synchronized的实现是重量级的&#xff0c;每一次的获取锁都需要请求OS。 而在大部分情况下&#xff0c;同步方法是运行在单线…

若依权限校验源码分析

若依的权限校验实现原理就是AOP自定义注解&#xff0c;代码并不多&#xff0c;debug跟一遍之后很容易理解&#xff0c;详细流程整理如下 用到的类 注解类RequiresLogin、RequiresPermissions、RequiresRoles&#xff0c;分别用于登录认证、权限认证和角色认证切面类PreAuthor…

极米H5评测:极米H5投影仪参数如何?极米H5值得入手吗?

作为家用智能投影领域的佼佼者&#xff0c;极米在上个月结束的双11活动中&#xff0c;实现了全网成交总额破8亿&#xff0c;并获得天猫、京东和抖音投影品类销量和GMV双第一的成绩&#xff0c;同时这也是极米连续第九次成为投影品类冠军。能够实现如此优秀的成绩&#xff0c;也…

JS逆向之webpack 通用扣取思路

本文所有教程及源码、软件仅为技术研究。不涉及计算机信息系统功能的删除、修改、增加、干扰,更不会影响计算机信息系统的正常运行。不得将代码用于非法用途,如侵立删!标题 环境 win10chrome106目标站:aHR0cHM6Ly93d3cuZ205OS5jb20v 加密参数 password: K6YEmQrNy%2FQgdnac…

安卓玩机搞机技巧综合资源------EROFS分区格式 小米红米机型分区类型 刷写recovery方法列举【三】

接上篇 安卓玩机搞机技巧综合资源------如何提取手机分区 小米机型代码分享等等 【一】 安卓玩机搞机技巧综合资源------开机英文提示解决dm-verity corruption your device is corrupt. 设备内部报错 AB分区等等【二】 &#x1f49d;&#x1f49d;&#x1f49d;&#x1f49d…

高性能数据访问中间件 OBProxy(七):安全、协议和监控

经过本系列前六篇文章的分布式特性介绍&#xff0c;相信大家已经了解了 OBProxy 在 OceanBase 数据库整体架构下的作用。本篇文章我们将换一个视角&#xff0c;介绍一些偏“中间件”的功能&#xff1a;安全、协议和监控功能。 从 OBProxy 整体来看&#xff0c;安全、协议和监控…

Scratch少儿编程英语教程

Scratch少儿编程英语教程 在 Scratch 中学习编程、创建游戏、玩得开心&#xff01;致未来编码员的家长和老师 课程英文名&#xff1a;Programming for Kids and Beginners Learn to Code in Scratch 此视频教程共5.0小时&#xff0c;中英双语字幕&#xff0c;画质清晰无水印…

网上图书商城小程序毕业设计,微信图书商城小程序系统设计与实现,微信小程序毕业设计论文怎么写毕设源码开题报告需求分析怎么做

功能清单 【后台管理员功能】 会员列表&#xff1a;查看所有注册会员信息&#xff0c;支持删除 录入资讯&#xff1a;录入资讯标题、内容等信息 管理资讯&#xff1a;查看已录入资讯列表&#xff0c;支持删除和修改 广告设置&#xff1a;上传图片和设置小程序首页轮播图广告地…

QT(3)-QTableView

QTableView1 说明2 常用函数2.1 clearSpans2.2 setSpan2.3 columnAt2.4 rowAt2.5 columnSpan2.6 rowSpan2.7 columnViewportPosition2.8 rowViewportPosition2.9 列宽、行高2.9.1 columnWidth2.9.2 rowHeight2.9.3 setColumnWidth2.9.4 setRowHeight2.9.5 resizeColumnToConten…

gitlab结合semantic-release自动化发布npm插件(二)

前言 在内部组织架构开发npm包时&#xff0c;很多人会想到规范问题&#xff0c;难道按前文gitlab结合semantic-release自动化规范git流程(一)所描述根据git的CI/CD就可以了吗&#xff0c;每次发布都会版本对应的新增&#xff0c;而往往新增的版本不是我们所需要的&#xff0c;…