算法设计与分析:数理基础与串匹配程序设计

news2025/1/12 13:14:48

目录

  • 前言
  • 实验内容
  • 实验流程
  • 实验过程
    • 实验分析
    • 伪代码
    • 代码实现
    • 分析算法复杂度
    • 用例测试
  • 总结

前言

本实验是算法设计与分析课程的一个实验,旨在帮助掌握数理基础和串匹配算法的相关知识,以及如何用C语言实现串匹配程序。本实验分为两个部分:第一部分是数理基础,包括集合、关系、函数、图论等概念的复习和练习;第二部分是串匹配程序设计,要求学生根据给定的问题描述和输入输出格式,设计并实现一个能够在文本中查找模式串的程序。

实验内容

(1)给定两个字符串S和T,利用BF算法,在主串S中查找子串T,并输出查找结果,输出时需以文字形式对查找结果进行定性说明;
(2)要求以C++/C/Java等编程语言进行实现;
(3)建立算法时间复杂度分析模型,并利用计算机统计该算法的执行效率。

实验流程

根据实验内容设计算法伪代码进行算法描述;
利用C++/C/Java等编程语言对算法伪代码进行工程化实现;
输入测试用例对算法进行验证;
列出算法时间复杂度模型并与计算机运行统计时间进行对比分析。

实验过程

实验分析

(1)给定两个字符串S和T,利用BF算法,在主串S中查找子串T,并输出查找结果,输出时需以文字形式对查找结果进行定性说明;

BF算法,即暴力 (Brute Force)算法,是普通的模式匹配算法12,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果2。

例如,如果S = “ababcabcacbab”,T = “abcac”,则BF算法的执行过程如下:

首先将T与S的第一个字符对齐,逐个比较对应的字符,发现第三个字符不相等,然后将T与S的第二个字符对齐,重新开始比较,发现第三个字符不相等,依次类推,直到将T与S的第六个字符对齐时,发现所有的字符都相等,此时匹配成功,输出查找结果为:子串T在主串S中出现了一次,起始位置为6。
如果继续向后查找,可以发现子串T还在主串S中出现了一次,起始位置为12。
如果没有更多的匹配结果,则结束查找。

伪代码

// Define a function to find the occurrences of a substring in a string
function BF(string S, string T, integer pos)
  // Initialize i as the current position in S
  i = pos
  // Initialize j as the current position in T
  j = 0
  // Loop until either S or T is exhausted
  while i < length of S and j < length of T
    // If the current characters match
    if S[i] == T[j]
      // Move to the next characters in both strings
      i = i + 1
      j = j + 1
    // Otherwise
    else
      // Move back i to the next starting position in S
      i = i - j + 1
      // Reset j to the beginning of T
      j = 0
  // If T is exhausted
  if j == length of T
    // Return the starting position of the match in S
    return i - j
  // Otherwise
  else
    // Return -1 to indicate no match
    return -1

// Define the main program
function main()
  // Initialize S as the main string
  S = "ababcabcacbab"
  // Initialize T as the substring to find
  T = "abcac"
  // Initialize pos as the starting position to search from
  pos = 0
  // Initialize result as the variable to store the search result
  result = -1
  // Loop until no more matches are found
  while (result = BF(S, T, pos)) != -1
    // Print the result (add one to make it start from one instead of zero)
    print "子串在主串中出现了一次,起始位置为" + (result + 1)
    // Update pos to the next position after the match
    pos = result + 1

代码实现

以下是BF算法的C语言代码实现

#include <stdio.h>
#include <string.h>

// BF算法函数,返回子串T在主串S中第pos个字符之后的位置
int BF(char *S, char *T, int pos) {
  int i = pos; // i用于指示主串当前位置
  int j = 0; // j用于指示子串当前位置
  while (i < strlen(S) && j < strlen(T)) { // 两个串都未扫描完
    if (S[i] == T[j]) { // 当前字符匹配成功
      i++; // 继续比较下一个字符
      j++;
    } else { // 当前字符匹配失败
      i = i - j + 1; // 主串回溯到下一个位置
      j = 0; // 子串从头开始匹配
    }
  }
  if (j == strlen(T)) { // 子串扫描完毕
    return i - j; // 返回匹配位置
  } else {
    return -1; // 匹配失败
  }
}

int main() {
  char S[] = "ababcabcacbab"; // 主串
  char T[] = "abcac"; // 子串
  int pos = 0; // 查找起始位置
  int result; // 查找结果
  while ((result = BF(S, T, pos)) != -1) { // 循环查找子串
    printf("子串在主串中出现了一次,起始位置为%d\n", result + 1); // 输出结果(位置从1开始计数)
    pos = result + 1; // 更新查找起始位置
  }
  return 0;
}

分析算法复杂度

建立算法时间复杂度分析模型,并利用计算机统计该算法的执行效率。
BF算法的时间复杂度分析如下:

设主串长度为n,子串长度为m,则最多需要进行n-m+1次比较。
每次比较最多需要进行m次操作(当每个字符都相等时)。
因此,BF算法的最坏情况下的时间复杂度为O((n-m+1)m)。
如果m远小于n,则可以近似为O(n
m)。
利用计算机统计该算法的执行效率的方法如下:

可以使用不同长度和内容的主串和子串作为输入数据,测试BF算法在不同情况下的运行时间。
可以使用系统函数或库函数获取当前时间戳,在调用BF算法之前和之后分别获取时间戳,并计算时间差作为运行时间。
可以使用循环多次调用BF算法,并取平均值作为运行时间。
可以使用不同编程语言或编译器实现BF算法,并比较它们之间的运行时间差异。

用例测试

请添加图片描述

总结

本实验的目的是掌握串匹配算法的基本原理和实现方法,以及分析其时间复杂度和空间复杂度。本实验中,我们实现了BF算法,即暴力匹配算法,它是一种最简单的串匹配算法,其思想是从主串的第一个字符开始,依次和模式串的每个字符进行比较,如果相等则继续比较下一个字符,如果不相等则回溯到主串的下一个字符,重复这个过程直到找到匹配或者遍历完主串。BF算法的优点是易于理解和实现,不需要预处理模式串,适用于任何类型的字符集。BF算法的缺点是效率较低,最坏情况下的时间复杂度为O(mn),其中m和n分别是主串和模式串的长度,空间复杂度为O(1)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/561103.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Leetcode -643.子数组最大平均值Ⅰ -645.错误的集合】

Leetcode Leetcode -643.子数组最大平均值ⅠLeetcode -645.错误的集合 Leetcode -643.子数组最大平均值Ⅰ 题目&#xff1a;给你一个由 n 个元素组成的整数数组 nums 和一个整数 k 。 请你找出平均数最大且长度为 k 的连续子数组&#xff0c;并输出该最大平均数。 任何误差小…

Buildroot 切换到国内源

可以在make menuconfig的界面里的Build options–>Mirrors and Download locations中的几个地址依次填入下面几个国内的加速镜像源url地址&#xff0c;速度可以快非常多&#xff01;&#xff01; BACKUP_SITE"http://sources.buildroot.net" KERNEL_MIRROR"…

linux消息队列总结

消息队列&#xff0c;是消息的链接表&#xff0c;存放在内核中。一个消息队列由一个标识符(即队列ID) 来标识 1、特点 &#xff08;1&#xff09;消息队列是面向记录的&#xff0c;其中的消息具有特定的格式以及特定的优先级 &#xff08;2&#xff09;消息队列独立于发送与接收…

chatgpt赋能Python-python_pendown

Python PenDown: 一个简单易用的MarkDown编辑器 在现代化的互联网环境下&#xff0c;搜索引擎优化已经成为了每个网站都必须要面对的问题&#xff0c;而一个网站的SEO质量往往与网站的内容相关。而MarkDown则是现代网络环境下非常受欢迎的一种文本标记语言&#xff0c;因为其语…

数据仓库漫谈-前世今生

数据仓库的内容非常多&#xff0c;每一个子模块拎出来都能讲很久。这里没法讲太多细节&#xff0c;大致思考了三个备选议题&#xff1a; 数据仓库的前世今生 数据仓库体系知识介绍 数仓开发者的路在何方&#xff1f; 既然是第一次分享&#xff0c;感觉还是跟大家普及下数仓的…

百度营销:百度扩量投放技巧

众所周知百度是国内大部分用户都在使用的搜索引擎。百度搜索投放的是关键词形式。今天将带来一些账户优化的建议。放量模式共享预算有哪些投放细节呢&#xff1f;以下梳理了5个小技巧&#xff1a; 1.适合的账户类型 更适合预算充足的广告主。如果当前&#xff0c;你每天的获客…

shell编程快捷命令

shell编程快捷命令 一、快捷排序 — sort 命令二、快捷去重 — uniq 命令三、快捷替换 — tr 命令四、快速裁剪 — cut 命令五、文件拆分 — split 命令七、变量扫描器 — eval 命令 一、快捷排序 — sort 命令 sort命令用于以行为单位&#xff0c;对文件的内容进行排序 语法格…

【轻量化网络系列(3)】MobileNetV3论文超详细解读(翻译 +学习笔记+代码实现)

前言 上周我们学习了MobileNetV1和MobileNetV2&#xff0c;本文的MobileNetV3&#xff0c;它首先引入MobileNetV1的深度可分离卷积&#xff0c;然后引入MobileNetV2的具有线性瓶颈的倒残差结构&#xff0c;后来使用了网络搜索算法&#xff0c;并引入了SE模块以及H-Swish激活函…

Vue监视属性

1&#xff0c;click事件的属性可以些什么&#xff1f; 答&#xff1a;click即click"xxx"&#xff0c;其中xxx可以是一个methods方法&#xff0c;也可以是一些简单的语句&#xff0c;比如i&#xff0c;i<0&#xff1f;250 : 520。即click"add&#xff1b;i&am…

【数据结构】---堆排序:时间复杂度高于(N*logN)的排序别来沾边

文章目录 前言&#x1f31f;一、建堆的两种方式&#xff1a;&#x1f30f;1.1 向上调整建堆(堆排序)&#xff1a;&#x1f4ab;1.1.1 完整代码&#xff1a;&#x1f4ab;1.1.2 流程图(以小堆为例)&#xff1a;升序&#xff1a;建大堆&#x1f4ab;1.1.3 流程图(以小堆为例)&…

数码港元≠港元稳定币,为何被视为法币与虚拟资产间的骨干和支柱

出品&#xff5c;欧科云链研究院 作者&#xff5c;Jason Jiang 临近6月&#xff0c;香港在虚拟资产与Web3领域愈加活跃。据彭博社报道&#xff0c;香港将宣布散户投资者可以根据其新的行业规则交易加密货币&#xff0c;预计个人投资者从6月开始在适当的保障措施下可以交易BTC…

Go Web下gin框架的模板渲染

〇、前言 Gin框架是一个用于构建Web应用程序的轻量级Web框架&#xff0c;使用Go语言开发。它具有高性能、低内存占用和快速路由匹配的特点&#xff0c;旨在提供简单、快速的方式来开发可扩展的Web应用程序。 Gin框架的设计目标是保持简单和易于使用&#xff0c;同时提供足够的…

利用ChatGPT来学习Power BI

学习Power BI&#xff0c;或者说学习微软的相关产品的时候&#xff0c;最讨厌的就是阅读微软的官方文档&#xff0c;写的真的太硬了&#xff0c;有时候实时是啃不动&#xff0c;只能说不愧是巨硬。 但是&#xff0c;我们现在有AI帮忙了啊&#xff0c;ChatGPT3都通过了谷歌L3工…

达利欧《原则》拆书笔记(二)

什么是原则&#xff1f; 原则是应对现实、实现你人生愿望的方法。 假如没有原则&#xff0c;我们将被迫逐一考虑多种类型的事情&#xff0c;主动去应对&#xff0c;就像第一次经历这些事。相反&#xff0c;假如我们把每件事都看作“同一类型事物的又一个表现”&#xff0c;以…

【SpringCloud组件——Feign(远程调用)】

前言&#xff1a; 我们在使用Nacos和Eureka的时候都需要使用远程调用开关RestTemplate发送http请求&#xff0c;但是这种方式在代码编写层面太不优雅了&#xff0c;因此我们可以采用Feign来代替RestTemplate发送http请求。 注&#xff1a;此小节同样使用订单系统和用户系统作…

VXLAN技术了解

VXLAN是使用隧道技术的封装协议&#xff0c;常用于在物理层之上创建overlay网络&#xff0c;赋能虚拟网络。同时支持数据中心网络的虚拟化&#xff0c;并通过提供必要的分段满足多租户的需求。 优势在于 可伸缩性和灵活性&#xff1a;理论上可以使用1600万xlans&#xff0c;但…

读书笔记——《when breath becomes air》《超越自卑》

为啥要两本书一起写读后感&#xff1f; 读完这两本书本来应该分开来写点东西的&#xff0c;不过我认为这两本书应该写不了太多内容。虽然我也看了几本英文原著&#xff08;也写了点东西&#xff09;&#xff0c;但是我明显低估了《when breath becomes air》的难度&#xff0c…

SpringBoot学习之集成JWT(二十八)

一、什么是JWT WT (全称:Json Web Token)是一个开放标准(RFC 7519),它定义了一种紧凑的、自包含的方式,用于作为 JSON 对象在各方之间安全地传输信息。该信息可以被验证和信任,因为它是数字签名的。 比如我们常见的登录流程如下: 流程描述一下: 用户使用账号、密码登…

机器学习-3 K最近邻算法

K最近邻算法 算法概述分类什么是分类&#xff1f;分类需要什么&#xff1f; k近邻&#xff08;KNN&#xff09;分类 KNN算法关键问题k近邻模型的两个关键问题相似性度量——欧氏距离K值的选取 KNN算法流程算法原理算法步骤 数据标准化离差标准化数据标准差标准化数据小数定标标…

文献阅读-A Survey on Transfer Learning

期刊会议&#xff1a;IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING 时间&#xff1a;2010 级别&#xff1a;CCF A 1、为什么需要迁移 许多机器学习和数据挖掘算法的一个主要假设是&#xff0c;训练数据和未来数据必须在相同的特征空间中&#xff0c;并且具有相同…