24考研数据结构-第四章:串

news2024/9/22 7:22:59

目录

  • 第四章:串
  • 4.1串的定义和实现
    • 4.1.1串的定义
    • 4.1.2串的基本操作
        • 字符集编码
    • 4.1.3串的存储结构
      • 1. 定长顺序存储表示
        • 基本操作实现(基于方案四)
      • 2. 堆分配存储表示
      • 3. 串的链式存储
        • 结合链表思考优缺点
    • 知识回顾
  • 4.2串的模式匹配
    • 4.2.1朴素模式匹配算法
        • 时间复杂度分析:
    • 4.2.2改进的模式匹配算法——KMP算法
      • 1. 求next数组
      • 2. 利用next数组进行模式匹配
      • 3. 时间复杂度分析
    • 4.2.3 next数组的优化思路nextval,优化KMP

第四章:串

4.1串的定义和实现

4.1.1串的定义

  • 串: 零个或多个字符组成的有限序列,如 S = ‘iPhone 11 Pro Max?’;

  • 在这里插入图片描述

  • 串名:S是串名;

  • 串的长度:串中字符的个数n;

  • 空串:n=0时的串;

  • 子串:串中任意多个连续的字符组成的子序列称为该串的子串;

  • 主串:包含子串的串

  • 字符在主串中的位置:某个字符在串中的序号(从1开始)

  • 子串在主串中的位置:子串的第一个字符在主串中的位置;

空串 V.S 空格串:

  • M = ‘’ 是空串;
  • N = ’ ’ 是空格串;

串 V.S 线性表:

  • 串是特殊的线性表,数据元素之间呈线性关系(逻辑结构相似);
  • 串的数据对象限定为字符集:中文字符、英文字符、数字字符、标点字符…
  • 串的基本操作,如增删改除通常以子串为操作对象

4.1.2串的基本操作

在这里插入图片描述
StrCompare(S, T) 串的比较操作,参照英文词典排序方式;若S > T,返回值>0; S = T,返回值=0 (需要两个串完全相同) ; S < T,返回值<0;
在这里插入图片描述

字符集编码

在这里插入图片描述

4.1.3串的存储结构

1. 定长顺序存储表示

#define MAXLEN 255   //预定义最大串长为255

typedef struct{
    char ch[MAXLEN];   //静态数组实现(定长顺序存储)
                       //每个分量存储一个字符
                       //每个char字符占1B
    int length;        //串的实际长度
}SString;

串长的两种表示法:

  • 方案一:用一个额外的变量length来存放串的长度(保留ch[0]);

  • 方案二:用ch[0]充当length;
    优点:字符的位序和数组下标相同
    缺点: 字符串长度0-2^8-1

  • 方案三:没有length变量,以字符’\0’表示结尾(对应ASCII码的0);
    缺点:需要从头到尾遍历

  • 方案四——最终使用方案ch[0]废弃不用声明int型变量length来存放串的长度(方案一与方案二的结合)

基本操作实现(基于方案四)

#define MAXLEN 255

typedef struct{
    char ch[MAXLEN];   
    int length;       
}SString;

// 1. 求子串
bool SubString(SString &Sub, SString S, int pos, int len){
    //子串范围越界
    if (pos+len-1 > S.length) //pos+len-1是因为这样子是最后一个元素的位置
        return false;  //如下边的i<pos+len,就是i最大值是pos+len-1
    
    for (int i=pos; i<pos+len; i++)
        Sub.cn[i-pos+1] = S.ch[i];
    
    Sub.length = len;

    return true;
}

// 2. 比较两个串的大小
int StrCompare(SString S, SString T){
    for (int i; i<S.length && i<T.length; i++){
        if(S.ch[i] != T.ch[i])
            return S.ch[i] - T.ch[i];
    }
    //扫描过的所有字符都相同,则长度长的串更大
    return S.length - T.length;
}

// 3. 定位操作
int Index(SString S, SString T){
    int i=1;
    n = StrLength(S);
    m = StrLength(T);
    SString sub;        //用于暂存子串

    while(i<=n-m+1){  //n-m+1是最后一个能取到长m的字串的位置,所以可以等于
        SubString(Sub,S,i,m);
        if(StrCompare(Sub,T)!=0)
            ++i;
        else 
            return i;    // 返回子串在主串中的位置
    }
    return 0;            //S中不存在与T相等的子串
}


2. 堆分配存储表示

堆存储结构的特点:仍以一组空间足够大的、地址连续的存储单元依次存放字符序列,但它们的存储空间是在程序执行过程种动态分配的 。
通常,C语言提供的串类型就是以这种存储方式实现的。由动态分配函数malloc()分配一块实际串长所需要的存储空间(“堆”),如果分配成功,则返回此空间的起始地址,作为串的基址。由free()释放串不再需要的空间

堆存储结构的优点堆存储结构既有顺序存储结构的特点,处理(随机取子串)方便,操作中对串长又没有任何限制,更显灵活,因此在串处理的应用程序中常被采用。

//动态数组实现
typedef struct{
    char *ch;           //按串长分配存储区,ch指向串的基地址
    int length;         //串的长度
}HString;

HString S;
S.ch = (char *) malloc(MAXLINE * sizeof(char)); //基地址指针指向连续空间的起始位置
                                                //malloc()需要手动free()
S.length;


3. 串的链式存储

typedef struct StringNode{
    char ch;           //每个结点存1个字符
    struct StringNode *next;
}StringNode, * String;


问题:存储密度低,每个字符1B,每个指针4B(32位的机器上)
解决方案:每一个链表的结点存储多个字符——每个结点称为块——块链结构

typedef struct StringNode{
    char ch[4];           //每个结点存多个个字符
    struct StringNode *next;
}StringNode, * String;


结合链表思考优缺点

  • 存储分配角度:链式存储的字符串无需占用连续空间,存储空间分配更灵活
  • 操作角度:若要在字符串中插入或删除某些字符,则顺序存储方式需要移动大量字符,而链式存储不用;
  • 若要按位序查找字符,则顺序存储支持随机访问,而链式存储只支持顺序访

知识回顾

在这里插入图片描述

4.2串的模式匹配

模式匹配:子串的定位操作称为串的模式,它求的是子串(常称模式串)在主串中的位置。
在这里插入图片描述

4.2.1朴素模式匹配算法

n-m+1主串中能有的串个数

int Index(SString S, SString T){
    int i=1;                //扫描主串S
    int j=1;                //扫描模式串T
    while(i<=S.length && j<=T.length){
        if(S.ch[i] == T.ch[j]){
            ++i;
            ++j;             //继续比较后继字符
        }
        else{
            i = i-j+2;  //回到这次匹配的第一个位置之前+1得到匹配的第一个位置
            //再+1才能得到下一次匹配的第一个位置
            j=1;             //指针后退重新开始匹配
        }
    }
    if(j>T.length)  //匹配成功,返回第一个字符位置
        return i-T.length;
    else
        return 0;
}

时间复杂度分析:

主串长度为n,模式串长度为m
最多比较n-m+1个子串

  • 最坏时间复杂度 = O(nm)
    每个子串都要对比m个字符(对比到最后一个字符才匹配不上),共要对比n-m+1个子串,复杂度 = O((n-m+1)m) = O(nm - m^2 + m) = O(nm)
    PS:大多数时候,n>>m
  • 比较好时间复杂度 = O(n)
    每个子串的第一个字符就匹配失败,共要对比n-m+1个子串,复杂度 = O(n-m+1) = O(n)
    匹配一次就匹配成功:O(m)

4.2.2改进的模式匹配算法——KMP算法

不匹配的字符之前,一定是和模式串一致的;
根据模式串T,求出next数组(只与模式串有关,与主串无关),利用next数组进行匹配,当匹配失败时,主串的指针 i 不再回溯!
next数组是根据子串求出来的,当前面的字符串已知时如果有重复的,从当前的字符匹配即可。

1. 求next数组

  • 作用:当模式串的第j个字符失配时,从模式串的第next[j]继续往后匹配;
  • 对于任何模式串,当第1个字符不匹配时,只能匹配下一个子串,因此,next[1] = 0——表示模式串应右移一位,主串当前指针后移一位,再和模式串的第一字符进行比较;
  • 对于任何模式串,当第2个字符不匹配时,应尝试匹配模式串的第一个字符,因此,next[2] = 1;

在这里插入图片描述
分界线后的第一个元素的位序就是next[j]的值

2. 利用next数组进行模式匹配

int Index_KMP(SString S, SString T, int next[]){
    int i=1;     //主串
    int j=1;     //模式串
    while(i<S.length && j<=T.length){
        if(j==0 || S.ch[i]==T.ch[j]){      //第一个元素匹配失败时
            ++j;
            ++i;         //继续比较后继字符
        }
        else
            j=next[j]   //模式串向右移动
    }
    if(j>T.length)
        return i-T.length; //匹配成功
}


在这里插入图片描述

3. 时间复杂度分析

  • 求next数组时间复杂度 = O(m)
  • 模式匹配过程最坏时间复杂度 = O(n)
  • KMP算法的最坏时间复杂度 = O(m+n)

4.2.3 next数组的优化思路nextval,优化KMP

在这里插入图片描述
如果next[j]的值对应的模式串的值相等,则说明就算跳转到这个位置也一样匹配失败,所以nextval[j]的值就是next[j]的值减一,再判断还会不会一样。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/824263.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ChatGPT辅助写论文:提升效率与创造力的利器

写作是人类最重要的交流方式之一&#xff0c;也是学术研究中不可或缺的环节。然而&#xff0c;写作并不是一件容易的事情&#xff0c;尤其是对于科研人员来说&#xff0c;他们需要花费大量的时间和精力来撰写高质量的论文&#xff0c;并且面临着各种各样的挑战&#xff0c;如语…

用栈实现队列——数据结构与算法

&#x1f636;‍&#x1f32b;️Take your time ! &#x1f636;‍&#x1f32b;️ &#x1f4a5;个人主页&#xff1a;&#x1f525;&#x1f525;&#x1f525;大魔王&#x1f525;&#x1f525;&#x1f525; &#x1f4a5;代码仓库&#xff1a;&#x1f525;&#x1f525;魔…

Flowable-子流程-事务子流程

目录 定义图形标记XML内容使用示例视频教程 定义 事务子流程也称作事务块&#xff0c;是一个嵌入式子流程&#xff0c;用来处理一组必须在同一个事务中完成的活 动&#xff0c;使它们共同成功或失败。事务子流程中如果有一个活动失败或者取消&#xff0c;整个事务子流程的所有…

<C++> 四、模板初阶

1.泛型编程 泛型编程&#xff1a;编写与类型无关的通用代码&#xff0c;是代码复用的一种手段。模板是泛型编程的基础。 如何实现一个通用的交换函数呢&#xff1f;使用函数重载可以实现 void Swap(int &left, int &right) {int temp left;left right;right temp; …

延时函数

其实从学习FreeRTOS以来&#xff0c;一直有个疑问&#xff1a;为什么freertos.c中的延时函数要使用osDelay()&#xff0c;而不直接使用HAL_Delay()呢&#xff1f;两者有什么区别&#xff1f; 本节就来探讨一下这个问题的答案&#xff1a; 延时函数分类 相对延时&#xff1a;…

linux查看日志指令

今天导师要求&#xff0c;使用linux查看日志&#xff0c;这里呢&#xff0c;先是学习了一下ubuntu内核的linux&#xff0c;现在回顾一下查看日志的语句 linux查看日志指令 一、tail二、head三、cat四、more五、view5.1 从上往下找5.2 从下往上找5.3退出 六、搜索6.1模糊搜索6.2…

【新版系统架构补充】-嵌入式技术

嵌入式微处理体系结构 冯诺依曼结构 传统计算机采用冯诺依曼结构&#xff0c;也称普林斯顿结构&#xff0c;是一种将程序指令存储器和数据存储器合并在一起的存储器结构 冯诺依曼的计算机程序和数据共用一个存储空间&#xff0c;程序指令存储地址和数据存储地址指向同一个存…

中国最赚钱公司出炉

7月25日&#xff0c;2023年《财富》中国500强排行榜正式发布。国家电网以5300亿美元的营收位居榜首&#xff0c;中国石油和中国石化分列第二和第三。工商银行则成为最赚钱的公司。 图片来源&#xff1a;财富FORTUNE 1中国500强TOP10 数据显示&#xff0c;今年500家上榜的中国…

华为交换机配置SSH远程登录

连接console线直接配置 1、在服务器端生成本地密钥对 <HUAWEI>system-view [HUAWEI] dsa local-key-pair create Info: The key name will be: HUAWEI_Host_DSA. Info: The key modulus can be any one of the following : 1024, 2048. Info: If the key modulus i…

Qt应用开发(基础篇)——滑块类 QSlider、QScrollBar、QDial

目录 一、前言 二、QAbstractSlider类 1、invertedAppearance 2、invertedControls 3、maximum 4、minimum 5、orientation 6、pageStep 7、singleStep 8、sliderDown 9、tracking 10、sliderPosition 11、value 12、信号 三、QDial类 1、notchSize 2、notchTa…

BES 平台 SDK之代码架构讲解一

本文章是基于BES2700 芯片&#xff0c;其他BESxxx 芯片可做参考&#xff0c;如有不当之处&#xff0c;欢迎评论区留言指出。 1. SDK 目录下包含的文件 1.1 Apps 文件 主要包含了上层应用逻辑代码&#xff0c;比如电池电量管理、按键、main目录下的app_init.c &#xff08;应用…

IBM Spectrum LSF (“LSF“ ,简称为负载共享设施) 用户案例

IBM Spectrum LSF (“LSF” &#xff0c;简称为负载共享设施) 用户案例 IBM Spectrum LSF (“LSF” &#xff0c;简称为负载共享设施) 软件是业界领先的企业级软件。 LSF 在现有异构 IT 资源之间分配工作&#xff0c;以创建共享&#xff0c;可扩展且容错的基础架构&#xff0c…

Linux进程(万字解析)

进程 一.冯诺依曼体系结构二.操作系统1.管理的概念2.系统调用和库函数概念 三.进程1.先描述2.再组织 四.Linux里的PCB1.概念2.理解当前路径3.PID1.kill指令2.获取自己的PID 4.初识fork函数 五.进程状态1.一般意义上的1.运行2.阻塞3.挂起 2.Linux内核里的状态1.运行态2.阻塞态3.…

2023软考下半年考试和报名时间汇总(附详细报名流程)

2023年上半年软考结束了&#xff0c;相信有不少准备报考下半年软考的考生正摩拳擦掌&#xff0c;期待在11月的考试中大显身手。2023下半年软考什么时候报名呢&#xff1f;一起来看看吧~ 根据中国计算机技术职业资格网发布的关于《2023年度计算机技术与软件专业技术资格&#x…

ERROR: transport error 202: gethostbyname: unknown host报错解决方案

Java 9 syntax for remote debugger: -agentlib:jdwptransportdt_socket,servery,suspendn,address*:5005Java 8 不适用 *:port&#xff0c;应该使用: -agentlib:jdwptransportdt_socket,servery,suspendn,address5005参考 https://stackoverflow.com/questions/50344957/ja…

预测性维护:融合新兴技术6大发展趋势

随着技术的不断进步&#xff0c;预测性维护在工业领域呈现出新的发展趋势。这些趋势旨在通过更有效地分析数据和利用先进的技术手段来提高设备的维护效率和性能。以下是笔者认为可能的预测性维护的六大新兴趋势&#xff0c;抛砖引玉&#xff0c;供交流探讨&#xff1a; 一、数据…

清风数学建模——层次分析法

层次分析法 文章目录 层次分析法评价类问题可以用打分来解决1.通过查阅资料选定指标2.画出权重表格并填写2.1.判断矩阵一致矩阵2.3一致性检验的步骤先算一致性指标CI根据表格查找n对应的RI&#xff08;平均随机一致性指标&#xff09;&#xff0c;表格一般会在题目中给出计算一…

现场服务管理系统有哪些?5个现场服务管理软件对比

现场售后服务管理软件的使用者通常是机械设备、家电、仪表仪器、医疗器械等厂商的工程师和客服调度人员。现场售后服务管理软件可将服务过程标准化&#xff0c;包括工单派发、服务过程步骤、配件订购出货和付款、客户评价都有系统支持&#xff0c;有的现场售后服务软件还支持数…

有理逼近 C++详解

有理逼近 C详解 有理逼近问题描述输入输出格式输入格式输出格式 输入输出样例输入样例输出样例&#xff1a; 解法代码代码解法变量解析算法 注&#xff1a;本文支持互3~ 有理逼近 问题描述 输入输出格式 输入格式 输入文件的第一行为 P 、 N P、N P、N&#xff0c;其中 P …

MongoDB文档--架构体系

阿丹&#xff1a; 在开始学习先了解以及目标知识的架构体系。就能事半功倍。 架构体系 MongoDB的架构体系由以下几部分组成&#xff1a; 存储结构&#xff1a;MongoDB采用文档型存储结构&#xff0c;一个数据库包含多个集合&#xff0c;一个集合包含多个文档。存储形式&#…