串是什么,串存储结构的3种实现方法

news2025/1/18 9:02:44

目录

串是什么,串存储结构的3种实现方法

串存储结构的具体实现

串的堆分配存储结构

串的块链存储结构


串是什么,串存储结构的3种实现方法

数据结构中,字符串要单独用一种存储结构来存储,称为串存储结构。这里的串指的就是字符串。

严格意义上讲,串存储结构也是一种线性存储结构,因为字符串中的字符之间也具有"一对一"的逻辑关系。只不过,与之前所学的线性存储结构不同,串结构只用于存储字符类型的数据。

无论学习哪种编程语言,操作最多的总是字符串。数据结构中,根据串中存储字符的数量及特点,对一些特殊的串进行了命名,比如说:

  • 空串:存储 0 个字符的串,例如 S = ""(双引号紧挨着);
  • 空格串:只包含空格字符的串,例如 S = "     "(双引号包含 5 个空格);
  • 子串和主串:假设有两个串 a 和 b,如果 a 中可以找到几个连续字符组成的串与 b 完全相同,则称 a 是 b 的主串,b 是 a 的子串。例如,若 a = "shujujiegou",b = "shuju",由于 a  中也包含 "shuju",因此串 a 和串 b 是主串和子串的关系;


需要注意的是,空格串和空串不同,空格串中含有字符,只是都是空格而已。另外,只有串 b 整体出现在串 a 中,才能说 b 是 a 的子串,比如 "shujiejugou" 和 "shuju" 就不是主串和子串的关系。

另外,对于具有主串和子串关系的两个串,通常会让你用算法找到子串在主串的位置。子串在主串中的位置,指的是子串首个字符在主串中的位置。

例如,串 a = "shujujiegou",串 b = "jiegou",通过观察,可以判断 a 和 b 是主串和子串的关系,同时子串 b 位于主串 a 中第 6 的位置,因为在串 a 中,串 b 首字符 'j' 的位置是 6。

本章,我们会学习两种模式匹配算法专门解决此类问题。

串存储结构的具体实现

存储一个字符串,数据结构包含以下 3 种具体存储结构:

  1. 定长顺序存储:实际上就是用普通数组(又称静态数组)存储。例如 C 语言使用普通数据存储字符串的代码为 char a[20] = "data.biancheng.net";
  2. 堆分配存储:用动态数组存储字符串;
  3. 块链存储:用链表存储字符串;

我们知道,顺序存储结构(顺序表)的底层实现用的是数组,根据创建方式的不同,数组又可分为静态数组和动态数组,因此顺序存储结构的具体实现其实有两种方式。

通常所说的数组都指的是静态数组,如 str[10],静态数组的长度是固定的。与静态数组相对应的,还有动态数组,它使用 malloc 和 free 函数动态申请和释放空间,因此动态数组的长度是可变的。

串的定长顺序存储结构,可以简单地理解为采用 "固定长度的顺序存储结构" 来存储字符串,因此限定了其底层实现只能使用静态数组。

使用定长顺序存储结构存储字符串时,需结合目标字符串的长度,预先申请足够大的内存空间。

例如,采用定长顺序存储结构存储 "data.biancheng.net",通过目测得知此字符串长度为 18,因此我们申请的数组空间长度至少为 19(最后一位存储字符串的结束标志 '\0'),用 C 语言表示为:

char str[19] = "data.biancheng.net";

下面这段 C 语言代码给大家完美地展示了使用定长顺序存储结构存储字符串:

  1. #include<stdio.h>
  2. int main()
  3. {
  4. char str[19]="data.biancheng.net";
  5. printf("%s\n",str);
  6. return 0;
  7. }

根据实际情况,实现代码可包含一些函数,用于实现某些具体功能,如求字符串的长度等,由于这些知识都是学习编程语言的基础内容,因此不再过多赘述。

串的堆分配存储结构

串的堆分配存储,其具体实现方式是采用动态数组存储字符串。

通常,编程语言会将程序占有的内存空间分成多个不同的区域,程序包含的数据会被分门别类并存储到对应的区域。拿 C 语言来说,程序会将内存分为 4 个区域,分别为堆区、栈区、数据区和代码区,其中的堆区是本节所关注的。

与其他区域不同,堆区的内存空间需要程序员手动使用 malloc 函数申请,并且在不用后要手动通过 free 函数将其释放。

C 语言中使用 malloc 函数最多的场景是给数组分配空间,这类数组称为动态数组。例如:

char * a = (char*)malloc(5*sizeof(char));

此行代码创建了一个动态数组 a,通过使用 malloc 申请了 5 个 char 类型大小的堆存储空间。

动态数组相比普通数组(静态数组)的优势是长度可变,换句话说,根据需要动态数组可额外申请更多的堆空间(使用 relloc 函数):

a = (char*)realloc(a, 10*sizeof(char));

通过使用这行代码,之前具有 5 个 char 型存储空间的动态数组,其容量扩大为可存储 10 个 char 型数据。

下面给大家举一个完整的示例,以便对串的堆分配存储有更清楚地认识。该程序可实现将两个串("data.bian" 和 "cheng.net")合并为一个串:

 
  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. int main()
  5. {
  6. char * a1 = NULL;
  7. char * a2 = NULL;
  8. a1 = (char*)malloc(10 * sizeof(char));
  9. strcpy(a1, "data.bian");//将字符串"data.bian"复制给a1
  10. a2 = (char*)malloc(10 * sizeof(char));
  11. strcpy(a2, "cheng.net");
  12. int lengthA1 = strlen(a1);//a1串的长度
  13. int lengthA2 = strlen(a2);//a2串的长度
  14. //尝试将合并的串存储在 a1 中,如果 a1 空间不够,则用realloc动态申请
  15. if (lengthA1 < lengthA1 + lengthA2) {
  16. a1 = (char*)realloc(a1, (lengthA1 + lengthA2+1) * sizeof(char));
  17. }
  18. //合并两个串到 a1 中
  19. for (int i = lengthA1; i < lengthA1 + lengthA2; i++) {
  20. a1[i] = a2[i - lengthA1];
  21. }
  22. //串的末尾要添加 \0,避免出错
  23. a1[lengthA1 + lengthA2] = '\0';
  24. printf("%s", a1);
  25. //用完动态数组要立即释放
  26. free(a1);
  27. free(a2);
  28. return 0;
  29. }

程序运行结果:

data.biancheng.net

注意,程序中给 a1 和 a2 赋值时,使用了 strcpy 复制函数。这里不能直接用 a1 ="data.biancheng",程序编译会出错,报错信息为 "没有 malloc 的空间不能 free"。因为 strcpy 函数是将字符串复制到申请的存储空间中,而直接赋值是字符串存储在别的内存空间(本身是一个常量,放在数据区)中,更改了指针 a1 和 a2 的指向,也就是说,之前动态申请的存储空间虽然申请了,结果还没用呢就丢了。

串的块链存储结构

串的块链存储,指的是使用链表结构存储字符串。

本节实现串的块链存储使用的是无头节点的单链表。当然根据实际需要,你也可以自行决定所用链表的结构(双向链表还是单链表,有无头节点)。

我们知道,单链表中的 "单" 强调的仅仅是链表各个节点只能有一个指针,并没有限制数据域中存储数据的具体个数。因此在设计链表节点的结构时,可以令各节点存储多个数据。

例如,图 1 所示是用链表存储字符串 shujujiegou,该链表各个节点中可存储 1 个字符:


 

各节点仅存储 1 个数据元素的链表


图 1 各节点仅存储 1 个数据元素的链表


同样,图 2 设置的链表各节点可存储 4 个字符:


 

各节点可存储 4 个数据元素的链表


图 2 各节点可存储 4 个数据元素的链表


从图 2 可以看到,使用链表存储字符串,其最后一个节点的数据域不一定会被字符串全部占满,对于这种情况,通常会用 '#' 或其他特殊字符(能与字符串区分开就行)将最后一个节点填满。

初学者可能会问,使用块链结构存储字符串时,怎样确定链表中节点存储数据的个数呢?

链表各节点存储数据个数的多少可参考以下几个因素:

  1. 串的长度和存储空间的大小:若串包含数据量很大,且链表申请的存储空间有限,此时应尽可能的让各节点存储更多的数据,提高空间的利用率(每多一个节点,就要多申请一个指针域的空间);反之,如果串不是特别长,或者存储空间足够,就需要再结合其他因素综合考虑;
  2. 程序实现的功能:如果实际场景中需要对存储的串做大量的插入或删除操作,则应尽可能减少各节点存储数据的数量;反之,就需要再结合其他因素。


以上两点仅是目前想到影响节点存储数据个数的因素,在实际场景中,还需结合实现环境综合分析。

这里给出一个实现串的块链存储的 C 语言程序,以加深初学者对此字符串存储方式的认识:

 
  1. #include<stdio.h>
  2. #include<stdlib.h>
  3. #include<string.h>
  4. #define linkNum 3//全局设置链表中节点存储数据的个数
  5. typedef struct Link {
  6. char a[linkNum]; //数据域可存放 linkNum 个数据
  7. struct Link * next; //代表指针域,指向直接后继元素
  8. }link; // nk为节点名,每个节点都是一个 link 结构体
  9. link * initLink(link * head, char * str);
  10. void displayLink(link * head);
  11. int main()
  12. {
  13. link * head = NULL;
  14. head = initLink(head, "data.biancheng.net");
  15. displayLink(head);
  16. return 0;
  17. }
  18. //初始化链表,其中head为头指针,str为存储的字符串
  19. link * initLink(link * head, char * str) {
  20. int length = strlen(str);
  21. //根据字符串的长度,计算出链表中使用节点的个数
  22. int num = length/linkNum;
  23. if (length%linkNum) {
  24. num++;
  25. }
  26. //创建并初始化首元节点
  27. head = (link*)malloc(sizeof(link));
  28. head->next = NULL;
  29. link *temp = head;
  30. //初始化链表
  31. for (int i = 0; i<num; i++)
  32. {
  33. int j = 0;
  34. for (; j<linkNum; j++)
  35. {
  36. if (i*linkNum + j < length) {
  37. temp->a[j] = str[i*linkNum + j];
  38. }
  39. else
  40. temp->a[j] = '#';
  41. }
  42. if (i*linkNum + j < length)
  43. {
  44. link * newlink = (link*)malloc(sizeof(link));
  45. newlink->next = NULL;
  46. temp->next = newlink;
  47. temp = newlink;
  48. }
  49. }
  50. return head;
  51. }
  52. //输出链表
  53. void displayLink(link * head) {
  54. link * temp = head;
  55. while (temp) {
  56. for (int i = 0; i < linkNum; i++) {
  57. printf("%c", temp->a[i]);
  58. }
  59. temp = temp->next;
  60. }
  61. }

程序输出结果为:

data.biancheng.net

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/884806.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

判断Series序列是否含有空值NaN的Series.hasnans方法

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 判断Series序列是否含有空值NaN Series.hasnans [太阳]选择题 关于以下代码的说法中正确的是? import pandas as pd import numpy as np a pd.Series([1,np.nan],index["a","…

“想都是问题,干才是答案”是错误的,雷军说也不行

前几天&#xff0c;在为什么过去十年AI创业失败了一文中提了一个观点&#xff1a; “干就完了”式思维&#xff0c;是新式的刻舟求剑&#xff0c;剧毒&#xff0c;谁吃谁死。 没想到没过几天雷老板一个演讲又把这点炒到各个媒体的头条上&#xff0c;比如&#xff1a;“雷军20…

关于月球深层内部的谜团依然存在

地球物理数据表明&#xff0c;月球地幔的底部部分熔融或含有钛铁矿&#xff0c;但改进的流变学模型使这一层的存在受到质疑。 月球的内部结构只能使用远程地球物理数据来约束。一项新的分析表明&#xff0c;月球地幔深处的一个独特层&#xff0c;靠近深层月震发生的地方&#x…

大数据:Numpy基础应用详解

Numpy基础应用 Numpy 是一个开源的 Python 科学计算库&#xff0c;用于快速处理任意维度的数组。Numpy 支持常见的数组和矩阵操作&#xff0c;对于同样的数值计算任务&#xff0c;使用 NumPy 不仅代码要简洁的多&#xff0c;而且 NumPy 的性能远远优于原生 Python&#xff0c;…

小米平板6 Max 14评测:4窗口显示就是爽 多任务体验可媲美PC

一、前言&#xff1a;小米发布新款14英寸超大屏平板 专注生产力体验 加上网课、居家办公的普及&#xff0c;再加上各大手机厂商都开始搭建起自家的生态&#xff0c;尤其平板这个以往不被重视的品类&#xff0c;也开始找到了它自身的定位。 尤其在2023年上半年发布的小米平板6 P…

深入理解Vue 3.0x中的Suspense和异步组件

深入理解Vue 3.0x中的Suspense和异步组件 Vue 3.0x作为Vue.js框架的最新版本&#xff0c;引入了许多创新特性&#xff0c;其中Suspense和异步组件是重要的改进之一。在本文中&#xff0c;我们将深入探讨这两个特性&#xff0c;了解它们如何为现代Web应用带来更好的性能和用户体…

【C++11保姆级教程】final和override

文章目录 前言一、final关键字的使用1.1final关键字修饰类1.2final关键字修饰成员函数 1.3final的优势1.4final的劣势二、override关键字的使用2.1使用override关键字重写虚函数2.3override的优势 总结 前言 在C编程中&#xff0c;我们常常需要使用继承和多态来构建复杂的程序…

TTS | VocGAN声码器训练自己的数据集

哈喽&#xff0c;今天给大家介绍的是如何使用VocGAN声码器训练自己的数据集。 原文 VocGAN: A High-Fidelity Real-time Vocoder with a Hierarchically-nested Adversarial Network 想要论文解读&#xff0c;请参考我的这篇文章~ 本博客主要包括以下内容&#xff1a; 目录…

如何将短视频做成动态图?教你快速gif制作的方法

将产品或服务的短视频转换为gif图像后&#xff0c;可以在网站、电子邮件或社交媒体广告中使用&#xff0c;以吸引潜在客户的兴趣&#xff0c;那么怎么才能把短视频转gif图片呢&#xff1f;当然是使用专业的短视频转gif工具&#xff08;在线视频转换gif-视频转gif转换器-gif.cn_…

C语言,结构体,结构体大小,

1、结构体&#xff1a; 用于存储不同数据类型的多个相关变量&#xff0c;从而形成一个具有独立性的组合数据类型。 结构体的声明&#xff1a; struct 结构体类型名{ 数据类型 成员1&#xff1b; 数据类型 成员2&#xff1b; 数据类型 成员3&#xff1b; ……… }&#xff1…

观察级水下机器人使用系列之六超短基线(上)

观察级水下机器人使用的超短基线型号是Micro-Ranger2&#xff0c;由换能器MRT、甲板单元&#xff08;ESH&#xff09;、信标&#xff08;Nano)和计算机组成。超短基线主要用于深水&#xff08;大于100m&#xff09;&#xff0c;在浅水环境下&#xff0c;会有多径时延扩展&#…

FreeRTOS qemu mps2-an385 bsp 移植制作 :系统启动篇

相关文章 FreeRTOS qemu mps2-an385 bsp 移植制作 &#xff1a;环境搭建篇 开发环境 Win10 64位 VS Code&#xff0c;ssh 远程连接 ubuntu VMware Workstation Pro 16 Ubuntu 20.04 FreeRTOSv202212.01&#xff08;备注&#xff1a;可以在 github 获取最新版本&#xff0…

亿赛通电子文档安全管理系统任意文件上传漏洞复现

0x01 产品简介 亿赛通电子文档安全管理系统&#xff08;简称&#xff1a;CDG&#xff09;是一款电子文档安全加密软件&#xff0c;该系统利用驱动层透明加密技术&#xff0c;通过对电子文档的加密保护&#xff0c;防止内部员工泄密和外部人员非法窃取企业核心重要数据资产&…

openGauss学习笔记-41 openGauss 高级数据管理-匿名块

文章目录 openGauss学习笔记-41 openGauss 高级数据管理-匿名块41.1 语法41.2 参数说明41.3 示例 openGauss学习笔记-41 openGauss 高级数据管理-匿名块 匿名块&#xff08;Anonymous Block&#xff09;是存储过程的字块之一&#xff0c;没有名称。一般用于不频繁执行的脚本或…

【Unity每日一记】方位辨别—向量的叉乘点乘结合

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;元宇宙-秩沅 &#x1f468;‍&#x1f4bb; hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍&#x1f4bb; 本文由 秩沅 原创 &#x1f468;‍&#x1f4bb; 收录于专栏&#xff1a;uni…

优化 Linux 系统性能:探索 tuned 守护进程的调优配置文件

tuned守护进程调优系统调优配置文件从命令行配置系统调优安装、启用和启动tuned软件包tuned-adm 感谢 &#x1f496; hello大家好&#x1f60a; tuned守护进程调优系统 系统管理员可以基于多种用例工作负载来调整各种设备设置&#xff0c;以此优化系统性能。tuned 守护进程会利…

Python学习笔记_基础篇(七)_常用模块

模块&#xff0c;用一砣代码实现了某个功能的代码集合。 类似于函数式编程和面向过程编程&#xff0c;函数式编程则完成一个功能&#xff0c;其他代码用来调用即可&#xff0c;提供了代码的重用性和代码间的耦合。而对于一个复杂的功能来&#xff0c;可能需要多个函数才能完成…

什么是LAXCUS分布式操作系统?

相较Linux、Windows&#xff0c;Laxcus是同时在多台计算机上运行的操作系统&#xff0c;处理大规模、高并发、高性能业务&#xff0c;其特点是资源共享和任务并行&#xff0c;并实现【数存算管】超融合一体化。环境中的资源&#xff1a;CPU、GPU、内存、硬盘、网络&#xff0c;…

Python学习笔记_基础篇(八)_正则表达式

1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具&#xff0c;拥有自己独特的语法以及一个独立的处理引擎&#xff0c;效率上可能不如str自带的方法&#xff0c;但功能十分强大。得益于这一点&#xff0c;在提供了正则…