第四部分、字符串,数据结构中的串存储结构
串存储结构,也就是存储字符串的数据结构。
很明显,字符串之间的逻辑关系也是“一对一”,用线性表的思维不难想出,串存储结构也有顺序存储和链式存储。
提到字符串,常做的操作就是串之间的匹配,因为,本章给初学者介绍 2 种串的模式匹配算法,BF 算法和 KMP 算法。
一、串是什么,串存储结构的3种实现方法
数据结构中,字符串要单独用一种存储结构来存储,称为串存储结构。这里的串指的就是字符串。
严格意义上讲,串存储结构也是一种线性存储结构,因为字符串中的字符之间也具有"一对一"的逻辑关系。只不过,与之前所学的线性存储结构不同,串结构只用于存储字符类型的数据。
无论学习哪种编程语言,操作最多的总是字符串。数据结构中,根据串中存储字符的数量及特点,对一些特殊的串进行了命名,比如说:
- 空串:存储 0 个字符的串,例如 S = ""(双引号紧挨着);
- 空格串:只包含空格字符的串,例如 S = " "(双引号包含 5 个空格);
- 子串和主串:假设有两个串 a 和 b,如果 a 中可以找到几个连续字符组成的串与 b 完全相同,则称 a 是 b 的主串,b 是 a 的子串。例如,若 a = "shujujiegou",b = "shuju",由于 a 中也包含 "shuju",因此串 a 和串 b 是主串和子串的关系;
需要注意的是,空格串和空串不同,空格串中含有字符,只是都是空格而已。另外,只有串 b 整体出现在串 a 中,才能说 b 是 a 的子串,比如 "shujiejugou" 和 "shuju" 就不是主串和子串的关系。
另外,对于具有主串和子串关系的两个串,通常会让你用算法找到子串在主串的位置。子串在主串中的位置,指的是子串首个字符在主串中的位置。
例如,串 a = "shujujiegou",串 b = "jiegou",通过观察,可以判断 a 和 b 是主串和子串的关系,同时子串 b 位于主串 a 中第 6 的位置,因为在串 a 中,串 b 首字符 'j' 的位置是 6。
本章,我们会学习两种模式匹配算法专门解决此类问题。
1、串存储结构的具体实现
存储一个字符串,数据结构包含以下 3 种具体存储结构:
- 定长顺序存储:实际上就是用普通数组(又称静态数组)存储。例如 C 语言使用普通数据存储字符串的代码为 char a[20] = "data.biancheng.net";
- 堆分配存储:用动态数组存储字符串;
- 块链存储:用链表存储字符串;
以上 3 种存储结构会在后续文章中作详细介绍。
二、串的定长顺序存储结构
我们知道,顺序存储结构(顺序表)的底层实现用的是数组,根据创建方式的不同,数组又可分为静态数组和动态数组,因此顺序存储结构的具体实现其实有两种方式。
通常所说的数组都指的是静态数组,如 str[10],静态数组的长度是固定的。与静态数组相对应的,还有动态数组,它使用 malloc 和 free 函数动态申请和释放空间,因此动态数组的长度是可变的。
串的定长顺序存储结构,可以简单地理解为采用 "固定长度的顺序存储结构" 来存储字符串,因此限定了其底层实现只能使用静态数组。
使用定长顺序存储结构存储字符串时,需结合目标字符串的长度,预先申请足够大的内存空间。
例如,采用定长顺序存储结构存储 "data.biancheng.net",通过目测得知此字符串长度为 18,因此我们申请的数组空间长度至少为 19(最后一位存储字符串的结束标志 '\0'),用 C 语言表示为:
char str[19] = "data.biancheng.net";
下面这段 C 语言代码给大家完美地展示了使用定长顺序存储结构存储字符串:
#include<stdio.h>
int main()
{
char str[19]="data.biancheng.net";
printf("%s\n",str);
return 0;
}
根据实际情况,实现代码可包含一些函数,用于实现某些具体功能,如求字符串的长度等,由于这些知识都是学习编程语言的基础内容,因此不再过多赘述。