【数据结构】串的定义;存储结构;基本操作的实现

news2024/11/20 0:46:49

 欢迎光~临~^_^

目录

知识树 

1、串的定义

2、串的存储结构

2.1顺序存储

静态存储

动态存储

2.2链式存储 

2.3串的堆分配存储表示

3、串的基本操作

3.1求子串

3.2比较操作

3.3定位操作 

4、C语言实现串的基本操作 


知识树 

 

 

1、串的定义

        串是由零个或多个字符组成的有限序列。在计算机科学中,常用串来表示文本、代码或数据。串是程序设计中重要的基本数据类型之一,常用于字符串匹配、文本处理和密码学等领域。

        子串是指在一个字符串中取出一段连续的字符所得到的字符串。例如,在字符串 "hello world" 中,"hello"、"world"、"lo"、"l"、"rld" 都是它的子串。

        空串指的是没有任何字符的字符串,表示为 ""(两个引号之间没有任何字符)。而空格串指的是只包含空格字符的字符串,例如 " "。虽然两者在形式上都是字符串,但含义不同。

2、串的存储结构

2.1顺序存储

静态存储

        串的静态存储指的是在程序运行时在固定的内存地址上分配空间来存储串。在静态存储中,串的长度是固定的,不能动态地改变。通常,在编写程序时,我们可以使用字符数组来存储字符串,这样可以方便地对字符串进行操作和访问。

例如,在C语言中,可以通过以下方式来定义一个静态的字符串:

char str[] = "hello world";
 

        这里,str是一个字符数组,被初始化为字符串"hello world"。在编译时,系统会为str分配一个固定的内存空间,用来存储这个字符串。在程序运行时,我们可以通过str来访问和修改这个字符串。需要注意的是,这个字符串的长度是固定的,即为11(包括字符串末尾的'\0'字符)。如果我们需要动态地改变字符串的长度,就需要使用动态存储方式,如堆内存或栈内存。

动态存储

        串的动态存储一般采用字符数组或链表进行实现。

1.字符数组

字符数组是串的静态存储方式,但可以通过动态分配内存来实现动态存储。具体实现方法为:

(1)定义一个字符指针变量,用于指向动态分配的字符数组。

(2)根据实际需要确定串的最大长度,调用C语言中的动态内存分配函数malloc()申请空间。

(3)将申请到的空间赋值给字符指针变量。

(4)通过scanf()gets()等函数向分配的空间中读入字符。

(5)使用完后,需要释放已分配的内存空间,以便于其他程序使用。

示例代码:

#include <stdio.h>
#include <stdlib.h>

int main()
{
    char* str;
    int len;
    printf("Input the length of the string:");
    scanf("%d", &len);
    str = (char*)malloc(len * sizeof(char));
    if (!str)
    {
        printf("Memory allocation failed!\n");
        return 0;
    }
    printf("Input the string:");
    scanf("%s", str);
    printf("The string you input is:%s\n", str);
    free(str);
    return 0;
}
 

2.链表 

链表是动态存储的一种常见方式,可以在运行时动态增加或删除节点。对于串的存储,链表的每个节点都可以存储一个字符。链表的实现方法如下:

(1)定义一个节点结构体,包含一个字符变量和一个指向下一个节点的指针变量。

(2)定义一个头指针变量,用于指向链表的第一个节点。

(3)通过调用C语言的动态内存分配函数malloc()申请一个节点,并将节点的指针挂在链表的末尾。

(4)向新申请的节点中存入要存储的字符。

(5)通过指针操作,可以在链表中进行插入、删除、修改等操作。

(6)使用完链表后,需要释放每个节点占用的内存空间。

示例代码:

#include <stdio.h>
#include <stdlib.h>

typedef struct node {
    char data;
    struct node* next;
}Node;

int main()
{
    Node* head = NULL;
    Node* tail = NULL;
    char c;
    printf("Input the string:");
    while ((c = getchar()) != '\n')
    {
        Node* p = (Node*)malloc(sizeof(Node));
        p->data = c;
        p->next = NULL;
        if (head == NULL)
        {
            head = p;
            tail = p;
        }
        else
        {
            tail->next = p;
            tail = tail->next;
        }
    }
    printf("The string you input is:");
    Node* p = head;
    while (p)
    {
        printf("%c", p->data);
        p = p->next;
    }
    p = head;
    while (p)
    {
        Node* t = p;
        p = p->next;
        free(t);
    }
    return 0;
}
 

2.2链式存储 

        链式存储方式是通过链表来存储串的每个字符。每个结点存储一个或多个字符,同时包括一个指向下一个结点的指针。链式存储的结构体如下所示:

typedef struct StringNode {
    char data[MAXSIZE]; // 存储字符数组
    int length; // 存储当前结点存储的字符个数
    struct StringNode *next; // 指向下一个结点的指针
} StringNode, *String;
 

        其中 MAXSIZE 是存储字符数组的最大长度,length 表示当前结点存储的字符个数。一个完整的链表存储了整个串,其中头结点不存储数据,只作为链表的链头,串的实际数据从第二个结点开始存储。

        需要注意的是,链式存储的串的空间是动态分配的,因此可以根据具体的需求动态调整存储空间。但是,链式存储的串在访问任意一个字符时需要遍历整个链表,因此在时间复杂度上可能会存在一定的问题。

2.3串的堆分配存储表示

可以使用动态内存分配来实现堆分配存储表示。具体实现方法如下:

  1. 使用malloc函数分配一块连续的内存空间,该空间位于堆区;
  2. 将需要存储的串拷贝到该内存空间中;
  3. 返回指向该内存空间的指针,作为串的堆分配存储表示。

例如,以下代码演示了如何使用动态内存分配来实现堆分配存储表示的字符串拷贝操作:

#include <stdio.h>  
#include <stdlib.h>  
#include <string.h> 

char* copy_string(char* str) {  
    int len = strlen(str);  
    char* new_str = (char*)malloc(len + 1); // 分配内存空间  
    strcpy(new_str, str); // 拷贝字符串到新的内存空间中  
    return new_str; // 返回指针  
}  

int main() {  
    char* str = "Hello, world!";  
    char* new_str = copy_string(str); // 使用动态内存分配实现堆分配存储表示  
    printf("%s\n", new_str);  
    free(new_str); // 释放内存空间  
    return 0;  
}  
 

        在该代码中,copy_string函数使用malloc函数分配了一块内存空间,将传入的字符串拷贝到该空间中,并返回指向该空间的指针。在main函数中,调用copy_string函数将字符串"Hello, world!"拷贝到堆中,并输出该字符串。最后,使用free函数释放动态分配的内存空间,避免内存泄漏。

 

3、串的基本操作

3.1求子串

下面是C语言实现求串的子串的代码,其中包括了两种常见的方法:

方法一:暴力枚举

#include <stdio.h>
#include <string.h>

int substr(char* str, char* sub) {
    int i, j, k;
    int len1 = strlen(str);
    int len2 = strlen(sub);
    for (i = 0; i <= len1 - len2; i++) {
        k = i;
        for (j = 0; j < len2; j++) {
            if (str[k] == sub[j]) {
                k++;
            } else {
                break;
            }
        }
        if (j == len2) {
            return i;
        }
    }
    return -1;
}

int main() {
    char str[] = "hello world";
    char sub[] = "world";
    int index = substr(str, sub);
    if (index < 0) {
        printf("不存在子串");
    } else {
        printf("子串在主串中的位置是:%d", index);
    }
    return 0;
}
 

方法二:KMP算法(重重重难难难点)

#include <stdio.h>
#include <string.h>

void getNext(char* t, int* next) {
    int i = 0, j = -1;
    int len = strlen(t);
    next[0] = -1;
    while (i < len - 1) {
        if (j == -1 || t[i] == t[j]) {
            i++;
            j++;
            next[i] = j;
        } else {
            j = next[j];
        }
    }
}

int kmp(char* s, char* t, int* next) {
    int i = 0, j = 0;
    int len1 = strlen(s);
    int len2 = strlen(t);
    while (i < len1 && j < len2) {
        if (j == -1 || s[i] == t[j]) {
            i++;
            j++;
        } else {
            j = next[j];
        }
    }
    if (j == len2) {
        return i - j;
    } else {
        return -1;
    }
}

int main() {
    char str[] = "hello world";
    char sub[] = "world";
    int next[strlen(sub)];
    getNext(sub, next);
    int index = kmp(str, sub, next);
    if (index < 0) {
        printf("不存在子串");
    } else {
        printf("子串在主串中的位置是:%d", index);
    }
    return 0;
}
 

        两种方法的时间复杂度都是O(nm),其中n为主串的长度,m为子串的长度。但是在不同的情况下,它们的效率会有所不同,暴力枚举适用于简单的匹配问题,而KMP算法适用于较复杂的匹配问题。

3.2比较操作

#include <stdio.h>
#include <string.h>

int main()
{
    char str1[50], str2[50];
    int result;

    printf("Enter string 1: ");
    scanf("%s", str1);

    printf("Enter string 2: ");
    scanf("%s", str2);

    result = strcmp(str1, str2);

    if(result < 0)
    {
        printf("String 1 is less than string 2\n");
    }
    else if(result > 0)
    {
        printf("String 1 is greater than string 2\n");
    }
    else
    {
        printf("Both strings are equal\n");
    }

    return 0;
}
 

        在上面的程序中,我们首先定义了两个字符串变量 str1 和 str2,然后使用 scanf 函数分别从用户输入中读取这两个字符串。接下来,我们使用 strcmp 函数对两个字符串进行比较,并将比较结果赋值给 result 变量。最后,我们使用 if-else 语句来判断 result 的值,根据比较结果输出相应的信息。

  strcmp 函数用于比较两个字符串的大小,当第一个字符串小于第二个字符串时返回一个负值,当第一个字符串大于第二个字符串时返回一个正值,当两个字符串相等时返回 0。因此,在上面的程序中,我们使用 if-else 语句对三种情况进行了判断。

3.3定位操作 

在字符串操作中,最基本的操作是定位一个子串,即在一个给定的串中找到一个子串的位置。

常见的定位子串的操作包括:

  1. 暴力匹配算法:从主串的第一个字符开始与子串逐个字符比较。如果出现不匹配的字符,则从下一个字符开始重新比较。时间复杂度为$O(mn)$,其中m是子串的长度,n是主串的长度。

  2. KMP算法:KMP算法是一种改进的暴力匹配算法,在匹配过程中根据已匹配的字符数目和子串本身的结构,跳过一些无需匹配的字符,从而提高匹配效率。时间复杂度为$O(m+n)$,其中m是子串的长度,n是主串的长度。

  3. Boyer-Moore算法:BM算法是一种基于字符比较跳跃的算法,可以在最坏情况下只需要比较n/m次,从而提高匹配效率。时间复杂度为$O(m+n)$,其中m是子串的长度,n是主串的长度。

  4. Rabin-Karp算法:RK算法利用哈希值来比较子串和主串,从而提高匹配效率。时间复杂度为$O(mn)$,但在实际应用中,通常能够达到较高的效率。

以上算法中,KMP算法和Boyer-Moore算法是比较常用的定位子串的算法。

4、C语言实现串的基本操作 

        在下面的程序中,我们用 get_length 函数求字符串长度,用 assign_string 函数进行字符串赋值,用 compare_string 函数比较两个字符串大小,用 concat_string 函数进行串连接,用 sub_string 函数求子串,用 replace_string 函数替换字符串中的某一部分,以及用 find_string 函数进行定位操作。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define MAX_LEN 100

// 求字符串长度
int get_length(char* str){
    int count = 0;
    while(str[count] != '\0'){
        count++;
    }
    return count;
}

// 字符串赋值
void assign_string(char* str1, char* str2){
    int len = get_length(str2);
    for(int i = 0; i < len; i++){
        str1[i] = str2[i];
    }
    str1[len] = '\0';
}

// 比较两个字符串大小
int compare_string(char* str1, char* str2){
    int len1 = get_length(str1);
    int len2 = get_length(str2);
    int len = len1 < len2 ? len1 : len2;
    for(int i = 0; i < len; i++){
        if(str1[i] != str2[i]){
            return str1[i] - str2[i];
        }
    }
    return len1 - len2;
}

// 串连接
void concat_string(char* str1, char* str2){
    int len1 = get_length(str1);
    int len2 = get_length(str2);
    for(int i = 0; i < len2; i++){
        str1[len1+i] = str2[i];
    }
    str1[len1+len2] = '\0';
}

// 求子串
void sub_string(char* str1, char* substr, int start, int len){
    int len1 = get_length(str1);
    if(start < 0 || start > len1 || len <= 0){
        substr[0] = '\0'; // 空串
        return;
    }
    if(start + len > len1){
        len = len1 - start;
    }
    for(int i = 0; i < len; i++){
        substr[i] = str1[start+i];
    }
    substr[len] = '\0';
}

// 替换
void replace_string(char* str1, char* old_str, char* new_str){
    int len1 = get_length(str1);
    int len_old = get_length(old_str);
    int len_new = get_length(new_str);
    int i, j, k;
    for(i = 0; i < len1; i++){
        if(str1[i] == old_str[0]){
            for(j = 1; j < len_old; j++){
                if(str1[i+j] != old_str[j]){
                    break;
                }
            }
            if(j == len_old){
                break;
            }
        }
    }
    if(i < len1){
        if(len_old == len_new){
            for(k = 0; k < len_new; k++){
                str1[i+k] = new_str[k];
            }
        }
        else if(len_old < len_new){
            int delta = len_new - len_old;
            for(k = len1-1; k >= i+len_old; k--){
                str1[k+delta] = str1[k];
            }
            for(k = 0; k < len_new; k++){
                str1[i+k] = new_str[k];
            }
            str1[len1+delta] = '\0';
        }
        else{
            int delta = len_old - len_new;
            for(k = i+len_old; k <= len1; k++){
                str1[k-delta] = str1[k];
            }
            for(k = 0; k < len_new; k++){
                str1[i+k] = new_str[k];
            }
        }
    }
}

// 定位算法
int find_string(char* str1, char* str2){
    int len1 = get_length(str1);
    int len2 = get_length(str2);
    int i, j;
    for(i = 0; i <= len1-len2; i++){
        for(j = 0; j < len2; j++){
            if(str1[i+j] != str2[j]){
                break;
            }
        }
        if(j == len2){
            return i; // 返回第一次出现的位置
        }
    }
    return -1; // 没有找到
}

int main(){
    char str1[MAX_LEN], str2[MAX_LEN], substr[MAX_LEN], old_str[MAX_LEN], new_str[MAX_LEN];
    int start, len, pos;
    printf("Enter string 1: ");
    scanf("%s", str1);
    printf("Enter string 2: ");
    scanf("%s", str2);
    printf("String 1 length is %d\n", get_length(str1));
    assign_string(str1, str2);
    printf("String 1 after assign string 2: %s\n", str1);
    printf("Compare string 1 and string 2: %d\n", compare_string(str1, str2));
    concat_string(str1, str2);
    printf("String 1 after concat string 2: %s\n", str1);
    printf("Enter start index and length for substring: ");
    scanf("%d%d", &start, &len);
    sub_string(str1, substr, start, len);
    printf("Substring: %s\n", substr);
    printf("Enter string to be replaced: ");
    scanf("%s", old_str);
    printf("Enter replacement string: ");
    scanf("%s", new_str);
    replace_string(str1, old_str, new_str);
    printf("String 1 after replace operation: %s\n", str1);
    printf("Enter string to be searched: ");
    scanf("%s", str2);
    pos = find_string(str1, str2);
    if(pos == -1){
        printf("Entered string not found in string 1.\n");
    }
    else{
        printf("Entered string found at position %d in string 1.\n", pos);
    }
    return 0;
}
 

 🤞❤️🤞❤️🤞❤️串基本的知识点总结就到这里啦,如果对博文还满意的话,劳烦各位看官动动“发财的小手”留下您对博文的赞和对博主的关注吧🤞❤️🤞❤️🤞❤️

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1011177.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Oracle,高斯创建自增序列

某些时候,需要获取到一个自增值 然后点击左下 Apply 也可以通过SQL语句执行 dual在Oracle中是张虚拟表&#xff0c;通常用于执行这样的查询 Oracle中查询语句: select 序列名.nextval from dual 在高斯数据库中:查询是 select my_sequence.nextval 不需要加form xxx 也…

微信小程序项目开发Day1

没接触过&#xff0c;直接看视频学习&#xff1a; 千锋教育微信小程序开发制作前端教程&#xff0c;零基础轻松入门玩转微信小程序_哔哩哔哩_bilibili千锋教育微信小程序开发制作前端教程&#xff0c;零基础轻松入门玩转微信小程序共计56条视频&#xff0c;包括&#xff1a;学…

20230914java面经记录

1.mq消息重复消费 2.mq消息堆积 3.如何实现消费的幂等性&#xff08;网站付款成功发货&#xff0c;使用mq做异步通知发货&#xff09; 4.log&#xff0c;debug&#xff0c;warn&#xff0c;error怎么用 5.java基础 6.效率问题 ArrayList a,b;HashSet c,d ;a,b,c,d各自有10…

GDB之修改字符串的值(十)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 人生格言&#xff1a; 人生…

ESP32主板-MoonESP32

产品简介 Moon-ESP32主板&#xff0c;一款以双核芯片ESP32-E为主芯片的主控板&#xff0c;支持WiFi和蓝牙双模通信&#xff0c;低功耗&#xff0c;板载LED指示灯&#xff0c;引出所有IO端口&#xff0c;并提供多个I2C端口、SPI端口、串行端口&#xff0c;方便连接&#xff0c;…

Claude 使用指南 | 可与GPT-4媲美的语言模型

本文全程干货&#xff0c;让你轻松使用上claude&#xff0c;这也是目前体验cluade的唯一途径&#xff01;废话不多说&#xff0c;直接上教程&#xff0c;cluade的能力不逊于GPT4&#xff0c;号称是ChatGPT4.0最强竞品。相对Chatgpt来说&#xff0c;Claude不仅是完全免费的&…

Prometheus存储容量估算和Prometheus联邦机制

Prometheus最受诟病的一点就是单机存储不好扩展。 Prometheus存储容量估算 根据老师的经验&#xff0c;每秒接收 80 万个数据点&#xff0c;算是一个比较健康的上限&#xff0c;因而一开始也无需用一台配置特别高的机器&#xff0c;随着数据量的增长&#xff0c;以后再升级硬…

图扑可视化图表组件之股票数据分析应用

股市是市场经济的必然产物&#xff0c;在一个国家的金融领域之中有着举足轻重的地位。在过去&#xff0c;人们对于市场走势的把握主要依赖于经验和直觉&#xff0c;往往容易受到主观因素的影响&#xff0c;导致决策上出现偏差。如今&#xff0c;通过数据可视化呈现&#xff0c;…

java 单元测试Junit

所谓单元测试&#xff0c;就是针对最小的功能单元&#xff0c;编写测试代码对其进行正确性测试。为了测试更加方便&#xff0c;有一些第三方的公司或者组织提供了很好用的测试框架&#xff0c;给开发者使用。这里介绍一种Junit测试框架。Junit是第三方公司开源出来的&#xff0…

JavaSE、JavaEE与Spring的概念和异同点剖析以及规范13 个分析

JavaSE、JavaEE与Spring的概念和异同点剖析以及规范13 个分析 目录概述需求&#xff1a; 设计思路实现思路分析1.什么是JavaSE2.是JavaEE3.什么是Spring 参考资料和推荐阅读 Survive by day and develop by night. talk for import biz , show your perfect code,full busy&…

奇怪的3389端口~腾讯/百度云服务器镜像有问题?

新安装的腾讯云服务器&#xff0c;系统win2019&#xff0c;打开微软官方的TCPVIEW软件&#xff0c;只要稍等一会儿&#xff0c;就能看到来自国外的3389连接&#xff0c;处于established状态。 系统是新安装的&#xff0c;密码也是刚刚重置的复杂密码&#xff0c; 除了TCPVIEW没…

【CVPR2021】MVDNet论文阅读分析与总结

Challenge&#xff1a; 现有的目标检测器主要融合激光雷达和相机&#xff0c;通常提供丰富和冗余的视觉信息 利用最先进的成像雷达&#xff0c;其分辨率比RadarNet和LiRaNet中使用的分辨率要细得多&#xff0c;提出了一种有效的深度后期融合方法来结合雷达和激光雷达信号。 MV…

记录一个iOS使用陀螺仪3d效果的抖动问题

使用陀螺仪的时候&#xff0c;遇到一个问题&#xff0c;就是在拖动scrollView滚动的时候&#xff0c;3d效果的图片会抖动 实现3d效果的代码 - (void)updateWithGravityX:(double)gravityXgravityY:(double)gravityYgravityZ:(double)gravityZ {//因为在斜向上45度角的时候&am…

x86架构基础汇编知识

​ 通用寄存器 EAX 32位 函数返回值 AX 低16位 AH 高八位 AL 低八位 EBX 32位 ECX 32位 循环次数&#xff0c;this指针 EDX 32位 EBP 32位 栈底寄存器 ESP 32位 栈顶寄存器 ESI 源索引寄存器 EDI 目标索引寄存器 EIP 无法直接通过汇编操作 例子 mov al&#xff0c;0xff …

SQL SERVER 中无法删除table ‘biao’,因为它不存在或者您不具备相应的权限

删除table表 1.删除表示提示&#xff1a;SQL SERVER 中无法删除table ‘biao’&#xff0c;因为它不存在或者您不具备相应的权限。2.原因3.解决方法3.1 图3.2 图3.3 图3.4 图 1.删除表示提示&#xff1a;SQL SERVER 中无法删除table ‘biao’&#xff0c;因为它不存在或者您不具…

CRM软件系统如何实现客户的精细化管理

客户是企业的生命线&#xff0c;对客户进行精细化管理&#xff0c;是提高企业收益的关键。那么&#xff0c;如何进行客户管理&#xff1f;CRM系统可以实现精细化管理客户&#xff0c;提升客户的价值。下面我们就来详细说一说。 1、获取客户信息 CRM系统可以通过web表单、在线聊…

【Java 基础篇】深入了解Java中的键值对集合:Map集合详解

Map是Java中常用的数据结构之一&#xff0c;用于存储键值对&#xff08;Key-Value&#xff09;映射。它提供了快速的查找和访问能力&#xff0c;是编程中常用的工具之一。本文将深入介绍Java中的Map集合&#xff0c;包括常见的Map实现类、基本操作、使用示例以及一些重要的注意…

C++基础:字符串

字符串 字符串是一种非常常见的数据类型&#xff0c;用于存储和操作文本数据。C提供了多种方式来表示字符串&#xff0c;其中最常用的是使用std::string类。以下是关于C字符串的一些基本信息和操作示例&#xff1a; 字符 : ’ (单引号是一个字符&#xff0c;如果要赋值成数组…

【服务器】带外管理口 iDRAC接口

服务器带外管理口 也就是标识为iDRAC的接口 使用时&#xff0c;将笔记本直接通过网线连接到这个接口 笔记本上设置以太网连接的属性为手动IP&#xff0c;例如192.168.0.100 然后ping 192.168.0.120&#xff08;服务器的默认的带外IP&#xff09; 理论上应该是好使的

FastJSON将对象转JSON字符串引发的血案

问题&#xff1a;最近工作中需要将一个将近两百页的pdf的base64作为value转成JSON字符串&#xff0c;而代码中使用的方案就是JSONObject.toJSONString(obj); 而结果就是引发了OOM内存溢出。 翻阅源码找到一段关键点&#xff1a; 也就是说FastJSON内部设置了一个阈值&#xff…