键树(Keyword Tree)操作(插入删除查询)-双链树C语言实现_20230508

news2024/9/29 3:30:20

键树(Keyword Tree)操作(插入/删除/查询)-双链树C语言实现_20230508

  1. 前言

键树称为数字查找树或者搜索提示树,树的度数d≥2,树中每个结点储存的不是完整的关键字,而是只含有组成关键字的符号,常见情况为字符或数字。

双链树和Trie树是键树的两种不同的表示方法,它们有各自的特点。从其不同的储存特性来看,若键树中的结点的度较大,则采用Trie树结构较双链树更为合适,如若键树中的结点度较小,则采用双链树(Dual Linked Tree)实现则比较合理。

  1. 键树表示

假定需要对中文中的形式进行储存,那么键树就是其中较方便的储存形式之一。给定16个不同的姓氏,然后对此集合按照首字母、第二字母做分割,直至集合中只剩下唯一字母为止。为了方便,我们约定键树是有序树,即同一层次中兄弟结点依照所含符号自左向右有序,并约定结束符为$,它小于任何字母。

给定姓氏集合为,{CAI,CAO,LI,LAN,CHA,CHANG,WEN,CHAO,YUN,YANG,LONG,WANG,ZHAO,LIU,CHEN},通过逐个字符分割后,形成的键树。
在这里插入图片描述

  1. 双链树表示键树

以树的孩子-兄弟节点表示链树,孩子-兄弟节点表示法的好处为,它把节点关联的字符用孩子-兄弟链表串联起来,可以进行灵活搜索、删除与插入相关的操作。它的域至少包含三部分,当前的字符symbol, 如果为非叶子节点,需要定义first指针,指向根节点的第一个孩子;还需定义next指针,指向前序节点的兄弟节点,为了用单一结构体实现程序定义,在结构体中需要定义字段,标识此节点是第一个孩子还是兄弟节点,此处采用枚举数据Node Kind来实现此功能。

同时,叶子节点的infoptr指向存储该关键字的记录的指针,此时的键树称为双链树。

在这里插入图片描述

  1. 键树操作(双链树表示)

和其它的树类似,键树的常规操作分为插入操作、查找操作和删除操作,通常情况下通过插入操作可以完成整个键树的创建任务;查找操作可以通过不断搜索孩子结点,然后再兄弟链表中进行比较操作;删除操作实质上是找到一颗与其它树不相交的子树,然后删除这可子树,由于删除过程中需要考虑其它子树共享的字符,所以不能直接按照每个字符的顺序删除关键字,这样就破坏其它关键字树,使键树失去其基本结构和价值。

4.1 双链树数据表示

双链树的数据包含要插入的关键字,这里定义关键字为字符数组,同时定义其长度,然后用结构体来表达这个关键字。ch表示关键字内容,num表示数组中有效的关键字字符数量。

typedef struct KeysType
{
    char ch[MAXKEYLEN];
    int num;
}KeysType;

对于每个结点,要么其属于叶子结点,要么其属于分支结点;叶子结点和分支结点包含的指针类型不同,叶子结点需要最终指向关键字代表的实际记录。我们定义结点类型为枚举。

typedef enum NodeKind
{
    LEAF,
    BRANCH
} NodeKind;

最终我们定义双链数据的基本数据结构,在数据结构中,用共用体定义结点类型,用kind来区分结点的实际类型。

typedef struct DLTNode
{
    char symbol;
    NodeKind kind;
    struct DLTNode *next;
    union 
    {
        Record infoptr;
        struct DLTNode *first;
    };
    
}DLTNode, *DLTree;

4.2 插入操作

在双链表中插入一个关键字,相当于在树中某个结点上插入一颗子树。具体操作需要不断对键树进行搜索,直至到某个位置,键树中无法找到合适的关键字符,则此时就代表子树插入的起点,建立子树过程中需要区分两类结点,中间结点为分支结点,最末端结点为叶子结点,需要对其infoptr指针进行赋值操作。

穿件新的结点面临两种情形,如果为头结点,那么就需要把新建立的结点插入在头结点的位置,这时候需要调用first指针;如果为非头结点,仅需要调用next指针即可。

基于上述分析,查找过程中,可以用flag对其结点类型进行标记,约定flag==0代表在孩子结点上进行插入,flag==1代表在兄弟结点之间进行相关的插入操作。

程序分为两部分,第一步为插入的位置查找以及对结点类型进行标记,第二步为实际的插入操作,通过不断建立和插入新的结点,实现关键字最终的插入操作。

在第一键树中插入关键字{CAI$ },其过程可以描述为,从根节点出发,查找’C’,由于现有键树存在’C’,继续往下查找字符‘A’,键树中字符’A’也匹配,继续往下查找,键树中不存在’I’,此时返回待待插入位置,并标记flag为0,表示插入的结点位于孩子结点(头结点)上,橙色线条表示插入需要新建立的链接之间的具体关系。

这个插入关系体现新节点和前置结点的first指针关系。

在这里插入图片描述

接下来我们再看一个前置结点和新节点之间为next关系的插入,在键树中插入{CHANG$ }关键字,则此条件下需要一直查找到CHA $ 的叶子结点 $ ,整个子树则需要插入在$结点之后(next关系),‘O’关键字之前,插入关键字的连接关系用橙色链条表示。

在这里插入图片描述

接下来我们观察其代码实现的过程,如上所述,代码实现过程分为两部分,位置查找和子树插入的过程,整体过程用flag表示待插入与前序结点为first关系还是next关系。

void dltree_insert(DLTree T, KeysType keys)
{
    int flag; //flag==0, insert first; otherwise, insert next
    int i;
    char *str;

    DLTree p;
    DLTree pre_p;
    DLTNode *new_node;

    i=0;
    flag=0;
    p=T->first;
    pre_p=T;
    
    //look for the proper p and location i;
    while(p && i<keys.num)
    {
        
        //插入待插入位置
        while (p && keys.ch[i] > p->symbol) //默认孩子-兄弟结点为升序排列
        {
            flag = 1;
            pre_p=p;
            p = p->next;
        }

      	//如果结点为空(兄弟结点的尾部结点)或者未查找到相关的关键字,
        //循环结束,继续后续的子树插入操作
        if(p==NULL || keys.ch[i] < p->symbol)
        {
            break;
        }
        else if (keys.ch[i] == p->symbol) //查找到相应关键字
        {
            //如果为非叶子结点,那么接下来继续通过孩子树寻找
            //此时flag标记为0,
            if(i<keys.num-1) 
            {
                pre_p=p;
                p=p->first;
                flag=0;
            }
        }

        i++;
    }


    //如果键树中不存在相同的关键字,则进行子树插入操作
    //插入的循环截止条件为关键字当中的字符个数,通过字符自加,判断循环是否结束
    while(i<keys.num)
    {
        //前面4行语句建立新节点,并且对字符赋值为keys.ch[i]
        //对其next进行NULL赋值
        new_node = (DLTNode *)malloc(sizeof(DLTNode));
        new_node->symbol = keys.ch[i];
        new_node->next=NULL;
		
        //对孩子结点赋值新的结点,同时新节点的next链接到p指针
        if (flag == 0)
        {

            pre_p->first = new_node;
            new_node->next = p;
            
            pre_p = new_node;
            p=NULL;
        }
        else  //对兄弟结点赋值新的结点,同时新节点的next链接到p指针
        {
            pre_p->next = new_node;
            new_node->next = p;
            
            pre_p = new_node;
            p = NULL;
            flag=0; //切换到孩子结点模式
        }

        if (i < keys.num - 1) //按照关键字数量分类,如果小于keys.num-1,赋值为分支结点类型
        {
            new_node->kind = BRANCH;
        }
        else //否则赋值为叶子类型
        {
            new_node->kind = LEAF;

            str=(char *)malloc(sizeof(char)*(keys.num+1));
            memset(str, 0, sizeof(char) * (keys.num + 1));
            memcpy(str,keys.ch,sizeof(char)*keys.num);

            new_node->infoptr=str;
        }
        i++;
    }
}

4.3 删除操作

键树的删除操作过程也分为两步,第一步找到需要删除的位置,第二部执行相关的链接删除操作。其中难点在于找到相应的删除位置。 删除操作之前可以调用查找操作,确保待删除的关键字位于键树当中,否则如果只有部分字符相等,而且先期执行了删除操作,那么就破坏了键树的完整性。

删除操作同插入操作类似,需要记录前置关键字与待删除字符的关系,如果关系为first关系,则规定flag==0;否则为next关系,则定义flag==1。

同时我们判定某个字符是否子树删除结点的前提条件为p->first->next是否为空,如果p->first->next为空,那么就表明p所代表的字符结点为待删除关键字独享,从它开始删除子树即可完成删除操作。

假定需要删除关键字{CHANG$ },不断搜索直至关键字符’N’->first->next为NULL,这时候直接对兄弟链表进行操作,删除N结点即可,为了放置内存泄漏和野指针,如果能对N,G, $ 以及 $ 指向的记录删除操作,那么程序会更为完善。

在这里插入图片描述

删除操作程序

void dltree_delete(DLTree T, KeysType keys)
{
    int flag; // flag==0, delete first node; otherwise, delete next node
    int i;

    DLTree p;
    DLTree pre_p;

    i=0;
    flag=0;
    p=T->first;
    pre_p=T; 
    
    while(p && i< keys.num)
    {
        while(p && keys.ch[i]!= p->symbol)
        {
            flag=1;
            pre_p = p;
            p=p->next;
        }

        if(p && i<keys.num-1)
        {
            if(p->first->next==NULL)//deletion location
            {
                break;
            }
            flag = 0;
            pre_p = p;
            p=p->first;
        }

        i++;
    }

    if(flag==0)
    {
        pre_p->first=p->next;
    }
    else
    {
        pre_p->next=p->next;
    }
}

4.4 查找操作

双链树的查找可如下操作,假定给定值keys.ch[0…num-1],其中keys.ch[0]值keys.ch[num-2]表示待查关键字中的num-1个字符,keys.ch[num-1]代表结束符’$'。从双链树根节点出发,顺first指针找到第一棵树的的根节点,以keys.ch[0]和此节点的symbol域进行比较,若相等,则顺first比较下一个字符,否则沿next域顺序查找。若直至空仍比较不等,则查询失败。

Record dltree_search(DLTree T, KeysType keys)
{
   DLTree p;
   int i;

   p=T->first;
   i=0;

   while(p && i<keys.num)
   {
        while(p && keys.ch[i]!=p->symbol)
        {
            p=p->next;
        }

        if(p && i<keys.num-1)
        {
            p=p->first;
        }

        i++;
   }

   if(p==NULL)
   {
        return NULL;
   }
   else
   {
        return p->infoptr;
   }
}

4.5 根节点创建函数

void dltree_root_creation(DLTree *T)
{
    *T=(DLTree)malloc(sizeof(DLTNode));
    (*T)->first=NULL;
    (*T)->kind=BRANCH;
    return;
}
  1. 小结

本文通过键树的介绍,并通过双链树储存结构对键树实现插入、删除和查找操作,并识别出程序的关键为查找位置以及表示first还是next为前驱,从而实现程序代码。

参考资料

  • 《数据结构》严蔚敏,清华大学

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/503486.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

wsl2 ubuntu ip 自动同步到windows端的vscode remote ssh(wsl2 ubuntu 静态ip 固定ip)

环境信息 ​ wsl2 中linux版本&#xff1a;ubuntu ​ windows版本&#xff1a; win10/win11 问题描述 最近装了wsl2&#xff0c;使用vscode远程连接wsl2时遇到了如下问题&#xff1a; 1、wsl2的ip无法固定 2、wsl2的ssh服务不能自动开启。 尝试了网上许多方法&#xff0c;…

Vue核心 Vue生命周期

1.18. Vue生命周期 1.18.1. 引出生命周期 生命周期 又名生命周期回调函数、生命周期函数、生命周期钩子是什么: Vue在关键时刻帮我们调用的一些特殊名称的函数。生命周期函数的名字不可更改&#xff0c;但函数的具体内容是程序员根据需求编写的。生命周期函数中的this指向是…

JUC并发编程与源码分析笔记13-AbstractQueuedSynchronizer之AQS

前置知识 公平锁和非公平锁可重入锁自旋思想LockSupport数据结构之双向链表设计模式之模板设计模式 AQS入门级别理论知识 是什么 AbstractQueuedSynchronizer&#xff1a;抽象的队列同步器。 用来实现锁或其他同步器组件的公共基础部分的抽象实现&#xff0c;是重量级基础框…

Hive知识回顾2

一、分桶表 1.1分桶表的概念 分桶表也叫做桶表&#xff0c;源自建表语法中bucket单词。是一种用于优化查询而设计的表类型。该功能可以让数据分解为若干个部分易于管理。 在分桶时&#xff0c;我们要指定根据哪个字段将数据分为几桶&#xff08;几个部分&#xff09;。默认规则…

人脸识别中的深度学习

深度学习在人脸识别中的应用 人脸识别的过程包括&#xff1a; 人脸检测人脸对齐特征提取&#xff08;在数学上&#xff0c;实质上是&#xff1a;空间变换&#xff09;特征度量 其中&#xff0c;特征提取与度量&#xff0c;是人脸识别问题中的关键问题&#xff0c;也是相关研究…

使用 ChatGPT 辅助学习——为自己找一个老师

我们每个人都有许多标签&#xff0c;例如高中生、成绩中等、文科&#xff0c;根据这些标签我和其他拥有相同标签的人分配了相同的教程、班级和老师&#xff0c;这可以带来效率上的提升&#xff0c;因为同一份教程、老师就可以服务几十上百人&#xff0c;而无须为每个人定制&…

软件测试工程师的核心竞争力究竟是什么?

对于测试员而言&#xff0c;了解自己岗位的核心竞争力是非常重要的。在职业初期&#xff0c;许多人认为掌握代码才是软件测试的核心竞争力&#xff0c;但是随着经验的增加&#xff0c;我们会发现真正的核心竞争力是由多个方面组成的。 首先&#xff0c;测试人员需要具备良好的测…

BERT 的面试题

BERT 的简介 1、BERT 是什么&#xff1f;它是用来做什么的&#xff1f; BERT&#xff08;Bidirectional Encoder Representations from Transformers&#xff09;是由Google开发的自然语言处理模型&#xff0c;是一种预训练模型&#xff0c;可以用于多种自然语言处理任务&…

【python自动化脚本—实现excel参数化循环调用判定结果】

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、需求背景二、我要做什么三、已有接口四、脚本实现五、实现效果图 前言 为提升自己的python能力&#xff0c;记录在工作中实现的自动化脚本&#xff0c;温故…

51单片机(七)定时器

❤️ 专栏简介&#xff1a;本专栏记录了从零学习单片机的过程&#xff0c;其中包括51单片机和STM32单片机两部分&#xff1b;建议先学习51单片机&#xff0c;其是STM32等高级单片机的基础&#xff1b;这样再学习STM32时才能融会贯通。 ☀️ 专栏适用人群 &#xff1a;适用于想要…

写文章的软件-一款写作文章的软件

写文章的软件 写文章的软件是一种工具&#xff0c;可以帮助用户轻松快速地创作高质量的文章。该软件一般包括以下几个主要功能&#xff1a; 写作界面&#xff1a;提供简洁、美观的写作界面&#xff0c;让用户专注于文章创作&#xff0c;同时可以进行排版、字体、颜色等调整。 …

力扣707. 设计链表

707. 设计链表 - 力扣&#xff08;Leetcode&#xff09; class MyLinkedList { public:// 定义链表节点结构体struct LinkedNode {int val;LinkedNode* next;LinkedNode(int val):val(val), next(nullptr){}};// 初始化链表MyLinkedList() {_dummyHead new LinkedNode(0); // …

BasicVSR++代码解读(分模块介绍-前向传播函数)

一、前向传播函数def forward(self, lqs): 输入&#xff1a;低质量序列L,shape为**(n, t, c, h, w)。 输出&#xff1a;HR序列,shape为(n, t, c, 4h, 4w)**。 &#xff08;1&#xff09;读取输入数据的维度大小     这里的n,t,c,h,w分别表示&#xff1a;一个bitch的图片数…

数据结构之双向链表,实现双向链表的增删改查

目录 一、双向链表的定义 1.双向链表节点的定义 2.双向链表的初始化 二、双向链表的函数接口实现 1.双链表的尾插 2.双向链表的尾删 3.双向链表的头插 4.双向链表的头删 6.双向链表在pos前面插入 7.双向链表删除pos位置的节点 8.双向链表的销毁 总结 一、双向链表的定义 双向链…

PyQt5桌面应用开发(11):摸鱼也要讲基本法,两个字,16

本文目录 PyQt5桌面应用系列鼠标不要钱&#xff0c;手腕还不要钱吗&#xff1f;PyQt5源程序python文件资源定义界面定义文件 技术要素资源文件StyleSheetsQMainWindow设置窗体几何 结论 PyQt5桌面应用系列 PyQt5桌面应用开发&#xff08;1&#xff09;&#xff1a;需求分析 PyQ…

EC6110-Hi3798MV310-当贝纯净桌面-卡刷强刷固件包

EC6110-Hi3798MV310-当贝纯净桌面-卡刷强刷固件包-内有教程及短接点 特点&#xff1a; 1、适用于对应型号的电视盒子刷机&#xff1b; 2、开放原厂固件屏蔽的市场安装和u盘安装apk&#xff1b; 3、修改dns&#xff0c;三网通用&#xff1b; 4、大量精简内置的没用的软件&a…

【信息安全案例】——网络攻击分析(学习笔记)

&#x1f4d6; 前言&#xff1a;随着信息技术的发展&#xff0c;网络空间的斗争可谓是兵家必争之地&#xff0c;网络攻击的事件层出不穷。道高一尺魔高一丈&#xff0c;了解常见的网络攻击类型有利于我们日后工作生活的安全稳定。 目录 &#x1f552; 1. 网络攻击威胁&#x1f…

CM211-2-YS-Hi3798MV300/MV310-当贝纯净桌面线刷固件包(可救砖)

CM211-2-YS-Hi3798MV300&#xff0f;MV310-当贝纯净桌面线刷固件包&#xff08;可救砖&#xff09;-内有教程 特点&#xff1a; 1、适用于对应型号的电视盒子刷机&#xff1b; 2、开放原厂固件屏蔽的市场安装和u盘安装apk&#xff1b; 3、修改dns&#xff0c;三网通用&…

05- 算法解读 R-CNN (目标检测)

要点&#xff1a; R-CNN可以说是利用深度学习进行目标检测的开山之作。 一 R-CNN算法 R-CNN可以说是利用深度学习进行目标检测的开山之作。作者Ross Girshick多次 在PASCAL VOC的目标检测竞赛中折桂&#xff0c;曾在2010年带领团队获得终身成就奖。 RCNN算法流程可分为4个步…