【手写数据库内核组件】01 解析树的结构，不同类型的数据结构组多层的链表树，抽象类型统一引用格式

news2026/4/6 18:54:31

不同类型的链表

专栏内容：

postgresql使用入门基础
手写数据库toadb
并发编程

个人主页：我的主页
管理社区：开源数据库
座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物.

文章目录

不同类型的链表
概述
1. 数据类型识别
- 1.1 TLV格式介绍
- 1.2 结构体分层定义
- 1.3 定义抽象数据类型
2. 链表定义
- 2.1 数据节点定义
- 2.2 链表类型定义
节点解析
链表遍历
多级树链表
总结
结尾

概述

在实际使用中，会存在不同的数据类型，有基本类型，有自定义的结构体的复杂类型。

当这么丰富的数据出现时，只能记录到动态扩展的链表中，同时还能够查找，并按正确的类型取出。

本节就来介绍，在同一个链表中如何记录如此丰富的数据资源，分别从

数据类型识别;
链表的定义;
节点解析;
链表遍历
四个方面来展开介绍。

1. 数据类型识别

要识别出不同的数据类型，这里介绍一种数据结构的定义格式TLV。

1.1 TLV格式介绍

TLV（tag-length-value）是一种用于以结构化方式表示数据的二进制格式。TLV在计算机网络协议、智能卡应用以及其他数据交换场景中经常被使用。TLV由以下三部分组成：

标签（Tag）：唯一标识数据的类型。它通常是一个单字节或一小段字节序列, 可以是不同bit代表不同含义，也可以是整体表示序列。
长度（Length）：数据字段的字节长度。在某些协议中，标签和长度字段的长度也会被包含在内。
值（Value）：实际传输的数据，可以是任何类型或格式。

在这里插入图片描述

这种格式通过明确区分数据的类型、长度和具体内容，使得数据的解析和处理变得更加清晰和高效。

1.2 结构体分层定义

首先定义复合类型，一般使用枚举类型进行定义。

在手写数据库toadb的src/sqlcore/node/nodeType.h文件中就有用到这种定义。

这里举例定义如下：

typedef enum NodeType
{
	T_START,

	/* parser nodes */
	T_List,
	T_MANAGER,
    T_HR,
    T_EMPLOYEE
}NodeType;

然后在各复合类型的结构定中，前两个字段采用公共字段。

这里定义经理，HR，员工三个结构体类型，每个人都有一个sno员工号的数据，他们的个性化数据有：

经理，有管理多少个员工；
HR，新入职了多少新员工；
员工，对应的部门经理的工号；

typedef struct stManager
{
    NodeType type;
    int size;
    int sno;
    int employeeNum;
}stManager;

typedef struct stHr
{
    NodeType type;
    int size;
    int sno;
    int newEmployeesNum;
}stHr;

typedef struct stEmployee
{
    NodeType type;
    int size;
    int sno;
    int partMgr;
}stEmployee;

1.3 定义抽象数据类型

自定义的数据结构太多了，为了在使用中统一和简化，这里定义Node数据类型，是对上述数据类型的统称。

/* common type, real size is just by type. */
typedef struct Node
{
    NodeType type;
    int size;
}Node;

Node数据结构中包含两个公共的字段，类型和大小。

这样在参数引用，链表节点引用时，都可以用这个抽象的类型来代表以上众多的数据类型。

当然，有这个抽象结构定义之后，ListCell中的数据指针类型可以用Node类型代替，而不是之前定义的void。

2. 链表定义

既然是链表，肯定采用指针的方式串连起来，以往都是定义一种明确的数据类型作为链表的节点。

而面对如此多的数据类型，链表节点的结构如何定义呢？

2.1 数据节点定义

数据节点中存储真实的数据，由链表指针将数据节点串连起来。

它的定义如下：

/* tree list cell */
typedef struct ListCell
{
    void* pValue;
    struct ListCell *next;
}ListCell;

数据类型不确定，所以定义为void *;
单链表的形式，next指向下一个节点；

2.2 链表类型定义

部门的结构是一个多层级形式，每个层级又是多个员工，也是一个链表。

因此，数据类型中，除了实际意义的数据类型，如上面定义的经理，HR，员工外，还需要增加链表的数据类型。

/* tree list node */
typedef struct List
{
	NodeType type;
    int size;
	int length;         /* number of ListCell struct */
	ListCell *head;
}List;

链表的数据类型中，数据有两个：

length，链表中的节点个数；
head，链表头；

节点解析

数据的多样性，增加了链表节点类型解析工作，因为之前采用了统一类型定义，所以类型的解析变得简单。

采用统一的接口对类型进行解析, 分发到对应的类型进行处理。

static void ShowNode(Node *n)
{
    if(NULL == n)
    {
        return;
    }

    switch(n->type)
    {
        case T_List:
            ShowNodList(n);
        break;
        
        case T_MANAGER:
            ShowNodManager(n);
        break;
        
        case T_HR:
            ShowNodHR(n);
        break;
        
        case T_EMPLOYEE:
            ShowNodEmployee(n);
        break;
        
        default:
        break;
    }
}

这里定义了一个展示各节点信息的接口，根据节点类型再调用各自的接口进行展示。

链表遍历

经过上面的抽象类型之后，链表的遍历就非常简单，这里以链表的节点的显示为例。

void TravelListCell(List *list)
{
    ListCell *tmpCell = NULL;
    List *l = list;
    
    if(NULL == l)
    {
        return;
    }

    /* list cell node show */
    for(tmpCell = l->head; tmpCell != NULL; tmpCell = tmpCell->next)
    {
        Node *node = (Node *)(tmpCell->pValue);

        ShowNode(node);
    }

    return;
}

说明：

传入的是一个List的指针，这里会包含一个链表；
从成员head开始遍历，直到链表节点的next为空，也就是链尾；
将链表节点的数据成员转为抽象类型Node *, 传入统一的处理接口；

多级树链表

将经理的数据成员增加一项，除了下属成员数量外，还列出下属的员工信息；

typedef struct stManager
{
    NodeType type;
    int size;
    int sno;
    int employeeNum;
    Node *employeeList;
}stManager;

这里有个特别的地方，对于T_List类型的数据，内部会递归调用TravelListCell，这样就是一个多级链表树。

在这里插入图片描述

如同一个公司的组织架构一样，顶层由HR，高级经理列表组成，每个高级经理下属由员工，中级经理组成；

而中级经理下属由多名员工组成，整体组成一个公司的树形组织架构图。

对于T_LIst类型的节点，它的显示处理函数如下：

void ShowNodList(Node *n)
{
    if(NULL == n)
        return ;

    TravelListCell((List *) n);
}

其实是深度优先的图递归遍历，其它数据节点的显示就相对简单，打印成员信息即可，这里不再列举。

总结

本文介绍了链表节点为不同数据类型时的处理方法，定义了抽象类型后使引用的类型统一，同时在遍历树形链表时，对于成员仍为链表时，采用深度优先的递归遍历。

这种链表在数据库内核中应用比较广泛，比如在SQL语法解析时，将语法的各子句解析成不同的数据类型，而像select子句，可以写多个列名，该子句内部又以链表形成存储列信息。

结尾

非常感谢大家的支持，在浏览的同时别忘了留下您宝贵的评论，如果觉得值得鼓励，请点赞，收藏，我会更加努力！

作者邮箱：study@senllang.onaliyun.com
如有错误或者疏漏欢迎指出，互相学习。

注：未经同意，不得转载！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1903218.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！