前言
之前我们已经学习过了各种线性的数据结构,顺序表、链表、栈、队列,现在我们一起来了解一下一种非线性的结构----树
1.树的结构和概念
1.1树的概念
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
树是没有回路的。树这种数据结构与我们现实中的树有相似之处,在逻辑结构上是树,而在物理结构上他可能是数组,是链表
1.2树的相关概念
树中有几个概念是我们必须要清楚的
- 节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A的为6
- 叶节点或终端节点:度为0的节点称为叶节点; 如上图:B、C、H、I...等节点为叶节点
- 非终端节点或分支节点:度不为0的节点; 如上图:D、E、F、G...等节点为分支节点
- 双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点
- 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点
- 兄弟节点:具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点
- 树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6
- 树的高度或深度:树中节点的最大层次; 如上图:树的高度为4
- 节点的祖先:从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
- 子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
- 森林:由m(m>1)棵互不相交的树的集合称为森林
1.3树的表示
树最常用的是孩子兄弟表示法(左孩子右兄弟)
typedef int DataType;
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; // 指向其下一个兄弟结点
DataType _data; // 结点中的数据域
};
1.4树在实际中的运用
树结构在计算机科学中的应用非常广泛,涉及数据存储与检索、排序算法、压缩算法、搜索算法、决策树、路径规划以及表达式求值等多个领域。
- 数据存储与检索
文件系统:在操作系统中,文件目录通常使用树形结构来组织,其中每个目录都可以包含文件和子目录。这种结构使得文件访问变得高效且有序。
数据库索引:许多数据库系统使用树形结构(如B+树)来存储索引,以提高数据的检索速度。例如,MySQL数据库中的索引就是基于B+树实现的。
- 排序算法
堆排序:堆是一种特殊的完全二叉树,其中每个父节点的值都大于或等于其子节点的值(大顶堆),或小于或等于其子节点的值(小顶堆)。堆排序算法利用堆的性质,通过构建初始堆,然后不断将堆顶元素(最大或最小值)与堆的末尾元素交换,并重新调整堆,从而实现对数组的排序。堆排序的时间复杂度为O(nlogn),是一种高效的排序算法。
- 压缩算法
哈夫曼编码:哈夫曼树(也称为最优二叉树)是一种用于数据压缩的编码方法。它根据数据中字符出现的频率来构建树,频率高的字符用较短的编码表示,频率低的字符用较长的编码表示。哈夫曼编码广泛应用于文件压缩领域,其压缩率通常在20%~90%之间。
- 搜索算法
二叉搜索树(BST):二叉搜索树是一种有序的二叉树,其中每个节点的左子树只包含小于该节点值的元素,右子树只包含大于该节点值的元素。二叉搜索树常用于实现快速的数据查找、插入和删除操作。然而,当树不平衡时,其性能会下降。为了解决这个问题,引入了平衡二叉树(如AVL树和红黑树),它们通过旋转操作来保持树的平衡。
- 决策树
决策树是一种用于分类和回归的非参数监督学习方法。 它通过将数据集递归地划分为子集来构建树形结构,每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一个类别或回归值。决策树广泛应用于数据挖掘、机器学习等领域。
- 路径规划
在图论和网络分析中,树结构也用于路径规划。例如,在寻找网络中的最短路径时,可以使用生成树(如最小生成树)来简化问题。生成树是图的一个子集,它包含了图中的所有顶点,但只包含足够的边以形成一棵树。
- 表达式求值
在编译器和解释器中,树结构(如表达式树)用于表示数学表达式和逻辑表达式。通过遍历表达式树,可以计算出表达式的值。
2.空树
当树的节点数为0时,这棵树就被称为空树。空树是树的特例,具有一些独特的性质。
2.1空树的性质
节点数:空树的节点数为0,即它不包含任何节点。
高度或深度:空树的高度或深度也为0,因为没有节点,所以不存在层级关系。
表示法:在计算机科学中,空树可以通过多种方式表示,例如在二叉树中,可以使用一个特殊的空指针(如NULL)来表示空树或空子树。
2.2空树的应用
虽然空树本身看似简单且没有实际的数据存储功能,但它在数据结构和算法设计中扮演着重要角色。例如:
初始化:在创建新的树结构时,通常需要从空树开始,并逐步添加节点以构建所需的树。
边界条件:在处理树相关的算法时,空树是一个重要的边界条件。算法需要能够正确地处理空树的情况,以避免错误或异常。
递归基础情况:在使用递归算法处理树时,空树通常作为递归的基础情况之一。当算法遇到空树时,可以立即返回结果,而无需进一步处理。
2.3示例
在C语言中,可以使用结构体和指针来表示树和空树。例如,对于二叉树,可以定义如下结构体:
typedef struct TreeNode {
int val;
struct TreeNode *left;
struct TreeNode *right;
} TreeNode;
在这个定义中,left和right指针用于指向左子树和右子树。如果这两个指针都为NULL,则表示该节点是叶子节点,并且如果整棵树的根节点的指针也为NULL,则表示这是一棵空树。
3.二叉树概念及结构
二叉树简单来说就是每个父亲下面最多只有两个节点的树,一个是左儿子,另一个是右儿子
注意:
现实中的二叉树
3.1 特殊的二叉树
3.3.1满二叉树:除了叶子节点,剩下的节点都有俩个儿子
3.1.2完全二叉树:前n-1层每个节点都有两个儿子,最后一层叶子紧挨着排列。
满二叉树也是完全二叉树,完全二叉树不一定是满二叉树。
像下图这种就不是完全二叉树
3.2二叉树的性质
- 若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有 个结点.
- 若规定根节点的层数为1,则深度为h的二叉树的最大结点数是 .
- 对任何一棵二叉树, 如果度为0其叶结点个数为 , 度为2的分支结点个数为 ,则有 = +1
- 若规定根节点的层数为1,具有n个结点的满二叉树的深度
- 对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对于序号为i的结点有:
1. 若i>0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点
2. 若2i+1<n,左孩子序号:2i+1,2i+1>=n否则无左孩子
3. 若2i+2<n,右孩子序号:2i+2,2i+2>=n否则无右孩子
3.3二叉树的存储结构
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
3.3.1 顺序存储
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,关于堆我们后面的章节会专门讲解。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
3.3.2链式存储
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链和三叉链。
代码示例
typedef int BTDataType;
// 二叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
}
// 三叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pParent; // 指向当前节点的双亲
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
};
欢迎各位大佬一起学习交流~