1. 树的概念与结构
树是⼀种⾮线性的数据结构,它是由 n(n>=0)
个有限结点组成⼀个具有层次关系的集合。把它叫做 树是因为它看起来像⼀棵倒挂的树,也就是说它是根朝上,⽽叶朝下的。
-
有⼀个特殊的结点,称为根结点,根结点没有前驱结点。
-
除根结点外,其余结点被分成 M(M>0) 个互不相交的集合 T1、T2、……、Tm ,其中每⼀个集合Ti(1 <= i <= m) ⼜是⼀棵结构与树类似的⼦树。每棵⼦树的根结点有且只有⼀个前驱,可以 有 0 个或多个后继。因此,树是递归定义的。
注意:
- 树形结构中,⼦树之间不能有交集,否则就不是树形结构。(如果存在相交就是图了)
- 除了根结点外,每个结点有且仅有⼀个父节点
- ⼀棵N个结点的树有N-1条边(箭头)
2. 树的相关术语
父结点/双亲结点:若一个结点含有子结点,则这个结点称为其子结点的父结点;如上图:A是B的父结点
子结点/孩子结点:一个结点含有的子树的根结点称为该结点的子结点;如上图:B是A的孩子结点
结点的度:一个结点有几个孩子,他的度就是多少;比如A的度为6,F的度为2,K的度为0
树的度:一棵树中,最大的结点的度称为树的度;如上图:树的度为 6
叶子结点/终端结点:度为 0 的结点称为叶结点;如上图:B、C、H、I… 等结点为叶结点
分支结点/非终端结点:度不为 0 的结点;
如上图:D、E、F、G… 等结点为分支结点
兄弟结点:具有相同父结点的结点互称为兄弟结点(亲兄弟);如上图:B、C 是兄弟结点
结点的层次:从根开始定义起,根为第 1 层,根的子结点为第 2 层,以此类推;
树的高度或深度:树中结点的最大层次;如上图:树的高度为 4
结点的祖先:从根到该结点所经分支上的所有结点;如上图:A 是所有结点的祖先
路径:一条从树中任意节点出发,沿父节点-子节点连接,达到任意节点的序列;比如A到Q的路径为:A-E-J-Q;H到Q的路径H-D-A-E-J-Q
子孙:以某结点为根的子树中任一结点都称为该结点的子孙。如上图:所有结点都是A的子孙
森林:由 m(m>0) 棵互不相交的树的集合称为森林;
3. 树的表示
树结构相对于线性表就比较复杂了,要存储和表示起来就比较麻烦了,实际中树有很多种表示方法。如:双亲表示法、孩子表示法、孩子兄弟表示法等等。其中最常用的是孩子兄弟表示法。
孩子兄弟表示法中,所定义的结点类型大致是这样的:
struct TreeNode
{
struct Node* child; //第一个孩子结点
struct Node* brother; //指向下一个兄弟结点
DataType data; //结点中的数据域
};
4. 树形结构实际运用场景
文件系统是计算机存储和管理文件的一种方式,它利用树形结构来组织和管理文件和文件夹。在文件系统中,树结构被广泛应用,它通过父结点和子结点之间的关关系来表示不同层级的文件和文件夹之间的关联。
5. 二叉树
5.1 二叉树的概念与结构
在树形结构中,最常⽤的就是⼆叉树,⼀棵⼆叉树是结点的⼀个有限集合,该集合由⼀个根结点加上两棵别称为左⼦树和右⼦树的⼆叉树组成或者为空。
从上图可以看出⼆叉树具备以下特点:
- ⼆叉树不存在度⼤于
2
的结点 - ⼆叉树的⼦树有左右之分,次序不能颠倒,因此⼆叉树是有序树
注意:对于任意的⼆叉树都是由以下⼏种情况复合⽽成的。
5.2 特殊的二叉树
5.2.1 满二叉树
⼀个⼆叉树,如果每⼀个层的结点数都达到最⼤值,则这个⼆叉树就是满⼆叉树。也就是说,如果⼀个⼆叉树的层数为 K
,且结点总数是
2
k
−
1
2^k - 1
2k−1 ,则它就是满⼆叉树。
5.2.2 完全二叉树
完全二叉树 是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。
对于深度为 K
的,有 n
个结点的二叉树,当且仅当其每一个结点都与深度为 K
的满二叉树中编号从 1
至 n
的结点一一对应时称之为完全二叉树。
要注意的是,满二叉树 是一种特殊的完全二叉树,完全二叉树是从左到右的。
5.2.3 二叉树的性质
- 性质一:若规定根结点的层数为 1 1 1,则一棵非空二叉树的第i层上最多有 2 i − 1 2i-1 2i−1个结点。
- 性质二:若规定根结点的层数为 1 1 1,则深度为h的二叉树的最大结点数为 2 h − 1 2h-1 2h−1个。
- 性质三:对任何一棵二叉树,如果度为0的叶结点个数为 n 0 n0 n0,度为2的分支结点个数为 n 2 n2 n2,则有 n 0 = n 2 + 1 n0 = n2+1 n0=n2+1。
- 性质四:若规定根结点的层数为 1 1 1,则具有N个结点的满二叉树的深度 h = l o g 2 ( N + 1 ) h = log2(N+1) h=log2(N+1)。
- 性质五:若规定结点层数为 1 1 1,具有 n n n个结点的满二叉树的深度
- 性质六:对于具有
N
N
N个结点的完全二叉树,如果按照从上至下、从左至右的数组顺序对所有结点从0开始编号,则对于序号为i的结点:
- 若 i > 0,则该结点的父结点序号为:( i - 1) / 2;若 i = 0,则无父结点。
- 若2i + 1 < N,则该结点的左孩子序号为:2i + 1;若2i + 1 >= N,则无左孩子。
- 若2i + 2 < N,则该结点的右孩子序号为:2i + 2;若2i + 2 >= N,则无右孩子。
5.3 二叉树的存储结构
5.3.1 顺序结构
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费,完全二叉树更适合使用顺序结构存储。
现实中通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
5.3.2 链式结构
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即月用链来指示元素的逻辑关系。通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链。后面学到高阶数据结构如红黑树等会用到三叉链。