1.树概念及结构
树概念
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
- 有一个特殊的结点,称为根结点,根节点没有前驱结点
- 除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i <= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继
- 因此,树是递归定义的。
注意:树形结构中,子树之间不能有交集,否则就不是树形结构
树的相关概念
- 结点的度:一个结点含有的子树的个数称为该结点的度。
- 叶结点(终端结点):度为0的结点称为叶结点。
- 非终端结点(分支结点):度不为0的结点。
- 父结点(双亲结点):若一个结点含有子结点,则这个结点称为其子结点的父结点。
- 子结点(孩子结点):一个结点含有的子树的根结点称为该结点的子结点。
- 兄弟结点:具有相同父结点的结点互称为兄弟结点。
- 树的度:一棵树中,最大的结点的度称为树的度。
- 结点的层次:从根开始定义起,根为第一层,根的子结点为第二层,以此类推。
- 树的高度(树的深度):树中结点的最大层次。
- 堂兄弟结点:双亲在同一层的结点互称为堂兄弟结点。
- 结点的祖先:从根到该结点所经分支上的所有结点。
- 子孙:以某结点为根的子树中任一结点都称为该结点的子孙。
- 森林:由m(m>0)棵互不相交的树组成的集合称为森林。
树的表示
树结构相对于线性表就比较复杂了,要存储和表示起来就比较麻烦了,实际中树有很多种表示方法。如:双亲表示法、孩子表示法、孩子兄弟表示法等等。其中最常用的是孩子兄弟表示法。
孩子兄弟表示法中,所定义的结点类型大致是这样的:
typedef int DataType
struct Node{
struct Node* firstChild; //第一个孩子结点
struct Node* nextBrother; //指向下一个兄弟结点
DataType data; //结点中的数据域
};
对于任意树,我们都可以用孩子兄弟法访问到树中的每一个结点:
树在实际中的运用(表示文件系统的目录树结构)
2.二叉树的概念及结构
二叉树概念
一棵二叉树是结点的一个有限集合,该集合:
- 或者为空
- 由一个根节点加上两棵称为左子树和右子树的二叉树组成
从上图可以看出:
- 二叉树不存在度大于2的结点
- 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
注意:对于任意的二叉树都是由以下几种情况复合而成的:
满二叉树和完全二叉树
- 满二叉树:一个二叉树,如果每一层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为k,且结点总数是2的k次方-1,则它就是满二叉树。
- 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K,有N个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至N的结点一一对应时称之为完全二叉树。要注意的是满二叉树是一种特殊的完全二叉树。
二叉树的性质
性质一:若规定根结点的层数为1,则一棵非空二叉树的第i层上最多有2的(i-1)次方个结点。
性质二:若规定根结点的层数为1,则深度为h的二叉树的最大结点数为2的h次方-1个结点。
性质三:对任何一棵二叉树,如果度为0的叶结点个数为n0,度为2的分支结点个数为n2,则有n0 = n2+1。
性质四:若规定根结点的层数为1,则具有N个结点的满二叉树的深度h = log2(N+1)。
性质五:对于具有N个结点的完全二叉树,如果按照从上至下、从左至右的数组顺序对所有结点从0开始编号,
则对于序号为i的结点:
若 i > 0,则该结点的父结点序号为:( i - 1) / 2;若 i = 0,则无父结点。
若2i + 1 < N,则该结点的左孩子序号为:2i + 1;若2i + 1 >= N,则无左孩子。
若2i + 2 < N,则该结点的右孩子序号为:2i + 2;若2i + 2 >= N,则无右孩子。
二叉树的存储结构
顺序结构
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实生活中只有堆(一种二叉树)才会使用数组来存储。二叉树的顺序存储在物理上是一个数组,在逻辑上是一棵二叉树。
链式结构
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素之间的逻辑关系。通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来存储该结点左孩子和右孩子所在的结点的地址。
链式结构又分为二叉链和三叉链,之后我们会用二叉链来实现二叉树的链式存储结构,三叉链运用于更高阶的数据结构,例如红黑树。