目录
1、树的概念及结构
1.1 树的概念
1.2 树的相关概念(很重要)
1.3 树的表示
2、二叉树的概念及结构
2.1 概念
2.2 特殊二叉树
2.3 二叉树的性质(很重要)
2.4 练习题
2.5 二叉树的存储结构
2.5.1 顺序存储
2.5.2 链式存储
3、二叉树的顺序结构及实现
3.1 二叉树的顺序结构
3.2 堆的概念及结构
3.3 堆的实现
3.4 堆的应用
4、二叉树的链式结构的实现
4.1 说明
4.1.1 二叉树的创建
4.2 二叉树的遍历
4.2.1 前序、中序以及后序遍历
4.2.2 前序、中序以及后序遍历的实现代码
4.2.3 层序遍历
4.2.4 层序遍历实现代码
4.3 节点个数
4.3.1 二叉树节点个数 -- BinaryTreeSize
4.3.2 二叉树叶子节点个数 -- BinaryTreeLeafSize
4.3.3 二叉树第k层节点个数 -- BinaryTreeLevelKSize
4.4 树的高度 -- BTreeHeight
4.5 二叉树查找值为x的节点 -- BinaryTreeFind
本篇我们来到了一个新的节点,二叉树,在讲二叉树前我们先来了解一下什么是树。
1、树的概念及结构
1.1 树的概念
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因
为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
1.有一个特殊的结点,称为根结点,根节点没有前驱结点;
2.除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i
<= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继;
3.因此,树是递归定义的。
注意:树形结构中,子树之间不能有交集,否则就不是树形结构。如下图,这样就不是树形结构。
简单理解就是树不会形成一个环状结构,有了环状结构就不是树了。
1.2 树的相关概念(很重要)
节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A的为6
叶节点或终端节点:度为0的节点称为叶节点; 如上图:B、C、H、I...等节点为叶节点
非终端节点或分支节点:度不为0的节点; 如上图:D、E、F、G...等节点为分支节点
双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点
孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点
兄弟节点:具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点
树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6
节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
树的高度或深度:树中节点的最大层次; 如上图:树的高度为4
堂兄弟节点:双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点
节点的祖先:从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
森林:由m(m>0)棵互不相交的树的集合称为森林;
这些概念都很重要,需要我们去记忆的。
除了这些概念,我们还能得到两个规律:
1.除了根结点外,每个节点有且仅有一个父节点;
2.一颗N个结点的树有N-1条边。
1.3 树的表示
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间
的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法
等。我们这里就简单的了解其中最常用的孩子兄弟表示法。
typedef int DataType;
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; // 指向其下一个兄弟结点
DataType _data; // 结点中的数据域
};
我们画图来理解一下孩子和兄弟两个概念:
由此我们可以想象到,文件系统的目录其实就是树结构,这就是树在实际中的应用之一。
2、二叉树的概念及结构
2.1 概念
一棵二叉树是结点的一个有限集合,该集合:
1. 或者为空
2. 由一个根节点加上两棵别称为左子树和右子树的二叉树组成
从上图可以看出 :
1. 二叉树不存在度大于2的结点
2. 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
注意:对于任意的二叉树都是由以下几种情况复合而成的:
举一个现实中的二叉树例子:
2.2 特殊二叉树
1. 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是
说,如果一个二叉树的层数为K,且结点总数是 2^k - 1,则它就是满二叉树。
2. 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K
的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对
应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。
我们以图来举例说明:
我们总结一下满二叉树的公式:
2.3 二叉树的性质(很重要)
1. 若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有 2^(i-1) 个结点.
2. 若规定根节点的层数为1,则深度为h的二叉树的最大结点数是 2^h - 1.
3. 对任何一棵二叉树, 如果度为0其叶结点个数为 n0, 度为2的分支结点个数为 n2,则有 n0= n2 +1
4. 若规定根节点的层数为1,具有n个结点的满二叉树的深度,h= log 2(n+1)(ps:是log以2
为底,n+1为对数)
5. 对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对
于序号为i的结点有:
a. 若i>0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点
b. 若2i+1<n,左孩子序号:2i+1,2i+1>=n否则无左孩子
c. 若2i+2<n,右孩子序号:2i+2,2i+2>=n否则无右孩子
2.4 练习题
1. 某二叉树共有 399 个结点,其中有 199 个度为 2 的结点,则该二叉树中的叶子结点数为( B )
A 不存在这样的二叉树
B 200
C 198
D 199
此题根据二叉树的性质3:对任何一棵二叉树, 如果度为0其叶结点个数为 n0, 度为2的分支结点个数为 n2,则有 n0= n2 +1。
题目中 n2 为 199,按照公式 n0= n2 +1,n0 = 200,选择 B。
2.下列数据结构中,不适合采用顺序存储结构的是( A )
A 非完全二叉树
B 堆
C 队列
D 栈
3.在具有 2n 个结点的完全二叉树中,叶子结点个数为( A )
A n
B n+1
C n-1
D n/2
经此计算,只有A符合,所以选A。
4.一棵完全二叉树的节点数位为531个,那么这棵树的高度为( B )
A 11
B 10
C 8
D 12
根据满二叉树的结点总数公式:2^h - 1,我们能推出来,完全二叉树的总结点数范围在 [2^(h-1), 2^h-1]。
我们把四个选项带入范围中试一遍,当h = 10的时候,范围为[512, 1023],在次范围内,因此选 B。
5.一个具有767个节点的完全二叉树,其叶子节点个数为( B )
A 383
B 384
C 385
D 386
因此,选B。
在这里我们总结了一个规律:完全二叉树的结点个数为奇数的时,度为1的结点为0,结点个数为偶数的时,度为1的结点为1。
2.5 二叉树的存储结构
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
2.5.1 顺序存储
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
2.5.2 链式存储
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链。
二叉链:
typedef int BTDataType;
// 二叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
};
三叉链:
// 三叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pParent; // 指向当前节点的双亲
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
};
3、二叉树的顺序结构及实现
3.1 二叉树的顺序结构
普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段 。
3.2 堆的概念及结构
堆的概念及结构我们是一篇完整的文章,点击后面的文字跳转
[数据结构 -- C语言] 堆(Heap)堆(Heap),代码 + 详解。http://[数据结构 -- C语言] 堆(Heap)
3.3 堆的实现
堆的实现也是一片完整的文章,与概念及结构是一篇,点击后面的文字跳转
[数据结构 -- C语言] 堆(Heap)堆(Heap),代码 + 详解。http://[数据结构 -- C语言] 堆(Heap)
3.4 堆的应用
堆的应用包含堆排序,TopK问题,这分别是两篇文章,点击后面的文字跳转
[数据结构 -- 手撕排序算法第四篇] 堆排序,一篇带你搞懂堆排序七大排序算法之堆排序,详解 + 代码。http://[数据结构 -- 手撕排序算法第四篇] 堆排序,一篇带你搞懂堆排序
[数据结构 -- C语言] 堆实现Top-K问题堆实现 Top-K 问题,代码 + 详解。http://[数据结构 -- C语言] 堆实现Top-K问题
4、二叉树的链式结构的实现
4.1 说明
在学习二叉树的基本操作前,需先要创建一棵二叉树,然后才能学习其相关的基本操作。由于现在大家对二叉树结构掌握还不够深入,为了降低大家学习成本,此处手动快速创建一棵简单的二叉树,快速进入二叉树操作学习,等二叉树结构了解的差不多时,我们反过头再来研究二叉树真正的创建方式 。
4.1.1 二叉树的创建
typedef int BTDataType;
typedef struct BinaryTreeNode
{
BTDataType _data;
struct BinaryTreeNode* _left;
struct BinaryTreeNode* _right;
}BTNode;
BTNode* CreatBinaryTree()
{
BTNode* node1 = BuyNode(1);
BTNode* node2 = BuyNode(2);
BTNode* node3 = BuyNode(3);
BTNode* node4 = BuyNode(4);
BTNode* node5 = BuyNode(5);
BTNode* node6 = BuyNode(6);
node1->_left = node2;
node1->_right = node4;
node2->_left = node3;
node4->_left = node5;
node4->_right = node6;
return node1;
}
上述代码中,我们创建的二叉树如下图:
从概念中可以看出,二叉树定义是递归式的,因此后序基本操作中基本都是按照该概念实现的。
4.2 二叉树的遍历
4.2.1 前序、中序以及后序遍历
学习二叉树结构,最简单的方式就是遍历。所谓二叉树遍历(Traversal)是按照某种特定的规则,依次对二叉树中的节点进行相应的操作,并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。 遍历是二叉树上最重要的运算之一,也是二叉树上进行其它运算的基础。
按照规则,二叉树的遍历有:前序/中序/后序的递归结构遍历:
1. 前序遍历(Preorder Traversal 亦称先序遍历)——访问根结点的操作发生在遍历其左右子树之前。
2. 中序遍历(Inorder Traversal)——访问根结点的操作发生在遍历其左右子树之中(间)。
3. 后序遍历(Postorder Traversal)——访问根结点的操作发生在遍历其左右子树之后。
由于被访问的结点必是某子树的根,所以N(Node)、L(Left subtree)和R(Right subtree)又可解释为
根、根的左子树和根的右子树。NLR、LNR和LRN分别又称为先根遍历、中根遍历和后根遍历。
// 二叉树前序遍历
void PreOrder(BTNode* root);
// 二叉树中序遍历
void InOrder(BTNode* root);
// 二叉树后序遍历
void PostOrder(BTNode* root);
下面主要分析前序递归遍历,中序与后序图解类似,同学们可自己动手绘制。
前序遍历递归图解:
由规则我们可以直到,前序遍历是先访问根节点再访问左孩子再访问右孩子。
我们如果要使用前序遍历的方法来遍历整个二叉树,递归展开图如下:
前序遍历结果:1 2 3 4 5 6
中序遍历结果:3 2 1 5 4 6
后序遍历结果:3 2 5 6 4 1
4.2.2 前序、中序以及后序遍历的实现代码
// 二叉树前序遍历
void BinaryTreePrevOrder(BTNode* root)
{
if (NULL == root)
{
printf("N ");
return;
}
printf("%c ", root->data);
BinaryTreePrevOrder(root->left);
BinaryTreePrevOrder(root->right);
}
// 二叉树中序遍历
void BinaryTreeInOrder(BTNode* root)
{
if (NULL == root)
{
printf("N ");
return;
}
BinaryTreeInOrder(root->left);
printf("%c ", root->data);
BinaryTreeInOrder(root->right);
}
// 二叉树后序遍历
void BinaryTreePostOrder(BTNode* root)
{
if (NULL == root)
{
printf("N ");
return;
}
BinaryTreePostOrder(root->left);
BinaryTreePostOrder(root->right);
printf("%c ", root->data);
}
4.2.3 层序遍历
层序遍历:除了先序遍历、中序遍历、后序遍历外,还可以对二叉树进行层序遍历。设二叉树的根节点所在层数为1,层序遍历就是从所在二叉树的根节点出发,首先访问第一层的树根节点,然后从左到右访问第2层上的节点,接着是第三层的节点,以此类推,自上而下,自左至右逐层访问树的结点的过程就是层序遍历。
对于层序遍历来说,我们不用递归来写,现在的水平也写不了,因此,我们借助队列来实现,队列的规则是先进先出,父节点先进队,父节点出队前,把左孩子与右孩子代入到队列中,此时再出左孩子,左孩子出队时再将左孩子的左右孩子代入队列,不断这样走,走完整个二叉树。 打印的时候,我们取队头元素,打印队头元素,不断取队头打印,直到整个队列为空。
思路图解:
4.2.4 层序遍历实现代码
对队列还有不清楚的同学可以看看这篇文章,队列是一篇完整的文章哦,点后面文字跳转,[数据结构 -- C语言] 队列(Queue)链表实现队列,代码+详解。https://blog.csdn.net/Ljy_cx_21_4_3/article/details/130739681
// 层序遍历
void BinaryTreeLevelOrder(BTNode* root)
{
Queue q;
QueueInit(&q);
if (root)
QueuePush(&q, root);
while (!QueueEmpty(&q))
{
BTNode* front = QueueFront(&q);//先将队头元素记下来
QueuePop(&q);
printf("%c ", front->data);
if (front->left)
QueuePush(&q, front->left);
if (front->right)
QueuePush(&q, front->right);
}
QueueDestroy(&q);
}
int main()
{
char a[] = { '1','2','3',NULL,NULL,'4',NULL,'5','6',NULL,NULL,NULL,NULL };
int i = 0;
BTNode* root = BinaryTreeCreate(a, &i);
BinaryTreeLevelOrder(root);
printf("\n");
return 0;
}
4.3 节点个数
4.3.1 二叉树节点个数 -- BinaryTreeSize
思想:我们知道,二叉树是分为根节点,左子树,右子树三部分的。所以我们要求二叉树的节点总个数时,只需要求左子树,右子树的节点个数,再加上根节点,就计算出了二叉树的节点个数。
我们举个例子来类比一下这个思想:
如果一个高中学校的校长不知道学校有多少名学生,现在校长要查一下学校现有多少名学生时,校长不可能每个班去数人数,这效率太低了。校长这时将任务分给三个年级组长,各年级组长去统计各年级人数,最后汇总给校长,加起来就好了。年级组长也纷纷效仿,让每个班的班主任去统计,班主任将任务派给各班班长,班长数完人一级一级的汇报上去,最后到校长那里,校长只需要将年级组长汇报上来的人数加起来即可。这种方式其实就是分治思想,分而治之,效率不仅提高了,出错率也会大大降低。
我们画图来明确一下:
实现代码:
int BinaryTreeSize(BTNode* root)
{
if (NULL == root)
return 0;
//分治算法
return BinaryTreeSize(root->left)
+ BinaryTreeSize(root->right) + 1;
//简化
//return root == NULL ? 0 : BinaryTreeSize(root->left)
// + BinaryTreeSize(root->right) + 1;//简化代码
}
递归图:
结果展示:
4.3.2 二叉树叶子节点个数 -- BinaryTreeLeafSize
思想:在统计叶子节点的时候用到的思路依旧是分治思想,左子树的叶子节点+右子树的叶子节点就是整个二叉树的叶子节点。 叶子节点即就是度为 0 的节点,因此判断条件就是节点的左右孩子都为空。
int BinaryTreeLeafSize(BTNode* root)
{
if (NULL == root)
return 0;
if (NULL == root->left && NULL == root->right)
return 1;
return BinaryTreeLeafSize(root->left)
+ BinaryTreeLeafSize(root->right);
}
运行结果:
4.3.3 二叉树第k层节点个数 -- BinaryTreeLevelKSize
思想:仍旧是分治的思想,因为要计算二叉树的第K层节点个数,因此只要计算出左右子树的 k-1 层的节点个数即可。
这里分三种情况:
1.当 k<0 时,返回 0;
2.当 k=1 时,第一层就一个根节点,返回 1;
3.当 k>1 时,按照思想往下递归。
实现代码:
int BinaryTreeLevelKSize(BTNode* root, int k)
{
assert(k > 0);
if (NULL == root)
return 0;
if (1 == k)
return 1;
return BinaryTreeLevelKSize(root->left, k - 1)
+ BinaryTreeLevelKSize(root->right, k - 1);
}
运行结果:
4.4 树的高度 -- BTreeHeight
思想:二叉树的高度我们依旧使用分治思想,求出左数高度与右数高度,分别 +1(加上根节点这一层),哪个值大哪个就是树的高度。
实现代码:
int BTreeHeight(BTNode* root)
{
if (NULL == root)
return 0;
int leftH = BTreeHeight(root->left);
int rightH = BTreeHeight(root->right);
return leftH > rightH ? leftH + 1 : rightH + 1;
}
4.5 二叉树查找值为x的节点 -- BinaryTreeFind
思想:依旧是分治思想,递归实现,要找节点值为x的节点,我们先看根节点是不是,再递归左右子树的每一个基点。
实现代码:
BTNode* BinaryTreeFind(BTNode* root, BTDataType x)
{
if (NULL == root)
return NULL;
if (root->data == x)
return root;
BTNode* ret1 = BinaryTreeFind(root->left, x);
if (ret1)
return ret1;
BTNode* ret2 = BinaryTreeFind(root->right, x);
if (ret2)
return ret2;
return NULL;
}
运行结果: