二叉树的种类
二叉树(binary tree)是一种非线性数据结构,代表“祖先”
与“后代”
之间的派生关系,体现了“一分为二”的分治逻辑。与链表类似,二叉树的基本单元是节点,每个节点包含值、左子节点引用和右子节点引用。
/* 二叉树节点类 */
public class TreeNode {
int val; // 节点值
TreeNode left; // 左子节点引用
TreeNode right; // 右子节点引用
// 构造方法
TreeNode() {}
TreeNode(int val) { this.val = val; }
TreeNode(int val, TreeNode left, TreeNode right) {
this.val = val;
this.left = left;
this.right = right;
}
}
在现场面试的时候 面试官可能要求手写代码,所以数据结构的定义以及简单逻辑的代码一定要锻炼白纸写出来。
每个节点都有两个引用(指针),分别指向左子节点(left-child node)和右子节点(right-child node),该节点被称为这两个子节点的父节点(parent node)。当给定一个二叉树的节点时,我们将该节点的左子节点及其以下节点形成的树称为该节点的左子树(left subtree),同理可得右子树(right subtree)。
在二叉树中,除叶节点外,其他所有节点都包含子节点和非空子树。如下图所示,如果将“节点 2”视为父节点,则其左子节点和右子节点分别是“节点 4”和“节点 5”,左子树是“节点 4 及其以下节点形成的树”,右子树是“节点 5 及其以下节点形成的树”。
二叉树常见术语
二叉树的常用术语如下图所示。
- 根节点(root node):位于二叉树顶层的节点,没有父节点。
- 叶节点(leaf node):没有子节点的节点,其两个指针均指向 None 。
- 边(edge):连接两个节点的线段,即节点引用(指针)。
- 节点所在的层(level):从顶至底递增,根节点所在层为 1 。
- 节点的度(degree):节点的子节点的数量。在二叉树中,度的取值范围是 0、1、2 。
- 二叉树的高度(height):从根节点到最远叶节点所经过的边的数量。
- 节点的深度(depth):从根节点到该节点所经过的边的数量。
- 节点的高度(height):从距离该节点最远的叶节点到该节点所经过的边的数量。
🔥Tip
请注意,我们通常将“高度”和“深度”定义为“经过的边的数量”,但有些题目或教材可能会将其定义为“经过的节点的数量”。在这种情况下,高度和深度都需要加 1 。
二叉树基本操作
1. 初始化二叉树
与链表类似,首先初始化节点,然后构建引用(指针)。
// 初始化节点
TreeNode n1 = new TreeNode(1);
TreeNode n2 = new TreeNode(2);
TreeNode n3 = new TreeNode(3);
TreeNode n4 = new TreeNode(4);
TreeNode n5 = new TreeNode(5);
// 构建节点之间的引用(指针)
n1.left = n2;
n1.right = n3;
n2.left = n4;
n2.right = n5;
2. 插入与删除节点
与链表类似,在二叉树中插入与删除节点可以通过修改指针来实现。下图给出了一个示例。
TreeNode P = new TreeNode(0);
// 在 n1 -> n2 中间插入节点 P
n1.left = P;
P.left = n2;
// 删除节点 P
n1.left = n2;
Note☘️
需要注意的是,插入节点可能会改变二叉树的原有逻辑结构,而删除节点通常意味着删除该节点及其所有子树。因此,在二叉树中,插入与删除通常是由一套操作配合完成的,以实现有实际意义的操作。
常见二叉树类型
在我们解题过程中二叉树有两种主要的形式:满二叉树和完全二叉树。
重要的两种二叉树:
- 完全二叉树(complete binary tree)是一种二叉树结构,除最后一层以外,每一层都必须填满,填充时要遵从先左后右
- 平衡二叉树(balance binary tree)是一种二叉树结构,其中每个节点的左右子树高度相差不超过 1
1. 满二叉树
满二叉树:如果一棵二叉树只有度为0的结点和度为2的结点,并且度为0的结点在同一层上,则这棵二叉树为满二叉树。
如图所示:
这棵二叉树为满二叉树,也可以说深度为k
,有2k-1
个节点的二叉树。
2. 完全二叉树
什么是完全二叉树?
完全二叉树的定义如下:在完全二叉树中,除了最底层节点可能没填满外,其余每层节点数都达到最大值,并且最下面一层的节点都集中在该层最左边的若干位置。若最底层为第 h 层(h从1开始),则该层包含 1~ 2^(h-1) 个节点。
大家要自己看完全二叉树的定义,很多同学对完全二叉树其实不是真正的懂了。
3.完满二叉树
完满二叉树(full binary tree)除了叶节点之外,其余所有节点都有两个子节点。
4.平衡二叉树
平衡二叉树(balanced binary tree)中任意节点的左子树和右子树的高度之差的绝对值不超过 1 。
5. 二叉搜索树
前面介绍的树,都没有数值的,而二叉搜索树是有数值的了,二叉搜索树是一个有序树。
- 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值;
- 若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值;
- 它的左、右子树也分别为二叉排序树
下面这两棵树都是搜索树
6. 平衡二叉搜索树
平衡二叉搜索树:又被称为AVL(Adelson-Velsky and Landis)树,且具有以下性质:它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。
如图:
最后一棵 不是平衡二叉树,因为它的左右两个子树的高度差的绝对值超过了1。
二叉树的存储方式
二叉树可以链式存储,也可以顺序存储。
那么链式存储方式就用指针, 顺序存储的方式就是用数组。
顾名思义就是顺序存储的元素在内存是连续分布的,而链式存储则是通过指针把分布在各个地址的节点串联一起。
链式存储如图:
链式存储是大家很熟悉的一种方式,那么我们来看看如何顺序存储呢?
其实就是用数组来存储二叉树,顺序存储的方式如图:
用数组来存储二叉树如何遍历的呢?
如果父节点的数组下标是 i,那么它的左孩子就是 i * 2 + 1,右孩子就是 i * 2 + 2。
但是用链式表示的二叉树,更有利于我们理解,所以一般我们都是用链式存储二叉树。
所以大家要了解,用数组依然可以表示二叉树。
二叉树的遍历方式
此处为语雀内容卡片,点击链接查看:https://www.yuque.com/hollis666/gknnry/ukadhqwk8gmp6aq2
从物理结构的角度来看,树是一种基于链表的数据结构,因此其遍历方式是通过指针逐个访问节点。然而,树是一种非线性数据结构,这使得遍历树比遍历链表更加复杂,需要借助搜索算法来实现。
二叉树常见的遍历方式包括层序遍历、前序遍历、中序遍历和后序遍历等。
一些同学用做了很多二叉树的题目了,可能知道前中后序遍历,可能知道层序遍历,但是却没有框架。
我这里把二叉树的几种遍历方式列出来,大家就可以一一串起来了。
二叉树主要有两种遍历方式:
- 深度优先遍历:先往深走,遇到叶子节点再往回走。
- 广度优先遍历:尽可能先访问距离根最近的节点,一层一层的去遍历,也称为层序遍历。
这两种遍历是图论中最基本的两种遍历方式,后面在介绍图论的时候 还会介绍到。
那么从深度优先遍历和广度优先遍历进一步拓展,才有如下遍历方式:
- 深度优先遍历
-
- 前序遍历(递归法,迭代法)对于每一棵子树,先访问该节点,然后是左子树,最后是右子树
- 中序遍历(递归法,迭代法)对于每一棵子树,先访问左子树,然后是该节点,最后是右子树
- 后序遍历(递归法,迭代法)对于每一棵子树,先访问左子树,然后是右子树,最后是该节点
- 广度优先遍历
-
- 层次遍历(迭代法)
在深度优先遍历中:有三个顺序,前中后序遍历, 有同学总分不清这三个顺序,经常搞混,我这里教大家一个技巧。
这里前中后,其实指的就是中间节点的遍历顺序,只要大家记住 前中后序指的就是中间节点的位置就可以了。
看如下中间节点的顺序,就可以发现,中间节点的顺序就是所谓的遍历方式
- 前序遍历:中左右
- 中序遍历:左中右
- 后序遍历:左右中
大家可以对着如下图,看看自己理解的前后中序有没有问题。
最后再说一说二叉树中深度优先和广度优先遍历实现方式,我们做二叉树相关题目,经常会使用递归的方式来实现深度优先遍历,也就是实现前中后序遍历,使用递归是比较方便的。
之前我们讲栈与队列的时候,就说过栈其实就是递归的一种实现结构,也就说前中后序遍历的逻辑其实都是可以借助栈使用递归的方式来实现的。
而广度优先遍历的实现一般使用队列来实现,这也是队列先进先出的特点所决定的,因为需要先进先出的结构,才能一层一层的来遍历二叉树。
这里其实我们又了解了栈与队列的一个应用场景了。
🎆那么我们既然已经知道了二叉树遍历方式的理论基础,那么我们就以该理论基础为引导,尝试一下自己使用代码手搓我们的二叉树的常见遍历方式吧!
代码实现
递归版
引言:
这次我们要好好谈一谈递归,为什么很多同学看递归算法都是“一看就会,一写就废”。
主要是对递归不成体系,没有方法论,每次写递归算法 ,都是靠玄学来写代码,代码能不能编过都靠运气。
接下来我们将介绍前后中序的递归写法,一些同学可能会感觉很简单,其实不然,我们要通过简单题目把方法论确定下来,有了方法论,后面才能应付复杂的递归。
这里帮助大家确定下来递归算法的三个要素。每次写递归,都按照这三要素来写,可以保证大家写出正确的递归算法!
- 确定递归函数的参数和返回值: 确定哪些参数是递归的过程中需要处理的,那么就在递归函数里加上这个参数, 并且还要明确每次递归的返回值是什么进而确定递归函数的返回类型。
- 确定终止条件: 写完了递归算法, 运行的时候,经常会遇到栈溢出的错误,就是没写终止条件或者终止条件写的不对,操作系统也是用一个栈的结构来保存每一层递归的信息,如果递归没有终止,操作系统的内存栈必然就会溢出。
- 确定单层递归的逻辑: 确定每一层递归需要处理的信息。在这里也就会重复调用自己来实现递归的过程。
好了,我们确认了递归的三要素,接下来就来练练手:
以下以前序遍历为例:
- 确定递归函数的参数和返回值:因为要打印出前序遍历节点的数值,所以参数里需要传入
List
集合来放节点的数值,除了这一点就不需要再处理什么数据了也不需要有返回值,所以递归函数返回类型就是void,代码如下:
public void preorder(TreeNode root,List<Integer> result) {
- 确定终止条件:在递归的过程中,如何算是递归结束了呢,当然是当前遍历的节点是空了,那么本层递归就要结束了,所以如果当前遍历的这个节点是空,就直接return,代码如下:
if (root == null) {
- 确定单层递归的逻辑:前序遍历是中左右的循序,所以在单层递归的逻辑,是要先取中节点的数值,代码如下:
result.add(root.val);
preorder(root.left, result);
preorder(root.right, result);
单层递归的逻辑就是按照中左右的顺序来处理的,这样二叉树的前序遍历,基本就写完了,再看一下完整代码:
前序遍历:
// 前序遍历·递归·LC144_二叉树的前序遍历
class Solution {
public List<Integer> preorderTraversal(TreeNode root) {
List<Integer> result = new ArrayList<Integer>();
preorder(root, result); // 前序遍历
return result;
}
public void preorder(TreeNode root, List<Integer> result) {
if (root == null) {
return;
}
result.add(root.val);
preorder(root.left, result); // 左
preorder(root.right, result); // 右
}
}
中序遍历:
// 中序遍历·递归·LC94_二叉树的中序遍历
class Solution {
public List<Integer> inorderTraversal(TreeNode root) {
List<Integer> res = new ArrayList<>();
inorder(root, res);
return res;
}
void inorder(TreeNode root, List<Integer> list) {
if (root == null) {
return;
}
inorder(root.left, list);
list.add(root.val); // 注意这一句
inorder(root.right, list);
}
}
后序遍历:
// 后序遍历·递归·LC145_二叉树的后序遍历
class Solution {
public List<Integer> postorderTraversal(TreeNode root) {
List<Integer> res = new ArrayList<>();
postorder(root, res);
return res;
}
void postorder(TreeNode root, List<Integer> list) {
if (root == null) {
return;
}
postorder(root.left, list);
postorder(root.right, list);
list.add(root.val); // 注意这一句
}
}
迭代版
前序遍历:
前序遍历是中左右,每次先处理的是中间节点,那么先将根节点放入栈中,然后将右孩子加入栈,再加入左孩子。为什么要先加入 右孩子,再加入左孩子呢? 因为这样出栈的时候才是中左右的顺序。
动画如下:
不难写出如下代码: (注意代码中空节点不入栈)
// 前序遍历顺序:中-左-右,入栈顺序:中-右-左
class Solution {
public List<Integer> preorderTraversal(TreeNode root) {
List<Integer> result = new ArrayList<>();
if (root == null){
return result;
}
Stack<TreeNode> stack = new Stack<>();
stack.push(root);
while (!stack.isEmpty()){
TreeNode node = stack.pop(); // 中
result.add(node.val);
if (node.right != null){
stack.push(node.right); // 右(空节点不入栈)
}
if (node.left != null){
stack.push(node.left); // 左(空节点不入栈)
}
}
return result;
}
}
class Solution {
public static void preOrder(TreeNode root) {
List<Integer> result = new ArrayList<>();
//定义一个变量,存放当前节点
TreeNode curr = root;
//定义一个栈数据结构,用来存放遍历过程中的节点
LinkedList<TreeNode> stack = new LinkedList<>();
//当前孩子不为空或者栈中不为空,则循环
while (curr != null || !stack.isEmpty()) {
if (curr != null) {
//如果当前节点不为空,打印
result.add(curr.val);
//打印后将该节点放入栈中
stack.push(curr);
//将curr指向当前节点的左孩子
curr = curr.left;
} else {
//如果当前节点为空,则从栈中弹出节点
TreeNode pop = stack.pop();
//将curr指向弹出节点的右孩子(此时当前节点的所有左孩子和当前节点以及全部打印)
curr = pop.right;
}
}
}
}
中序遍历:
为了解释清楚,我说明一下 刚刚在迭代的过程中,其实我们有两个操作:
- 处理:将元素放进result数组中
- 访问:遍历节点
分析一下为什么刚刚写的前序遍历的代码,不能和中序遍历通用呢,因为前序遍历的顺序是中左右,先访问的元素是中间节点,要处理的元素也是中间节点,所以刚刚才能写出相对简洁的代码,因为要访问的元素和要处理的元素顺序是一致的,都是中间节点。
那么再看看中序遍历,中序遍历是左中右,先访问的是二叉树顶部的节点,然后一层一层向下访问,直到到达树左面的最底部,再开始处理节点(也就是在把节点的数值放进result数组中),这就造成了处理顺序和访问顺序是不一致的。
那么在使用迭代法写中序遍历,就需要借用指针的遍历来帮助访问节点,栈则用来处理节点上的元素。
动画如下:
中序遍历,可以写出如下代码:
/**
* 中序遍历
*/
public static void inOrder(TreeNode root) {
List<Integer> inOrder = new LinkedList<>();
//先定义一个变量存放当前节点
TreeNode curr = root;
//定义一个栈数据结构,用来存放遍历过程中的节点
LinkedList<TreeNode> stack = new LinkedList<>();
//当左孩子不为空或者栈中不为空,则循环
while (curr != null || !stack.isEmpty()) {
if (curr != null) {
//如果当前节点不为空,将其放入栈中
stack.push(curr);
//将curr指向当前节点的左孩子
curr = curr.left;
} else {
//如果当前节点为空了,则从栈中弹出节点并输出(说明被弹栈节点左孩子为空)
TreeNode pop = stack.pop();
inOrder.add(pop.val);
//将curr指向当前节点的右孩子
curr = pop.right;
}
}
}
后序遍历:
再来看后序遍历,先序遍历是中左右,后续遍历是左右中,那么我们只需要调整一下先序遍历的代码顺序,就变成中右左的遍历顺序,然后在反转result数组,输出的结果顺序就是左右中了,如下图:
所以后序遍历只需要前序遍历的代码稍作修改就可以了,代码如下:
/**
* 后序遍历
*/
public static void postOrder(TreeNode root) {
List<Integer> postOrder = new LinkedList<>();
//先定义一个变量存放当前节点
TreeNode curr = root;
//定义一个栈数据结构,用来存放遍历过程中的节点
LinkedList<TreeNode> stack = new LinkedList<>();
//定义一个变量pop存放最近从栈中弹出的节点
TreeNode pop = null;
//当左孩子不为空或者栈中不为空,则循环
while (curr != null || !stack.isEmpty()) {
if (curr != null) {
//如果当前节点不为空,将其放入栈中
stack.push(curr);
//将curr指向当前节点的左孩子
curr = curr.left;
} else {
//后序遍历调用栈数据结构的peek方法,先操作栈顶元素,不急着弹出
TreeNode peek = stack.peek();
//如果栈顶节点的右孩子为空,或者与最近弹出栈的节点相同
if (peek.right == null || peek.right == pop) {
//则将栈顶元素弹出并打印
pop = stack.pop();
postOrder.add(pop.val);
} else {
//如果不是,则将curr指向栈顶元素的右孩子
curr = peek.right;
}
}
}
}
迭代版二叉树的三种遍历方式三合一代码:
/**
* 二叉树 前/中/后 遍历方式 三合一
*/
public class TreeTraversal2 {
//存放前序遍历节点
List<Integer> preOrder = new ArrayList<>();
//存放中序遍历节点
List<Integer> inOrder = new ArrayList<>();
//存放后序遍历节点
List<Integer> postOrder = new ArrayList<>();
public void treeTraversal(TreeNode root) {
//定义一个变量curr记录当前节点
TreeNode curr = root;
//定义一个栈数据结构,用来存放遍历过程中的节点
LinkedList<TreeNode> stack = new LinkedList<>();
//定义一个变量pop用来存放最近被从栈中弹出的节点
TreeNode pop = null;
//当当前节点不为空,或者栈中有节点时,循环
while (curr != null || !stack.isEmpty()) {
//如果当前节点不为空
if (curr != null) {
preOrder.add(curr.val);//前序遍历
//将当前节点放入栈中
stack.push(curr);
//将curr指向当前节点的左孩子
curr = curr.left;
} else {
//获取栈中栈顶节点
TreeNode peek = stack.peek();
if (peek.right == null) { // 情况一:右孩子为空
inOrder.add(peek.val);//中序遍历
pop = stack.pop();
postOrder.add(pop.val);//后序遍历
} else if (peek.right == pop) { // 情况二:右孩子不为空,但右孩子已经处理完成
pop = stack.pop();
postOrder.add(pop.val);//后序遍历
}else { // 情况三:右孩子不为空,而且也还没有处理
inOrder.add(peek.val);//中序遍历
curr = peek.right;
}
}
}
}
}
层序遍历:
层序遍历一个二叉树。就是从左到右一层一层的去遍历二叉树。这种遍历的方式和我们之前讲过的都不太一样。
需要借用一个辅助数据结构即队列来实现,队列先进先出,符合一层一层遍历的逻辑,而用栈先进后出适合模拟深度优先遍历也就是递归的逻辑。
而这种层序遍历方式就是图论中的广度优先遍历,只不过我们应用在二叉树上。
使用队列实现二叉树广度优先遍历,动画如下:
这样就实现了层序从左到右遍历二叉树。
代码如下:这份代码也可以作为二叉树层序遍历的模板,打十个就靠它了。
public int maxDepth(TreeNode root) {
if (root == null) {
return 0;
}
//二叉树的层序遍历需要用到队列数据结构
Queue<TreeNode> queue = new LinkedList<>();
queue.offer(root);
//记录深度
int depth = 0;
while (!queue.isEmpty()) {
//每一层节点个数<队列中元素个数记录的就是每一层节点的个数>
int size = queue.size();
//当前层有多少节点就循环多少次
for (int i = 0; i < size; i++) {
//就把多少节点从队列中弹出,并把它们的孩子加入队列
TreeNode pollNode = queue.poll();
if (pollNode.left != null) {
queue.offer(pollNode.left);
}
if (pollNode.right != null) {
queue.offer(pollNode.right);
}
}
//每循环一层,层数 + 1
depth++;
}
//当循环完所有节点,返回层数
return depth;
}
public List<List<Integer>> levelOrder(TreeNode root) {
// 存储结果
List<List<Integer>> result = new ArrayList<>();
// 如果根节点为空,则直接返回结果
if (root == null) {
return result;
}
// 创建一个队列
Queue<TreeNode> queue = new LinkedList<>();
// 将根节点放入队列
queue.offer(root);
// 记录每一层的节点个数
int c1 = 1;//每一层节点个数
// 当队列不为空时
while (!queue.isEmpty()) {
// 记录下一层节点个数
int c2 = 0;//下一层节点个数
// 创建一个存储每一层节点的列表
List<Integer> lever = new ArrayList<>();
// 遍历每一层节点
for (int i = 0; i < c1; i++) {
// 从队列中取出一个节点
TreeNode node = queue.poll();
// 将节点的值添加到列表中
lever.add(node.val);
// 如果该节点有左子节点,则将左子节点放入队列
if (node.left != null) {
queue.offer(node.left);
c2++;
}
// 如果该节点有右子节点,则将右子节点放入队列
if (node.right != null) {
queue.offer(node.right);
c2++;
}
}
// 更新每一层节点个数
c1 = c2;
// 将每一层节点列表添加到结果中
result.add(lever);
}
// 返回结果
return result;
}
总结
二叉树是一种基础数据结构,在算法面试中都是常客,也是众多数据结构的基石。
本篇我们介绍了二叉树的种类、存储方式、遍历方式以及定义,比较全面的介绍了二叉树各个方面的重点,帮助大家扫一遍基础。
参考:
第 7 章 树 - Hello 算法 (hello-algo.com)
代码随想录 (programmercarl.com)
代码随想录 (programmercarl.com)
树 - 基础和Overview | Java 全栈知识体系 (pdai.tech)