在学习上一章后,我们对树加以限制,如果树的度为 2,那么就称这颗树为 二叉树 (binary tree)。
二叉树的性质
在一棵二叉树上,有一些重要的性质:
- 第 i 层 (i∈N) 上最多有 2^(i−1) 个结点
- 层次为 k(k∈N) 的树最多有 2^k−1 个结点
- 如果叶结点的数量为 n0 , degree=2 的结点的数量为 n2 ,则 n0=n2+1
如果将二叉树的每一层填满,那么这颗二叉树被称之为 满二叉树 (full binary tree);如果这颗二叉树除最后一层外都是满的,且最后一层要么是满的,要么是右边缺少连续的若干结点,那么称这颗二叉树为 完全二叉树 (complete binary tree)。
由于 full binary tree 与 complete binary tree 是特殊的二叉树,因此它们也有一些确定性的性质。我们假设总结点数为 k ,树的高度 (即树的层数) 为 h ,其中某一层为第 i 层,则有以下性质:
二叉树的实现
为实现二叉树,我们可以为其采用双向链表的结构,但不再是指向结点的 prev 和 next,而是指向该结点的 left child 和 right child。
struct BinaryTreeBaseNode {
BinaryTreeBaseNode* left,* right;
};
template <class Element>
struct BinaryTreeNode : BinaryTreeBaseNode {
Element data;
};
在这里给出求解二叉树 root 中,node 的高度和深度
// 求解结点 node 的高度
int node_height(BinaryTreeBaseNode* node) {
if (node == nullptr) {
return -1;
}
return max(binary_tree_height(node->left),
binary_tree_height(node->right)) + 1;
}
// 求解结点 node 在树 root 中的深度
int node_depth(BinaryTreeBaseNode* root, const BinaryTreeBaseNode* node) {
if (root == nullptr) {
return -1;
}
if (root == node) {
return 0;
}
int left_depth = node_depth(root->left, node);
int right_depth = node_depth(root->right, node);
return left_depth == -1 ? (right_depth += right_depth != -1) : (left_depth + 1);
}
如果想要从结点向上求解某些数据时,并不容易做到,因为 child 没有指向 parent 的指针,需要遍历树找到 node 的 parent 才能操作。
// 求解结点 node 的 parent,如果不存在返回 nullptr
BinaryTreeBaseNode* get_parent(BinaryTreeBaseNode* root, const BinaryTreeBaseNode* node) {
if (root == nullptr || root == node) {
return nullptr;
}
if (root->left == node || root->right == node) {
return root;
}
auto left = get_parent(root->left, node);
return left == nullptr ? get_parent(root->right, node) : left;
}
为了方便实现我们自然而然的会在链域中添加指向 parent
的指针。这样在求解 sibling、 uncle 时十分方便,并且求解结点的深度时不再需要将其等价为 root 到 node 的路径长。需要注意的是,root 是没有 parent 的。
二叉树的遍历
还记得之前提到的 postorder traversal 与 preorder traversal 吗,它们对二叉树同样适用。不过先别急,既然现在 child 的数量确定了,能不能将对结点的处理放在两个结点的处理之间完成呢?当然没问题!这种处理方式就是 中序遍历 (inorder traversal),当然这也是 DFS 的一种。
如果将当前结点标记为 N,左子结点标记为 L,右子结点标记为 R,那么前序遍历就可以表示为 NLR,中序遍历可以表示为 LNR,后序遍历可以表示为 LRN。
二叉树的前序遍历
recursion
void preorder(BinaryTreeBaseNode* root) {
if (root == nullptr) {
return;
}
process(root);
preorder(root->left);
preorder(root->right);
}
loop
void preorder(BinaryTreeBaseNode* root) {
stack s;
while (!s.empty() || root != nullptr) {
while (root != nullptr) {
process(root);
s.push(root);
root = root->left;
}
root = s.top();
s.pop();
root = root->rightl;
}
}
二叉树的中序遍历
recursion
void inorder(BinaryTreeBaseNode* root) {
if (root == nullptr) {
return;
}
preorder(root->left);
process(root);
preorder(root->right);
}
loop
void preorder(BinaryTreeBaseNode* root) {
stack s;
while (!s.empty() || root != nullptr) {
while (root != nullptr) {
s.push(root);
root = root->left;
}
root = s.top();
s.pop();
process(root);
root = root->rightl;
}
}
二叉树的后序遍历
recursion
void postorder(BinaryTreeBaseNode* root) {
if (root == nullptr) {
return;
}
preorder(root->left);
preorder(root->right);
process(root);
}
loop
在后序遍历中,在左子结点处理完成后,只有结点没有右子结点或右子结点处理完之后,才能对结点进行处理。因此需要判别当前结点的 右子结点为空
或 刚刚处理过的结点
是该结点的右子结点。判断右子结点为空十分简单,但是问题是如何记录刚刚访问过的结点?
利用一个变量指向正在处理的结点,当指向下一个待处理的结点时,其值就是该结点的上一个处理的结点,即处理前驱。
void postorder(BinaryTreeBaseNode* root) {
stack s;
BinaryTreeBaseNode* prev = nullptr;
while (!s.empty() || root != nullptr) {
while (root != nullptr) {
s.push(root);
root = root->left;
}
root = s.top();
s.pop();
if (root->right == nullptr || root->right == prev) {
prev = root;
process(root);
root = nullptr;
} else {
s.push(root);
root = root->right;
}
}
}
一个异构的前序遍历
如果你在对一个单词串进行翻转时,有一个简单可行的方法:先将单词串整体翻转,之后再逐词翻转。这样你就得到了一个对单词串的翻转!
这种异构的翻转也可以用在二叉树的 DFS 遍历上,前序遍历时遍历的结点顺序为 NLR
(Node->Left->Right),而后续遍历的结点顺序为 LRN
,对后续遍历的顺序进行翻转就变为了 NRL
。如果以 NRL 的顺序进行遍历,最后将结果翻转也可以得到一个后序遍历的序列,这本质上是一种前序遍历的异构。
二叉树的层序遍历
DFS 天生与 stack 结合在一起,而 BFS 与 queue 结合在一起。因此对于以上三种 DFS 遍历,使用 recursion 是一种简单、高效的理解与编码,而层序遍历则更适合于 loop。
void levelorder(BinaryTreeBaseNode* root) {
queue q;
q.push(root);
while (!q.empty()) {
for (int i = 0, cur_level_size = q.size(); i < cur_level_size; ++i) {
root = q.front();
q.pop();
process(root);
if (root->left != nullptr) {
q.push(root->left);
}
if (root->right != nullptr) {
q.push(root->right);
}
}
}
}
Morris 遍历
在以上介绍的三种 DFS 遍历中,无论是 recursion 还是 loop 实现,都需要 O(N) 的时间复杂度与 O(N) 的空间复杂度。而 1979 年由 J.H.Morris 在他的 论文 中提出了一种遍历方式,可以利用 O(N) 的时间复杂度与 O(1) 的空间复杂度完成遍历。其核心思想是利用二叉树中的空闲指针,以实现空间复杂度的降低。
以 postorder 为例说明其算法的具体思路:
- 如果当前结点的左子树为空,则遍历右子树
- 如果当前结点的左子树不为空,在当前结点的左子树中找到当前结点在中序遍历中的前驱结点
- 如果前驱的右子结点为空,则将前驱结点的右子结点设置为当前结点,当前结点更新为其左子结点
- 如果前驱的右子结点为当前结点,则将其重新置空。倒序处理从当前结点的左子结点到该前驱结点路径上的所有结点。完成后将当前结点更新为当前结点的右子结点
- 重复步骤 1、2 直到遍历结束
void __reverse_process(BinaryTreeBaseNode* node) {
if (node == nullptr) {
return;
}
__reverse_process(node->right);
process(node);
}
void postorderTraversal(BinaryTreeBaseNode* root) {
BinaryTreeBaseNode* cur = root,* prev = nullptr;
while (cur != nullptr) {
prev = cur->left;
if (prev != nullptr) {
while (prev->right != nullptr && prev->right != cur) {
prev = prev->right;
}
if (prev->right == nullptr) {
prev->right = cur;
cur = cur->left;
continue;
}
prev->right = nullptr;
__reverse_process(cur->left);
}
cur = cur->right;
}
__reverse_precess(root);
}
迭代器
既然可以遍历一棵树,那么依然希望可以在这棵树上暂停下来,对结点进行一些操作,再继续进行迭代。当我们选择的遍历方法不一样时,其迭代时的前驱与后继就不相同。
如果现在给定一个迭代器,应该如何找到迭代器的前驱与后继迭代器。这里给出求解中序遍历前驱的算法步骤与代码,求解中序遍历后继的算法与前驱的算法类似,因此只给出代码。
- 求解前驱
- 如果结点的左子树存在,则前驱是结点左子树上最大的结点
- 如果结点的左子树不存在,则需要寻找结点的 parent
- 若结点是 parent 的右子树上的结点,则 parent 是其前驱
- 若结点是 parent 的左子树上的结点,继续向上寻找,直到 parent 为 nullptr 或是其 parent 的右子树上的结点
// 寻找结点 node 的前驱
BinaryTreeBaseNode* get_previous(BinaryTreeBaseNode* node) {
if (node->left != nullptr) {
node = node->left;
while (node->right != nullptr) {
node = node->right;
}
} else {
auto parent = get_parent(node);
while (parent != nullptr && parent->left == node) {
node = parent;
parent = get_parent(parent);
}
node = parent;
}
return node;
}
// 寻找结点 node 的后继
BinaryTreeBaseNode* get_next(BinaryTreeBaseNode* node) {
if (node->right != nullptr) {
node = node->right;
while (node->left != nullptr) {
node = node->left;
}
} else {
auto parent = get_parent(node);
while (parent != nullptr && parent->right == node) {
node = parent;
parent = get_parent(parent);
}
node = parent;
}
return node;
}
示例:表达式树
下图展示了一棵 表达式树 (expression tree),leaf node 是操作数 (operand),而 internal node 为运算符 (operator)。由于所有操作都是二元的,因此这颗树为二叉树。每个 operator 的 operand 分别是其两个子树的运算结果。
这个树对应的表达式为 a+b∗c+(d∗e+f)∗g ,如果我们对这颗树进行 postorder traversal 将得到序列 abc∗+de∗f+g∗+ ,这是一个后缀表达式;如果对其进行 preorder traversal,则会得到前缀表达式 ++a∗bc∗+∗defg ;最后试一下 inorder traversal,其结果应该是中缀表达式,不过其序列并没有带括号。
从 postorder traversal 的结果,可以很轻松的构建其这棵树。留给读者进行实现,这里将不再说明。