【算法思想·二叉树】后续篇

news2026/2/15 11:19:32

本文参考labuladong算法笔记[二叉树心法（后序篇 | labuladong 的算法笔记]

前序位置的代码只能从函数参数中获取父节点传递来的数据，而后序位置的代码不仅可以获取参数数据，还可以获取到子树通过函数返回值传递回来的数据。

那么换句话说，一旦你发现题目和子树有关，那大概率要给函数设置合理的定义和返回值，在后序位置写代码了。

652. 寻找重复的子树 | 力扣 | LeetCode |

给你一棵二叉树的根节点 root ，返回所有 重复的子树 。

对于同一类的重复子树，你只需要返回其中任意一棵的根结点即可。

如果两棵树具有 相同的结构 和 相同的结点值 ，则认为二者是重复的。

示例 1：

输入：root = [1,2,3,4,null,2,4,null,null,4]
输出：[[2,4],[4]]

示例 2：

输入：root = [2,1,1]
输出：[[1]]

示例 3：

输入：root = [2,2,2,3,null,3,null]
输出：[[2,3],[3]]

提示：

树中的结点数在 [1, 5000] 范围内。
-200 <= Node.val <= 200

// 函数签名如下
List<TreeNode> findDuplicateSubtrees(TreeNode root);

我来简单解释下题目，输入是一棵二叉树的根节点 root，返回的是一个列表，里面装着若干个二叉树节点，这些节点对应的子树在原二叉树中是存在重复的。

说起来比较绕，举例来说，比如输入如下的二叉树：

首先，节点 4 本身可以作为一棵子树，且二叉树中有多个节点 4：

类似的，还存在两棵以 2 为根的重复子树：

那么，我们返回的 List 中就应该有两个 TreeNode，值分别为 4 和 2（具体是哪个节点都无所谓）。

【思路】

这题咋做呢？还是老套路，先思考，对于某一个节点，它应该做什么。

比如说，你站在图中这个节点 2 上：

如果你想知道以自己为根的子树是不是重复的，是否应该被加入结果列表中，你需要知道什么信息？

你需要知道以下两点：

1、以我为根的这棵二叉树（子树）长啥样？

2、以其他节点为根的子树都长啥样？

这就叫知己知彼嘛，我得知道自己长啥样，还得知道别人长啥样，然后才能知道有没有人跟我重复，对不对？好，那我们一个一个来看。

首先来思考，我如何才能知道以自己为根的这棵二叉树长啥样？

其实想到这里，就可以判断本题需要在二叉树的后序位置写代码了。

为什么？很简单呀，我要知道以自己为根的子树长啥样，是不是得先知道我的左右子树长啥样，再加上自己，就构成了整棵子树的样子？左右子树的样子，可不就得在后序位置通过递归函数的返回值传递回来吗？

如果你还绕不过来，我再来举个非常简单的例子：计算一棵二叉树有多少个节点。这个代码应该会写吧：

def count(root):
    if root == None:
        return 0
    # 先算出左右子树有多少节点
    left = count(root.left)
    right = count(root.right)
    # 后序位置，子树加上自己，就是整棵二叉树的节点数
    res = left + right + 1
    return res

这不就是标准的后序遍历框架嘛，和我们本题在本质上没啥区别对吧。

现在，明确了要用后序遍历，那应该怎么描述一棵二叉树的模样呢？我们后文序列化和反序列化二叉树其实写过了，二叉树的前序/中序/后序/层序遍历结果可以描述二叉树的结构。

那么，我就以后序遍历结果作为序列化结果吧，可以通过拼接字符串的方式把二叉树序列化，看下代码：

# 定义：输入以 root 为根的二叉树，返回这棵树的序列化字符串
def serialize(root):
    # 对于空节点，可以用一个特殊字符表示
    if root is None:
        return "#"
    # 将左右子树序列化成字符串
    left = serialize(root.left)
    right = serialize(root.right)
    # 后序遍历代码位置
    # 左右子树加上自己，就是以自己为根的二叉树序列化结果
    myself = f"{left},{right},{root.val}"
    return myself

我们用非数字的特殊符 # 表示空指针，并且用字符 , 分隔每个二叉树节点值，这属于序列化二叉树的套路了，不多说。

注意我们 myself 是按照左子树、右子树、根节点这样的顺序拼接字符串，也就是后序遍历顺序。因为我们这里的目的是通过序列化唯一描述一棵二叉树的结构，所以你也可以用前序顺序来拼接字符串，但是注意不能用中序顺序，具体原因参见后文序列化和反序列化二叉树的总结。

这样，我们第一个问题就解决了，对于每个节点，递归函数中的 myself 变量就可以描述以该节点为根的二叉树。

现在我们解决第二个问题，我知道了自己长啥样，怎么知道别人长啥样？这样我才能知道有没有其他子树跟我重复对吧。

这很简单呀，我们借助一个外部数据结构，让每个节点把自己子树的序列化结果存进去，这样，对于每个节点，不就可以知道有没有其他节点的子树和自己重复了么？

初步思路可以使用 HashSet 记录所有子树的序列化结果，代码如下：

class Solution:
    # 记录所有子树
    subTrees = set()
    # 记录重复的子树根节点
    res = []

    def serialize(self, root):
        if root == None:
            return "#"

        # 左右子树的序列化结果
        left = self.serialize(root.left)
        right = self.serialize(root.right)

        # 后序位置，计算以自己为根的二叉树序列化结果
        myself = left + "," + right + "," + str(root.val)
        if myself in self.subTrees:
            # 有人和我重复，把自己加入结果列表
            self.res.append(root)
        else:
            # 暂时没人跟我重复，把自己加入子树集合
            self.subTrees.add(myself)
        return myself

但是呢，这有个问题，如果出现多棵重复的子树，结果集 res 中必然出现重复，而题目要求不希望出现重复。

为了解决这个问题，可以把 HashSet 升级成 HashMap，额外记录每棵子树的出现次数：

【python】

class Solution:
    def __init__(self):
        # 记录所有子树以及出现的次数
        self.memo = {}
        # 记录重复的子树根节点
        self.res = []

    # 主函数
    def findDuplicateSubtrees(self, root: TreeNode) -> List[TreeNode]:
        self.serialize(root)
        return self.res

    def serialize(self, root):
        if root is None:
            return "#"

        left = self.serialize(root.left)
        right = self.serialize(root.right)

        subTree = left + "," + right + "," + str(root.val)

        freq = self.memo.get(subTree, 0)
        # 多次重复也只会被加入结果集一次
        if freq == 1:
            self.res.append(root)
        # 给子树对应的出现次数加一
        self.memo[subTree] = freq + 1
        return subTree