本文参考labuladong算法笔记[二叉树心法(后序篇 | labuladong 的算法笔记]
前序位置的代码只能从函数参数中获取父节点传递来的数据,而后序位置的代码不仅可以获取参数数据,还可以获取到子树通过函数返回值传递回来的数据。
那么换句话说,一旦你发现题目和子树有关,那大概率要给函数设置合理的定义和返回值,在后序位置写代码了。
652. 寻找重复的子树 | 力扣 | LeetCode |
给你一棵二叉树的根节点 root
,返回所有 重复的子树 。
对于同一类的重复子树,你只需要返回其中任意 一棵 的根结点即可。
如果两棵树具有 相同的结构 和 相同的结点值 ,则认为二者是 重复 的。
示例 1:
输入:root = [1,2,3,4,null,2,4,null,null,4] 输出:[[2,4],[4]]
示例 2:
输入:root = [2,1,1] 输出:[[1]]
示例 3:
输入:root = [2,2,2,3,null,3,null] 输出:[[2,3],[3]]
提示:
- 树中的结点数在
[1, 5000]
范围内。 -200 <= Node.val <= 200
// 函数签名如下
List<TreeNode> findDuplicateSubtrees(TreeNode root);
我来简单解释下题目,输入是一棵二叉树的根节点 root
,返回的是一个列表,里面装着若干个二叉树节点,这些节点对应的子树在原二叉树中是存在重复的。
说起来比较绕,举例来说,比如输入如下的二叉树:
首先,节点 4 本身可以作为一棵子树,且二叉树中有多个节点 4:
类似的,还存在两棵以 2 为根的重复子树:
那么,我们返回的 List
中就应该有两个 TreeNode
,值分别为 4 和 2(具体是哪个节点都无所谓)。
【思路】
这题咋做呢?还是老套路,先思考,对于某一个节点,它应该做什么。
比如说,你站在图中这个节点 2 上:
如果你想知道以自己为根的子树是不是重复的,是否应该被加入结果列表中,你需要知道什么信息?
你需要知道以下两点:
1、以我为根的这棵二叉树(子树)长啥样?
2、以其他节点为根的子树都长啥样?
这就叫知己知彼嘛,我得知道自己长啥样,还得知道别人长啥样,然后才能知道有没有人跟我重复,对不对?好,那我们一个一个来看。
首先来思考,我如何才能知道以自己为根的这棵二叉树长啥样?
其实想到这里,就可以判断本题需要在二叉树的后序位置写代码了。
为什么?很简单呀,我要知道以自己为根的子树长啥样,是不是得先知道我的左右子树长啥样,再加上自己,就构成了整棵子树的样子?左右子树的样子,可不就得在后序位置通过递归函数的返回值传递回来吗?
如果你还绕不过来,我再来举个非常简单的例子:计算一棵二叉树有多少个节点。这个代码应该会写吧:
def count(root):
if root == None:
return 0
# 先算出左右子树有多少节点
left = count(root.left)
right = count(root.right)
# 后序位置,子树加上自己,就是整棵二叉树的节点数
res = left + right + 1
return res
这不就是标准的后序遍历框架嘛,和我们本题在本质上没啥区别对吧。
现在,明确了要用后序遍历,那应该怎么描述一棵二叉树的模样呢?我们后文 序列化和反序列化二叉树 其实写过了,二叉树的前序/中序/后序/层序遍历结果可以描述二叉树的结构。
那么,我就以后序遍历结果作为序列化结果吧,可以通过拼接字符串的方式把二叉树序列化,看下代码:
# 定义:输入以 root 为根的二叉树,返回这棵树的序列化字符串
def serialize(root):
# 对于空节点,可以用一个特殊字符表示
if root is None:
return "#"
# 将左右子树序列化成字符串
left = serialize(root.left)
right = serialize(root.right)
# 后序遍历代码位置
# 左右子树加上自己,就是以自己为根的二叉树序列化结果
myself = f"{left},{right},{root.val}"
return myself
我们用非数字的特殊符 #
表示空指针,并且用字符 ,
分隔每个二叉树节点值,这属于序列化二叉树的套路了,不多说。
注意我们 myself
是按照左子树、右子树、根节点这样的顺序拼接字符串,也就是后序遍历顺序。因为我们这里的目的是通过序列化唯一描述一棵二叉树的结构,所以你也可以用前序顺序来拼接字符串,但是注意不能用中序顺序,具体原因参见后文 序列化和反序列化二叉树 的总结。
这样,我们第一个问题就解决了,对于每个节点,递归函数中的 myself
变量就可以描述以该节点为根的二叉树。
现在我们解决第二个问题,我知道了自己长啥样,怎么知道别人长啥样?这样我才能知道有没有其他子树跟我重复对吧。
这很简单呀,我们借助一个外部数据结构,让每个节点把自己子树的序列化结果存进去,这样,对于每个节点,不就可以知道有没有其他节点的子树和自己重复了么?
初步思路可以使用 HashSet
记录所有子树的序列化结果,代码如下:
class Solution:
# 记录所有子树
subTrees = set()
# 记录重复的子树根节点
res = []
def serialize(self, root):
if root == None:
return "#"
# 左右子树的序列化结果
left = self.serialize(root.left)
right = self.serialize(root.right)
# 后序位置,计算以自己为根的二叉树序列化结果
myself = left + "," + right + "," + str(root.val)
if myself in self.subTrees:
# 有人和我重复,把自己加入结果列表
self.res.append(root)
else:
# 暂时没人跟我重复,把自己加入子树集合
self.subTrees.add(myself)
return myself
但是呢,这有个问题,如果出现多棵重复的子树,结果集 res
中必然出现重复,而题目要求不希望出现重复。
为了解决这个问题,可以把 HashSet
升级成 HashMap
,额外记录每棵子树的出现次数:
【python】
class Solution:
def __init__(self):
# 记录所有子树以及出现的次数
self.memo = {}
# 记录重复的子树根节点
self.res = []
# 主函数
def findDuplicateSubtrees(self, root: TreeNode) -> List[TreeNode]:
self.serialize(root)
return self.res
def serialize(self, root):
if root is None:
return "#"
left = self.serialize(root.left)
right = self.serialize(root.right)
subTree = left + "," + right + "," + str(root.val)
freq = self.memo.get(subTree, 0)
# 多次重复也只会被加入结果集一次
if freq == 1:
self.res.append(root)
# 给子树对应的出现次数加一
self.memo[subTree] = freq + 1
return subTree
总结
1、需要比较每一颗子树,要如何遍历?——后序遍历。
2、如何比较每一颗子树的结构和值?——序列化的方式。
3、遇到多个重复子树怎么办?——用字典来存放每个子树出现的次数。
4、重视函数签名——参数是什么?返回值又是什么?