树形动态规划:简称为「树形 DP」,是一种在树形结构上进行推导的动态规划方法。如下图所示,树形 DP 的求解过程一般以节点从深到浅(子树从小到大)的顺序作为动态规划的「阶段」。在树形 DP 中,第
$1$ 维通常是节点编号,代表以该节点为根的子树。
树形 DP 问题的划分方法有多种方式。
如果按照「阶段转移的方向」进行划分,可以划分为以下两种:
- 自底向上:通过递归的方式求解每棵子树,然后在回溯时,自底向上地从子节点向上进行状态转移。只有在当前节点的所有子树求解完毕之后,才可以求解当前节点,以及继续向上进行求解。
- 自顶向下:从根节点开始向下递归,逐层计算子节点的状态。这种方法常常使用记忆化搜索来避免重复计算,提高效率。
自顶向下的树形 DP 问题比较少见,大部分树形 DP 都是采用「自底向上」的方向进行推导。
如果按照「是否有固定根」进行划分,可以划分为以下两种:
-
固定根的树形 DP:事先指定根节点的树形 DP 问题,通常只需要从给定的根节点开始,使用
$1$ 次深度优先搜索。 -
不定根的树形 DP:事先没有指定根节点的树形 DP 问题,并且根节点的变化会对一些值,例如子节点深度和、点权和等产生影响。通常需要使用
$2$ 次深度优先搜索,第$1$ 次预处理诸如深度,点权和之类的信息,第$2$ 次开始运行换根动态规划。
本文中,我们将按照「是否有固定根」进行分类,对树形 DP 问题中这两种类型问题进行一一讲解。
固定根的树形 DP 问题,如果是二叉树,树通常是以根节点的形式给出。我们可以直接从指定根节点出发进行深度优先搜索。如果是多叉树,树是以一张
下面以这两道题为例,介绍一下树形 DP 的一般解题思路。
描述:给定一个二叉树的根节点
要求:返回其最大路径和。
说明:
- 路径:被定义为一条节点序列,序列中每对相邻节点之间都存在一条边。同一个节点在一条路径序列中至多出现一次。该路径至少包含一个节点,且不一定经过根节点。
- 路径和:路径中各节点值的总和。
- 树中节点数目范围是
$[1, 3 * 10^4]$ 。 -
$-1000 \le Node.val \le 1000$ 。
示例:
- 示例 1:
输入:root = [1,2,3]
输出:6
解释:最优路径是 2 -> 1 -> 3 ,路径和为 2 + 1 + 3 = 6
- 示例 2:
输入:root = [-10,9,20,null,null,15,7]
输出:42
解释:最优路径是 15 -> 20 -> 7 ,路径和为 15 + 20 + 7 = 42
根据最大路径和中对应路径是否穿过根节点,我们可以将二叉树分为两种:
- 最大路径和中对应路径穿过根节点。
- 最大路径和中对应路径不穿过根节点。
如果最大路径和中对应路径穿过根节点,则:该二叉树的最大路径和 = 左子树中最大贡献值 + 右子树中最大贡献值 + 当前节点值。
而如果最大路径和中对应路径不穿过根节点,则:该二叉树的最大路径和 = 所有子树中最大路径和。
即:该二叉树的最大路径和 = max(左子树中最大贡献值 + 右子树中最大贡献值 + 当前节点值,所有子树中最大路径和)。
对此我们可以使用深度优先搜索递归遍历二叉树,并在递归遍历的同时,维护一个最大路径和变量
然后定义函数 def dfs(self, node):
计算二叉树中以该节点为根节点,并且经过该节点的最大贡献值。
计算的结果可能的情况有
- 经过空节点的最大贡献值等于
$0$ 。 - 经过非空节点的最大贡献值等于 当前节点值 + 左右子节点提供的最大贡献值中较大的一个。如果该贡献值为负数,可以考虑舍弃,即最大贡献值为
$0$ 。
在递归时,我们先计算左右子节点的最大贡献值,再更新维护当前最大路径和变量。最终
- 如果根节点
$root$ 为空,则返回$0$ 。 - 递归计算左子树的最大贡献值为
$left\underline{\hspace{0.5em}}max$ 。 - 递归计算右子树的最大贡献值为
$right\underline{\hspace{0.5em}}max$ 。 - 更新维护最大路径和变量,即
$self.ans = max \lbrace self.ans, \quad left\underline{\hspace{0.5em}}max + right\underline{\hspace{0.5em}}max + node.val \rbrace$ 。 - 返回以当前节点为根节点,并且经过该节点的最大贡献值。即返回 当前节点值 + 左右子节点提供的最大贡献值中较大的一个。
- 最终
$self.ans$ 即为答案。
# Definition for a binary tree node.
# class TreeNode:
# def __init__(self, val=0, left=None, right=None):
# self.val = val
# self.left = left
# self.right = right
class Solution:
def __init__(self):
self.ans = float('-inf')
def dfs(self, node):
if not node:
return 0
left_max = max(self.dfs(node.left), 0) # 左子树提供的最大贡献值
right_max = max(self.dfs(node.right), 0) # 右子树提供的最大贡献值
cur_max = left_max + right_max + node.val # 包含当前节点和左右子树的最大路径和
self.ans = max(self.ans, cur_max) # 更新所有路径中的最大路径和
return max(left_max, right_max) + node.val # 返回包含当前节点的子树的最大贡献值
def maxPathSum(self, root: Optional[TreeNode]) -> int:
self.dfs(root)
return self.ans
-
时间复杂度:$O(n)$,其中
$n$ 是二叉树的节点数目。 -
空间复杂度:$O(n)$。递归函数需要用到栈空间,栈空间取决于递归深度,最坏情况下递归深度为
$n$ ,所以空间复杂度为$O(n)$ 。
描述:给定一个长度为
要求:找出路径上任意一对相邻节点都没有分配到相同字符的最长路径,并返回该路径的长度。
说明:
-
$n == parent.length == s.length$ 。 -
$1 \le n \le 10^5$ 。 - 对所有
$i \ge 1$ ,$0 \le parent[i] \le n - 1$ 均成立。 -
$parent[0] == -1$ 。 -
$parent$ 表示一棵有效的树。 -
$s$ 仅由小写英文字母组成。
示例:
- 示例 1:
输入:parent = [-1,0,0,1,1,2], s = "abacbe"
输出:3
解释:任意一对相邻节点字符都不同的最长路径是:0 -> 1 -> 3 。该路径的长度是 3 ,所以返回 3。
可以证明不存在满足上述条件且比 3 更长的路径。
- 示例 2:
输入:parent = [-1,0,0,0], s = "aabc"
输出:3
解释:任意一对相邻节点字符都不同的最长路径是:2 -> 0 -> 3 。该路径的长度为 3 ,所以返回 3。
因为题目给定的是表示父子节点的
如果不考虑相邻节点是否为相同字符这一条件,那么这道题就是在求树的直径(树的最长路径长度)中的节点个数。
对于根节点为
- 如果其最长路径经过根节点
$u$ ,则:最长路径长度 = 某子树中的最长路径长度 + 另一子树中的最长路径长度 + 1。 - 如果其最长路径不经过根节点
$u$ ,则:最长路径长度 = 某个子树中的最长路径长度。
即:最长路径长度 = max(某子树中的最长路径长度 + 另一子树中的最长路径长度 + 1,某个子树中的最长路径长度)。
对此,我们可以使用深度优先搜索递归遍历
- 先计算出从相邻节点
$v$ 出发的最长路径长度$v\underline{\hspace{0.5em}}len$ 。 - 更新维护全局最长路径长度为
$self.ans = max(self.ans, \quad u\underline{\hspace{0.5em}}len + v\underline{\hspace{0.5em}}len + 1)$ 。 - 更新维护当前节点
$u$ 的最长路径长度为$u\underline{\hspace{0.5em}}len = max(u\underline{\hspace{0.5em}}len, \quad v\underline{\hspace{0.5em}}len + 1)$ 。
因为题目限定了「相邻节点字符不同」,所以在更新全局最长路径长度和当前节点
最后,因为题目要求的是树的直径(树的最长路径长度)中的节点个数,而:路径的节点 = 路径长度 + 1,所以最后我们返回
class Solution:
def longestPath(self, parent: List[int], s: str) -> int:
size = len(parent)
# 根据 parent 数组,建立有向图
graph = [[] for _ in range(size)]
for i in range(1, size):
graph[parent[i]].append(i)
ans = 0
def dfs(u):
nonlocal ans
u_len = 0 # u 节点的最大路径长度
for v in graph[u]: # 遍历 u 节点的相邻节点
v_len = dfs(v) # 相邻节点的最大路径长度
if s[u] != s[v]: # 相邻节点字符不同
ans = max(ans, u_len + v_len + 1) # 维护最大路径长度
u_len = max(u_len, v_len + 1) # 更新 u 节点的最大路径长度
return u_len # 返回 u 节点的最大路径长度
dfs(0)
return ans + 1
-
时间复杂度:$O(n)$,其中
$n$ 是树的节点数目。 - 空间复杂度:$O(n)$。
不定根的树形 DP 问题,如果是二叉树,树通常是以一张
这种情况下,我们一般通过「两次扫描与换根法」的方法求解这类题目:
- 第一次扫描时,任选一个节点为根,在「有固定根的树」上执行一次树形 DP,预处理树的一些相关信息。
- 第二次扫描时,从刚才的根节点出发,对整棵树再执行一次深度优先搜索,同时携带根节点的一些信息提供给子节点进行推导,计算出「换根」之后的解。
描述:有一棵包含
可以选择树中的任何一个节点作为根,当选择节点
要求:找到所有的最小高度树并按照任意顺序返回他们的根节点编号列表。
说明:
- 树的高度:指根节点和叶子节点之间最长向下路径上边的数量。
-
$1 \le n \le 2 \times 10^4$ 。 -
$edges.length == n - 1$ 。 -
$0 \le ai, bi < n$ 。 -
$ai \ne bi$ 。 - 所有
$(ai, bi)$ 互不相同。 - 给定的输入保证是一棵树,并且不会有重复的边。
示例:
- 示例 1:
输入:n = 4, edges = [[1,0],[1,2],[1,3]]
输出:[1]
解释:如图所示,当根是标签为 1 的节点时,树的高度是 1 ,这是唯一的最小高度树。
- 示例 2:
输入:n = 6, edges = [[3,0],[3,1],[3,2],[3,4],[5,4]]
输出:[3,4]
最容易想到的做法是:枚举
在上面的算法中,在一轮深度优先搜索中,除了可以得到整棵树的高度之外,在搜索过程中,其实还能得到以每个子节点为根节点的树的高度。如果我们能够利用这些子树的高度信息,快速得到以其他节点为根节点的树的高度,那么我们就能改进算法,以更小的时间复杂度解决这道题。这就是二次遍历与换根法的思想。
- 第一次遍历:自底向上的计算出每个节点
$u$ 向下走(即由父节点$u$ 向子节点$v$ 走)的最长路径$down1[u]$ 、次长路径$down2[i]$ ,并记录向下走最长路径所经过的子节点$p[u]$ ,方便第二次遍历时计算。 - 第二次遍历:自顶向下的计算出每个节点
$v$ 向上走(即由子节点$v$ 向父节点$u$ 走)的最长路径$up[v]$ 。需要注意判断$u$ 向下走的最长路径是否经过了节点$v$ 。- 如果经过了节点
$v$ ,则向上走的最长路径,取决于「父节点$u$ 向上走的最长路径」与「父节点$u$ 向下走的次长路径」 的较大值,再加上$1$ 。 - 如果没有经过节点
$v$ ,则向上走的最长路径,取决于「父节点$u$ 向上走的最长路径」与「父节点$u$ 向下走的最长路径」 的较大值,再加上$1$ 。
- 如果经过了节点
- 接下来,我们通过枚举
$n$ 个节点向上走的最长路径与向下走的最长路径,从而找出所有树中的最小高度,并将所有最小高度树的根节点放入答案数组中并返回。
整个算法具体步骤如下:
- 使用邻接表的形式存储树。
- 定义第一个递归函数
dfs(u, fa)
用于计算每个节点向下走的最长路径$down1[u]$ 、次长路径$down2[u]$ ,并记录向下走的最长路径所经过的子节点$p[u]$ 。- 对当前节点的相邻节点进行遍历。
- 如果相邻节点是父节点,则跳过。
- 递归调用
dfs(v, u)
函数计算邻居节点的信息。 - 根据邻居节点的信息计算当前节点的高度,并更新当前节点向下走的最长路径
$down1[u]$ 、当前节点向下走的次长路径$down2$ 、取得最长路径的子节点$p[u]$ 。
- 定义第二个递归函数
reroot(u, fa)
用于计算每个节点作为新的根节点时向上走的最长路径$up[v]$ 。- 对当前节点的相邻节点进行遍历。
- 如果相邻节点是父节点,则跳过。
- 根据当前节点
$u$ 的高度和相邻节点$v$ 的信息更新$up[v]$ 。同时需要判断节点$u$ 向下走的最长路径是否经过了节点$v$ 。- 如果经过了节点
$v$ ,则向上走的最长路径,取决于「父节点$u$ 向上走的最长路径」与「父节点$u$ 向下走的次长路径」 的较大值,再加上$1$ ,即:$up[v] = max(up[u], down2[u]) + 1$。 - 如果没有经过节点
$v$ ,则向上走的最长路径,取决于「父节点$u$ 向上走的最长路径」与「父节点$u$ 向下走的最长路径」 的较大值,再加上$1$ ,即:$up[v] = max(up[u], down1[u]) + 1$。
- 如果经过了节点
- 递归调用
reroot(v, u)
函数计算邻居节点的信息。
- 调用
dfs(0, -1)
函数计算每个节点的最长路径。 - 调用
reroot(0, -1)
函数计算每个节点作为新的根节点时的最长路径。 - 找到所有树中的最小高度。
- 将所有最小高度的节点放入答案数组中并返回。
class Solution:
def findMinHeightTrees(self, n: int, edges: List[List[int]]) -> List[int]:
graph = [[] for _ in range(n)]
for u, v in edges:
graph[u].append(v)
graph[v].append(u)
# down1 用于记录向下走的最长路径
down1 = [0 for _ in range(n)]
# down2 用于记录向下走的最长路径
down2 = [0 for _ in range(n)]
p = [0 for _ in range(n)]
# 自底向上记录最长路径、次长路径
def dfs(u, fa):
for v in graph[u]:
if v == fa:
continue
# 自底向上统计信息
dfs(v, u)
height = down1[v] + 1
if height >= down1[u]:
down2[u] = down1[u]
down1[u] = height
p[u] = v
elif height > down2[u]:
down2[u] = height
# 进行换根动态规划,自顶向下统计向上走的最长路径
up = [0 for _ in range(n)]
def reroot(u, fa):
for v in graph[u]:
if v == fa:
continue
if p[u] == v:
up[v] = max(up[u], down2[u]) + 1
else:
up[v] = max(up[u], down1[u]) + 1
# 自顶向下统计信息
reroot(v, u)
dfs(0, -1)
reroot(0, -1)
# 找到所有树中的最小高度
min_h = 1e9
for i in range(n):
min_h = min(min_h, max(down1[i], up[i]))
# 将所有最小高度的节点放入答案数组中并返回
res = []
for i in range(n):
if max(down1[i], up[i]) == min_h:
res.append(i)
return res
- 时间复杂度:$O(n)$。
- 空间复杂度:$O(n)$。