动态规划理论基础
什么是动态规划
动态规划 (Dynamic Programming, DP),是求解决策过程最优化的过程。
如果某一问题有很多重叠子问题,使用动态规划是最有效的。
所以动态规划中每一个状态一定是由上一个状态推导出来的,这一点就区分于贪心,贪心没有状态推导,而是从局部直接选最优。
动态规划的解题步骤
对于动态规划问题,我将拆解为如下五步曲,
- 确定dp数组(dp table)以及下标的含义
- 确定递推公式
- dp数组如何初始化
- 确定遍历顺序
- 举例推导dp数组
动态规划应该如何debug
做动规的题目,写代码之前一定要把状态转移在dp数组的上具体情况模拟一遍,心中有数,确定最后推出的是想要的结果。
然后再写代码,如果代码没通过就打印dp数组,看看是不是和自己预先推导的哪里不一样。
如果打印出来和自己预先模拟推导是一样的,那么就是自己的递归公式、初始化或者遍历顺序有问题了。
如果和自己预先模拟推导的不一样,那么就是代码实现细节有问题。
这样才是一个完整的思考过程,而不是一旦代码出问题,就毫无头绪的东改改西改改,最后过不了,或者说是稀里糊涂的过了。
代码出错时的灵魂三问:
- 这道题目我举例推导状态转移公式了么?
- 我打印dp数组的日志了么?
- 打印出来了dp数组和我想的一样么?
509. 斐波那契数
题目链接:
力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台
求解思路:
动规五部曲
- 确定dp数组及其下标的含义:dp[i] 为第 i 个数的斐波那契数值
- 确定递推公式:状态转移方程 dp[i] = dp[i - 1] + dp[i - 2];
- dp数组如何初始化:dp[0] = 0; dp[1] = 1;
- 确定遍历顺序:dp[i]是依赖 dp[i - 1] 和 dp[i - 2],遍历的顺序一定是从前到后遍历的
- 举例推导dp数组:当N为10的时候,dp数组应该是如下的数列:0 1 1 2 3 5 8 13 21 34 55
代码:
class Solution {
public:
int fib(int n) {
if (n <= 1) return n;
vector<int> dp(n+1);
dp[0] = 0;
dp[1] = 1;
for (int i = 2; i <= n; i++){
dp[i] = dp[i-1] + dp[i-2];
}
return dp[n];
}
};
70. 爬楼梯
题目链接:
力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台
求解思路:
动规五部曲
- 确定dp数组及其下标的含义:爬到第i层楼梯,有 dp[i] 种方法
- 确定递推公式:上到第i层时,只可能从第 i-1 层或是 i-2 层上来;因此dp[i] = dp[i-1] + dp[i-2]
- dp数组的初始化:初始化dp[1] = 1,dp[2] = 2,然后从i = 3开始递推,这样符合dp[i]的定义
- 确定遍历顺序:从前向后
- 举例推导dp数组:举例当n为5的时候
代码:
class Solution {
public:
int climbStairs(int n) {
if (n <= 1) return n;
int dp[n+1];
dp[1] = 1;
dp[2] = 2;
for (int i = 3; i <= n; i++)
{
dp[i] = dp[i-1] + dp[i-2];
}
return dp[n];
}
};
746. 使用最小花费爬楼梯
题目链接:
力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台
求解思路:
动规五部曲
- 确定dp数组及其下标含义:到达第 i 层台阶需要花费的最少体力为 dp[i]
- 确定递推公式:dp[i - 1] 跳到 dp[i] 需要花费 dp[i - 1] + cost[i - 1];dp[i - 2] 跳到 dp[i] 需要花费 dp[i - 2] + cost[i - 2],取其中的较小值
- dp数组的初始化:可以从第0层或第1层起跳,因此 dp[0] = 0,dp[1] = 0
- 确定遍历顺序:从前到后
- 举例推导dp数组:cost = [1, 100, 1, 1, 1, 100, 1, 1, 100, 1],模拟一下dp
代码:
class Solution {
public:
int minCostClimbingStairs(vector<int>& cost) {
vector<int> dp(cost.size() + 1);
dp[0] = 0;
dp[1] = 0;
for (int i = 2; i <= cost.size(); i++){
// dp[i - 1] 跳到 dp[i] 需要花费 dp[i - 1] + cost[i - 1]
// dp[i - 2] 跳到 dp[i] 需要花费 dp[i - 2] + cost[i - 2]
dp[i] = min(dp[i-1]+cost[i-1], dp[i-2]+cost[i-2]);
}
return dp[cost.size()];
}
};