动态规划理论基础
什么是动态规划
- 动态规划,英文:Dynamic Programming,简称DP,如果某一问题有很多重叠子问题,使用动态规划是最有效的。所以动态规划中每一个状态一定是由上一个状态推导出来的,这一点就区分于贪心,贪心没有状态推导,而是从局部直接选最优的.
- 贪心解决不了动态规划的问题。
动态规划的解题步骤
对于动态规划问题,我将拆解为如下五步曲,这五步都搞清楚了,才能说把动态规划真的掌握了!
- 确定dp数组(dp table)以及下标的含义
- 确定递推公式
- dp数组如何初始化
- 确定遍历顺序
- 举例推导dp数组
如何debug
- 找问题的最好方式就是把dp数组打印出来,看看究竟是不是按照自己思路推导的!
- 做动规的题目,写代码之前一定要把状态转移在dp数组的上具体情况模拟一遍,心中有数,确定最后推出的是想要的结果。
509. 斐波那契数
递归
# Time complexity: O(2^N)
# Space complexity: O(N)
class Solution:
def fib(self, n: int) -> int:
if n == 0:
return 0
if n == 1:
return 1
return self.fib(n-1) + self.fib(n-2)
动态规划
-
确定dp数组以及下标的含义
dp[i]的定义为:第i个数的斐波那契数值是dp[i]
-
确定递推公式
状态转移方程
dp[i] = dp[i - 1] + dp[i - 2] -
dp数组如何初始化
dp[0] = 0; dp[1] = 1; -
确定遍历顺序
从递归公式
dp[i] = dp[i - 1] + dp[i - 2];中可以看出,dp[i]是依赖dp[i - 1]和dp[i - 2],那么遍历的顺序一定是从前到后遍历的 -
举例推导dp数组
按照这个递推公式dp[i] = dp[i - 1] + dp[i - 2],我们来推导一下,当N为10的时候,dp数组应该是如下的数列:
0 1 1 2 3 5 8 13 21 34 55
如果代码写出来,发现结果不对,就把dp数组打印出来看看和我们推导的数列是不是一致的。
# Time complexity: O(N)
# Space complexity: O(N)
class Solution:
def fib(self, n: int) -> int:
if n == 0:
return 0
if n == 1:
return 1
dp = [0] * (n + 1)
dp[1] = 1
for i in range(2, n + 1):
dp[i] = dp[i-1] + dp[i-2]
return dp[n]
- 优化,只需要维护两个数值,不需要记录整个序列。
class Solution:
def fib(self, n: int) -> int:
if n <= 1:
return n
dp_0, dp_1, dp_i = 0, 1, 1
for _ in range(1, n):
dp_i = dp_0 + dp_1
dp_0, dp_1 = dp_1, dp_i
return dp_i
memo
# Time complexity: O(N)
# Space complexity: O(N)
class Solution:
cache = {0: 0, 1: 1}
def fib(self, N: int) -> int:
if N in self.cache:
return self.cache[N]
self.cache[N] = self.fib(N - 1) + self.fib(N - 2)
return self.cache[N]
70. 爬楼梯
动态规划
-
确定dp数组以及下标的含义
dp[i]: 爬到第i层楼梯,有dp[i]种方法
-
确定递推公式
从dp[i]的定义可以看出,dp[i] 可以有两个方向推出来。
首先是dp[i - 1],上i-1层楼梯,有dp[i - 1]种方法,那么再一步跳一个台阶不就是dp[i]了么。
还有就是dp[i - 2],上i-2层楼梯,有dp[i - 2]种方法,那么再一步跳两个台阶不就是dp[i]了么。
那么dp[i]就是 dp[i - 1]与dp[i - 2]之和!
所以
dp[i] = dp[i - 1] + dp[i - 2]。 -
dp数组如何初始化
需要注意的是:题目中说了n是一个正整数,题目根本就没说n有为0的情况。
所以本题其实就不应该讨论dp[0]的初始化!
我相信
dp[1] = 1,dp[2] = 2,这个初始化大家应该都没有争议的。所以我的原则是:不考虑dp[0]如果初始化,只初始化dp[1] = 1,dp[2] = 2,然后从i = 3开始递推,这样才符合dp[i]的定义。
-
确定遍历顺序
从递推公式
dp[i] = dp[i - 1] + dp[i - 2];中可以看出,遍历顺序一定是从前向后遍历的 -
举例推导dp数组
如果代码出问题了,就把dp table 打印出来,看看究竟是不是和自己推导的一样。
此时大家应该发现了,这不就是斐波那契数列么!
唯一的区别是,没有讨论dp[0]应该是什么,因为dp[0]在本题没有意义!
# Time complexity: O(N)
# Space complexity: O(N)
class Solution:
def climbStairs(self, n: int) -> int:
if n <= 1:
return n
dp = [0] * (n + 1)
dp[1] = 1
dp[2] = 2
for i in range(3, n+1):
dp[i] = dp[i-1] + dp[i-2]
return dp[n]
746. 使用最小花费爬楼梯
动态规划
-
确定dp数组以及下标的含义
dp[i]的定义:到达第i个台阶所花费的最少体力为dp[i] 。(注意这里认为是第一步一定是要花费)
-
确定递推公式
可以有两个途径得到dp[i],一个是dp[i-1] 一个是dp[i-2] 。
那么究竟是选dp[i-1]还是dp[i-2]呢?
一定是选最小的,所以
dp[i] = min(dp[i - 1], dp[i - 2]) + cost[i];注意这里为什么是加cost[i],而不是cost[i-1],cost[i-2]之类的,因为题目中说了:每当你爬上一个阶梯你都要花费对应的体力值
-
dp数组如何初始化
根据dp数组的定义,dp数组初始化其实是比较难的,因为不可能初始化为第i台阶所花费的最少体力。
那么看一下递归公式,dp[i]由dp[i-1],dp[i-2]推出,既然初始化所有的dp[i]是不可能的,那么只初始化dp[0]和dp[1]就够了,其他的最终都是dp[0]dp[1]推出。
-
确定遍历顺序
本题的遍历顺序其实比较简单,简单到很多同学都忽略了思考这一步直接就把代码写出来了。
因为是模拟台阶,而且dp[i]又dp[i-1]dp[i-2]推出,所以是从前到后遍历cost数组就可以了。
但是稍稍有点难度的动态规划,其遍历顺序并不容易确定下来。
# Time complexity: O(N)
# Space complexity: O(N)
class Solution:
def minCostClimbingStairs(self, cost: List[int]) -> int:
top_floor = len(cost)
dp = [0] * top_floor
dp[0] = cost[0]
dp[1] = cost[1]
for i in range(2, top_floor):
dp[i] = min(dp[i-1], dp[i-2]) + cost[i]
# 注意最后一步可以理解为不用花费,所以取倒数第一步,第二步的最少值
return min(dp[top_floor - 1], dp[top_floor - 2])
# another way to understand the problem
class Solution:
def minCostClimbingStairs(self, cost: List[int]) -> int:
# The array's length should be 1 longer than the length of cost
# This is because we can treat the "top floor" as a step to reach
minimum_cost = [0] * (len(cost) + 1)
# Start iteration from step 2, since the minimum cost of reaching
# step 0 and step 1 is 0
for i in range(2, len(cost) + 1):
take_one_step = minimum_cost[i - 1] + cost[i - 1]
take_two_steps = minimum_cost[i - 2] + cost[i - 2]
minimum_cost[i] = min(take_one_step, take_two_steps)
# The final element in minimum_cost refers to the top floor
return minimum_cost[-1]