代码随想录算法训练营第三十八天 | 动态规划理论基础、509. 斐波那契数、70. 爬楼梯、746. 使用最小花费爬楼梯

143 阅读6分钟

动态规划理论基础

代码随想录视频讲解

代码随想录文章讲解

什么是动态规划

  • 动态规划,英文:Dynamic Programming,简称DP,如果某一问题有很多重叠子问题,使用动态规划是最有效的。所以动态规划中每一个状态一定是由上一个状态推导出来的,这一点就区分于贪心,贪心没有状态推导,而是从局部直接选最优的.
  • 贪心解决不了动态规划的问题。

动态规划的解题步骤

对于动态规划问题,我将拆解为如下五步曲,这五步都搞清楚了,才能说把动态规划真的掌握了!

  1. 确定dp数组(dp table)以及下标的含义
  2. 确定递推公式
  3. dp数组如何初始化
  4. 确定遍历顺序
  5. 举例推导dp数组

如何debug

  • 找问题的最好方式就是把dp数组打印出来,看看究竟是不是按照自己思路推导的!
  • 做动规的题目,写代码之前一定要把状态转移在dp数组的上具体情况模拟一遍,心中有数,确定最后推出的是想要的结果

509. 斐波那契数

代码随想录视频讲解

代码随想录文章讲解

递归

# Time complexity: O(2^N)
# Space complexity: O(N)
class Solution:
    def fib(self, n: int) -> int:
        if n == 0:
            return 0
        if n == 1:
            return 1
        
        return self.fib(n-1) + self.fib(n-2)

动态规划

  1. 确定dp数组以及下标的含义

    dp[i]的定义为:第i个数的斐波那契数值是dp[i]

  2. 确定递推公式

    状态转移方程 dp[i] = dp[i - 1] + dp[i - 2]

  3. dp数组如何初始化

    dp[0] = 0; dp[1] = 1;

  4. 确定遍历顺序

    从递归公式dp[i] = dp[i - 1] + dp[i - 2];中可以看出,dp[i]是依赖 dp[i - 1]dp[i - 2],那么遍历的顺序一定是从前到后遍历的

  5. 举例推导dp数组

    按照这个递推公式dp[i] = dp[i - 1] + dp[i - 2],我们来推导一下,当N为10的时候,dp数组应该是如下的数列:

    0 1 1 2 3 5 8 13 21 34 55

    如果代码写出来,发现结果不对,就把dp数组打印出来看看和我们推导的数列是不是一致的。

# Time complexity: O(N)
# Space complexity: O(N)
class Solution:
    def fib(self, n: int) -> int:
        if n == 0:
            return 0
        if n == 1:
            return 1
        
        dp = [0] * (n + 1)
        dp[1] = 1
        
        for i in range(2, n + 1):
            dp[i] = dp[i-1] + dp[i-2]
        
        return dp[n]
  • 优化,只需要维护两个数值,不需要记录整个序列。
class Solution:
    def fib(self, n: int) -> int:
        if n <= 1:
            return n
        
        dp_0, dp_1, dp_i = 0, 1, 1
        for _ in range(1, n):
            dp_i = dp_0 + dp_1
            dp_0, dp_1 = dp_1, dp_i
        
        return dp_i

memo

# Time complexity: O(N)
# Space complexity: O(N)
class Solution:
    cache = {0: 0, 1: 1}
​
    def fib(self, N: int) -> int:
        if N in self.cache:
            return self.cache[N]
        self.cache[N] = self.fib(N - 1) + self.fib(N - 2)
        return self.cache[N]

70. 爬楼梯

代码随想录视频讲解

代码随想录文章讲解

动态规划

  1. 确定dp数组以及下标的含义

    dp[i]: 爬到第i层楼梯,有dp[i]种方法

  2. 确定递推公式

    从dp[i]的定义可以看出,dp[i] 可以有两个方向推出来。

    首先是dp[i - 1],上i-1层楼梯,有dp[i - 1]种方法,那么再一步跳一个台阶不就是dp[i]了么。

    还有就是dp[i - 2],上i-2层楼梯,有dp[i - 2]种方法,那么再一步跳两个台阶不就是dp[i]了么。

    那么dp[i]就是 dp[i - 1]与dp[i - 2]之和!

    所以dp[i] = dp[i - 1] + dp[i - 2]

  3. dp数组如何初始化

    需要注意的是:题目中说了n是一个正整数,题目根本就没说n有为0的情况。

    所以本题其实就不应该讨论dp[0]的初始化!

    我相信dp[1] = 1,dp[2] = 2,这个初始化大家应该都没有争议的。

    所以我的原则是:不考虑dp[0]如果初始化,只初始化dp[1] = 1,dp[2] = 2,然后从i = 3开始递推,这样才符合dp[i]的定义。

  4. 确定遍历顺序

    从递推公式dp[i] = dp[i - 1] + dp[i - 2];中可以看出,遍历顺序一定是从前向后遍历的

  5. 举例推导dp数组

    如果代码出问题了,就把dp table 打印出来,看看究竟是不是和自己推导的一样。

    此时大家应该发现了,这不就是斐波那契数列么!

    唯一的区别是,没有讨论dp[0]应该是什么,因为dp[0]在本题没有意义!

# Time complexity: O(N)
# Space complexity: O(N)
class Solution:
    def climbStairs(self, n: int) -> int:
        if n <= 1:
            return n
        
        dp = [0] * (n + 1)
        dp[1] = 1
        dp[2] = 2
        
        for i in range(3, n+1):
            dp[i] = dp[i-1] + dp[i-2]
        
        return dp[n]

746. 使用最小花费爬楼梯

代码随想录文章讲解

动态规划

  1. 确定dp数组以及下标的含义

    dp[i]的定义:到达第i个台阶所花费的最少体力为dp[i] 。(注意这里认为是第一步一定是要花费)

  2. 确定递推公式

    可以有两个途径得到dp[i],一个是dp[i-1] 一个是dp[i-2]

    那么究竟是选dp[i-1]还是dp[i-2]呢?

    一定是选最小的,所以dp[i] = min(dp[i - 1], dp[i - 2]) + cost[i];

    注意这里为什么是加cost[i],而不是cost[i-1],cost[i-2]之类的,因为题目中说了:每当你爬上一个阶梯你都要花费对应的体力值

  3. dp数组如何初始化

    根据dp数组的定义,dp数组初始化其实是比较难的,因为不可能初始化为第i台阶所花费的最少体力。

    那么看一下递归公式,dp[i]由dp[i-1],dp[i-2]推出,既然初始化所有的dp[i]是不可能的,那么只初始化dp[0]和dp[1]就够了,其他的最终都是dp[0]dp[1]推出。

  4. 确定遍历顺序

    本题的遍历顺序其实比较简单,简单到很多同学都忽略了思考这一步直接就把代码写出来了。

    因为是模拟台阶,而且dp[i]又dp[i-1]dp[i-2]推出,所以是从前到后遍历cost数组就可以了。

    但是稍稍有点难度的动态规划,其遍历顺序并不容易确定下来

# Time complexity: O(N)
# Space complexity: O(N)
class Solution:
    def minCostClimbingStairs(self, cost: List[int]) -> int:
        top_floor = len(cost)
      
        dp = [0] * top_floor
        dp[0] = cost[0]
        dp[1] = cost[1]
         
        for i in range(2, top_floor):
            dp[i] = min(dp[i-1], dp[i-2]) + cost[i]
        # 注意最后一步可以理解为不用花费,所以取倒数第一步,第二步的最少值
        return min(dp[top_floor - 1], dp[top_floor - 2])
      
# another way to understand the problem
class Solution:
    def minCostClimbingStairs(self, cost: List[int]) -> int:
        # The array's length should be 1 longer than the length of cost
        # This is because we can treat the "top floor" as a step to reach
        minimum_cost = [0] * (len(cost) + 1)
        
        # Start iteration from step 2, since the minimum cost of reaching
        # step 0 and step 1 is 0
        for i in range(2, len(cost) + 1):
            take_one_step = minimum_cost[i - 1] + cost[i - 1]
            take_two_steps = minimum_cost[i - 2] + cost[i - 2]
            minimum_cost[i] = min(take_one_step, take_two_steps)
​
        # The final element in minimum_cost refers to the top floor
        return minimum_cost[-1]