代码随想录算法训练营第五十天 |123. 买卖股票的最佳时机 III、188. 买卖股票的最佳时机 IV

95 阅读4分钟

123. 买卖股票的最佳时机 III

代码随想录文章讲解

动态规划

  1. 确定dp数组(dp table)以及下标的含义

    一天一共就有五个状态,

    1. 没有操作
    2. 第一次买入
    3. 第一次卖出
    4. 第二次买入
    5. 第二次卖出

    dp[i][j]中 i表示第i天,j为 [0 - 4] 五个状态,dp[i][j]表示第i天状态j所剩最大现金。

  2. 确定递推公式

    需要注意:dp[i][1]表示的是第i天,买入股票的状态,并不是说一定要第i天买入股票,这是很多同学容易陷入的误区

    达到dpi状态,有两个具体操作:

    • 操作一:第i天买入股票了,那么dp[i][1] = dp[i-1][0] - prices[i]
    • 操作二:第i天没有操作,而是沿用前一天买入的状态,即:dp[i][1] = dp[i - 1][1]

    那么dp[i][1]究竟选dp[i-1][0] - prices[i],还是dp[i - 1][1]呢?

    一定是选最大的,所以 dp[i][1] = max(dp[i-1][0] - prices[i], dp[i - 1][1]);

    同理dpi也有两个操作:

    • 操作一:第i天卖出股票了,那么dp[i][2] = dp[i - 1][1] + prices[i]
    • 操作二:第i天没有操作,沿用前一天卖出股票的状态,即:dp[i][2] = dp[i - 1][2]

    所以dp[i][2] = max(dp[i - 1][1] + prices[i], dp[i - 1][2])

    同理可推出剩下状态部分:

    dp[i][3] = max(dp[i - 1][3], dp[i - 1][2] - prices[i]);

    dp[i][4] = max(dp[i - 1][4], dp[i - 1][3] + prices[i]);

  3. dp数组的初始化

    第0天没有操作,这个最容易想到,就是0,即:dp[0][0] = 0;

    第0天做第一次买入的操作,dp[0][1] = -prices[0];

    第0天做第一次卖出的操作,这个初始值应该是多少呢?

    首先卖出的操作一定是收获利润,整个股票买卖最差情况也就是没有盈利即全程无操作现金为0,

    从递推公式中可以看出每次是取最大值,那么既然是收获利润如果比0还小了就没有必要收获这个利润了。

    所以dp[0][2] = 0;

    第0天第二次买入操作,初始值应该是多少呢?应该不少同学疑惑,第一次还没买入呢,怎么初始化第二次买入呢?

    第二次买入依赖于第一次卖出的状态,其实相当于第0天第一次买入了,第一次卖出了,然后在买入一次(第二次买入),那么现在手头上没有现金,只要买入,现金就做相应的减少。

    所以第二次买入操作,初始化为:dp[0][3] = -prices[0];

    同理第二次卖出初始化dp[0][4] = 0;

  4. 确定遍历顺序

    从递归公式其实已经可以看出,一定是从前向后遍历,因为dp[i],依靠dp[i - 1]的数值。

class Solution:
    def maxProfit(self, prices: List[int]) -> int:
        if len(prices) == 1:
            return 0
​
        # 0: 没有操作 (do nothing)
        # 1: 第一次买入 (first time buying(at the day or have bought before))
        # 2: 第一次卖出 (first time selling (at the day or have sold before))
        # 3: 第二次买入 (second time buying(at the day or have bought before))
        # 4: 第二次卖出 (second time selling(at the day or have sold before))
        dp = [ [0]*5 for _ in range(len(prices)) ]
        dp[0][1] = -prices[0]
        dp[0][3] = -prices[0]
​
        for i in range(1, len(prices)):
            dp[i][0] = dp[i-1][0]
            dp[i][1] = max(dp[i-1][0]-prices[i], dp[i-1][1])
            dp[i][2] = max(dp[i-1][1]+prices[i], dp[i-1][2])
            dp[i][3] = max(dp[i-1][2]-prices[i], dp[i-1][3])
            dp[i][4] = max(dp[i-1][3]+prices[i], dp[i-1][4])
        
        return dp[-1][4]

188. 买卖股票的最佳时机 IV

代码随想录文章讲解

动态规划

  • 和上题一样,只是除了0以外的下标处理不同。奇数下标代表买入,偶数下标代表卖出。一共有(2k+1)个下标(k次交易分别要有买入和卖出两种状态,加上一个没有操作的下标0,一共2*k+1个。
class Solution:
    def maxProfit(self, k: int, prices: List[int]) -> int:
        if len(prices) == 1:
            return 0
        
        dp = [0] * (2*k+1)
        for i in range(1, 2*k+12):
            dp[i] = -prices[0]
        
        for i in range(len(prices)):
            for j in range(1, 2*k+1):
                if j % 2 == 1:
                    dp[j] = max(dp[j-1]-prices[i], dp[j])
                else:
                    dp[j] = max(dp[j-1]+prices[i], dp[j])
        
        return dp[-1]