代码随想录算法训练营第五十六天 |583. 两个字符串的删除操作、72. 编辑距离

95 阅读4分钟

583. 两个字符串的删除操作

代码随想录文章讲解

DP1

  • dp[i][j]:以i-1为结尾的字符串word1,和以j-1位结尾的字符串word2,想要达到相等,所需要删除元素的最少次数。

  • 当word1[i - 1] 与 word2[j - 1]相同的时候

    当word1[i - 1] 与 word2[j - 1]相同的时候,dp[i][j] = dp[i - 1][j - 1];

  • 当word1[i - 1] 与 word2[j - 1]不相同的时候:

    情况一:删word1[i - 1],最少操作次数为dp[i - 1][j] + 1

    情况二:删word2[j - 1],最少操作次数为dp[i][j - 1] + 1

    情况三:同时删word1[i - 1]和word2[j - 1],操作的最少次数为dp[i - 1][j - 1] + 2

    那最后当然是取最小值,所以当word1[i - 1] 与 word2[j - 1]不相同的时候,递推公式:dp[i][j] = min({dp[i - 1][j - 1] + 2, dp[i - 1][j] + 1, dp[i][j - 1] + 1});

    因为dp[i - 1][j - 1] + 1等于 dp[i - 1][j]dp[i][j - 1],所以递推公式可简化为:dp[i][j] = min(dp[i - 1][j] + 1, dp[i][j - 1] + 1);

  • 从递推公式中,可以看出来,dp[i][0]dp[0][j]是一定要初始化的。

    • dp[i][0]:word2为空字符串,以i-1为结尾的字符串word1要删除多少个元素,才能和word2相同呢,很明显dp[i][0] = i
    • dp[0][j]的话同理: dp[0][j] = j
  • 从递推公式 dp[i][j] = min(dp[i - 1][j - 1] + 2, min(dp[i - 1][j], dp[i][j - 1]) + 1);dp[i][j] = dp[i - 1][j - 1]可以看出dp[i][j]都是根据左上方、正上方、正左方推出来的。

    所以遍历的时候一定是从上到下,从左到右,这样保证dpi可以根据之前计算出来的数值进行计算。

 class Solution:
     def minDistance(self, word1: str, word2: str) -> int:
         m = len(word1) + 1
         n = len(word2) + 1
         dp = [ [0]*n for _ in range(m) ]
         dp[0] = list(range(n))
         for i in range(m):
             dp[i][0] = i
         
         for i in range(1, m):
             for j in range(1, n):
                 if word1[i-1] == word2[j-1]:
                     dp[i][j] = dp[i-1][j-1]
                 else:
                     dp[i][j] = min(dp[i-1][j-1]+2, dp[i-1][j]+1, dp[i][j-1]+1)
 ​
         return dp[-1][-1]

DP2

  • 本题和动态规划:1143.最长公共子序列 (opens new window)基本相同,只要求出两个字符串的最长公共子序列长度即可,那么除了最长公共子序列之外的字符都是必须删除的,最后用两个字符串的总长度减去两个最长公共子序列的长度就是删除的最少步数。
 class Solution:
     def minDistance(self, word1: str, word2: str) -> int:
         m = len(word1) + 1
         n = len(word2) + 1
         dp = [ [0]*n for _ in range(m) ]
         
         for i in range(1, m):
             for j in range(1, n):
                 if word1[i-1] == word2[j-1]:
                     dp[i][j] = dp[i-1][j-1] + 1
                 else:
                     dp[i][j] = max(dp[i-1][j], dp[i][j-1])
         
         return (m+n-2) - (2 * dp[-1][-1])

72. 编辑距离

代码随想录文章讲解

DP

  • dp[i][j] 表示以下标i-1为结尾的字符串word1,和以下标j-1为结尾的字符串word2,最近编辑距离为dp[i][j]

  • if (word1[i - 1] == word2[j - 1]):

    • 那么说明不用任何编辑,dp[i][j] 就应该是 dp[i - 1][j - 1],即dp[i][j] = dp[i - 1][j - 1];
  • if (word1[i - 1] != word2[j - 1]):

    • 操作一:word1删除一个元素,那么就是以下标i - 2为结尾的word1 与 j-1为结尾的word2的最近编辑距离 再加上一个操作。即 dp[i][j] = dp[i - 1][j] + 1;
    • 操作二:word2删除一个元素,那么就是以下标i - 1为结尾的word1 与 j-2为结尾的word2的最近编辑距离 再加上一个操作。即 dp[i][j] = dp[i][j - 1] + 1; (word2添加一个元素,相当于word1删除一个元素)
    • 操作三:替换元素,word1替换word1[i - 1],使其与word2[j - 1]相同,此时不用增加元素,那么以下标i-2为结尾的word1j-2为结尾的word2的最近编辑距离 加上一个替换元素的操作。即 dp[i][j] = dp[i - 1][j - 1] + 1;
  • dp[i][0]:以下标i-1为结尾的字符串word1,和空字符串word2,最近编辑距离为dp[i][0]

    那么dp[i][0]就应该是i,对word1里的元素全部做删除操作,即:dp[i][0] = i;

    同理dp[0][j] = j;

 class Solution:
     def minDistance(self, word1: str, word2: str) -> int:
         m = len(word1) + 1
         n = len(word2) + 1
         dp = [ [0]*n for _ in range(m) ]
         dp[0] = list(range(n))
         for i in range(m):
             dp[i][0] = i
         
         for i in range(1, m):
             for j in range(1, n):
                 if word1[i-1] == word2[j-1]:
                     dp[i][j] = dp[i-1][j-1]
                 else:
                     dp[i][j] = min(dp[i-1][j], dp[i][j-1], dp[i-1][j-1]) + 1
 ​
         return dp[-1][-1]