力扣 72. 编辑距离

171 阅读2分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

题目来源:leetcode-cn.com/problems/ed…

大致题意: 给两个字符串,每次可以对其中一个字符串做以下操作:

  • 删除一个字符
  • 添加一个字符
  • 修改一个字符

求最少需要多少次操作可以使两个字符串相同

思路

可知

  • 对一个字符串进行删除字符操作,等价于对另一个字符串进行添加字符操作

设给的字符串为 A、B,长度为 l1、l2,于是实际上的操作有三种:

  • 对字符串 A 添加一个字符
  • 对字符串 B 添加一个字符
  • 修改 A 或 B 的一个字符

A 和 B 的编辑距离与前缀子串的编辑距离和当前字符相关,若使用 dp[i][j] 表示 A 的前 i 个字符与 B 的前 j 个字符的编辑距离,那么有:

  • dp[i][j - 1] 为 A 的前 i 个字符与 B 的前 j - 1 个字符的编辑距离,若在 A 的子串后添加 B 的第 j 个字符,那么 dp[i][j] 即为 dp[i][j - 1] + 1
  • dp[i - 1][j] 为 A 的前 i - 1 个字符与 B 的前 j 个字符的编辑距离,若在 B 的子串后添加 A 的第 i 个字符,那么 dp[i][j] 即为 dp[i - 1][j] + 1
  • dp[i - 1][j - 1] 为 A 的前 i - 1 个字符与 B 的前 j - 1 个字符的编辑距离,若 A 的第 i 个字符与 B 的第 j 个字符相等,那么 dp[i][j] 即为 dp[i - 1][j - 1];若不相等,修改其中一个与另一个相等,那么 dp[i][j] 即为 dp[i - 1][j - 1] + 1
  • 综上,若 A 的第 i 个字符与 B 的第 j 个字符相等,dp[i][j] = min(dp[i][j - 1] + 1, dp[i - 1][j] + 1, dp[i - 1][j - 1]) ;若不相等 dp[i][j] = min(dp[i][j - 1] + 1, dp[i - 1][j] + 1, dp[i - 1][j - 1] + 1)

可以知道,若 i 或者 j 其中一个为 0,那么 dp[i][j] 即为非 0 的索引值;若都为 0,编辑距离即为 0

最终 dp[l1][l2] 即为答案

具体看代码:

    public int minDistance(String word1, String word2) {
        int m = word1.length();
        int n = word2.length();
        int[][] dp = new int[m + 1][n + 1];
        for (int i = 0; i < m + 1; i++) {
            for (int j = 0; j < n + 1; j++) {
                // 若有 0,那么距离即为非 0 的索引值
                // 都为 0,距离也为 0
                if (i == 0 || j == 0) {
                    dp[i][j] = i == 0 ? j : i;
                    continue;
                }
                // 若 word1 第 i 个字符与 word2 的第 j 个字符相等
                if (word1.charAt(i - 1) == word2.charAt(j - 1)) {
                    dp[i][j] = 1 + Math.min(dp[i - 1][j - 1] - 1, Math.min(dp[i - 1][j], dp[i][j - 1]));
                } else {
                    dp[i][j] = 1 + Math.min(dp[i - 1][j - 1], Math.min(dp[i - 1][j], dp[i][j - 1]));
                }
            }
        }
        return dp[m][n];
    }