【DP】最长公共子序列|Java 刷题打卡

1,345 阅读4分钟

本文正在参加「Java主题月 - Java 刷题打卡」,详情查看活动链接

一、题目概述

LeetCode 1143. 最长公共子序列

给定两个字符串 text1text2,返回这两个字符串的最长公共子序列的长度。

一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。

例如,"ace" 是 "abcde" 的子序列,但 "aec" 不是 "abcde" 的子序列。两个字符串的「公共子序列」是这两个字符串所共同拥有的子序列。

若这两个字符串没有公共子序列,则返回 0。

示例 1:

输入:text1 = "abcde", text2 = "ace" 
输出:3
解释:最长公共子序列是 "ace",它的长度为 3。


示例 2:

输入:text1 = "abc", text2 = "abc"
输出:3
解释:最长公共子序列是 "abc",它的长度为 3。


示例 3:

输入:text1 = "abc", text2 = "def"
输出:0
解释:两个字符串没有公共子序列,返回 0。

题干分析

**最长公共子序列(Longest Common Subsequence, LCS)**是一道非常经典的面试题目,因为它的解法是典型的二维动态规划

这个算法稍微加改造就可以用于解决其他问题,所以说 LCS 算法是值得掌握的。

动态规划思路:

  1. 第一步:一定要明确 dp 数组的含义
  2. 定义 base case
  3. 找状态转移方程

1. 第一步:一定要明确 dp 数组的含义。

对于两个字符串的动态规划问题,套路是通用的,一般都需要一个二维 dp 数组。

比如对于字符串 s1s2,一般来说要构造一个这样的 DP table

dp-二维数组.png

dp[i][j] 含义是:对于 s1[0..i - 1]s2[0..j - 1],它们的 LCS 长度是 dp[i][j]

比如上图这个例子,dp[2][4] = 2 含义就是:对于 "ac""babc",它们的 LCS 长度是2。根据这个定义,最终想得到的答案应该是 dp[3][6]


2. 定义 base case

专门让索引为 0 的行和列表示空串,dp[0][..]dp[..][0] 都应该初始化为 0,这就是 base case

比如按照刚才 dp 数组的定义,dp[0][3] = 0 的含义是:对于空字符串 """bab",其 LCS 的长度为 0。

因为有一个字符串是空串,它们的最长公共子序列的长度显然应该是 0


3. 找状态转移方程

做 “选择”。

s1s2 的最长公共子序列,设:子序列为 lcs

那么对于 s1s2 中的每个字符,有什么选择?

很简单,两种选择,要么在 lcs 中,要么不在。

如图:

dp-字符串比较.png

对于 s1[i]s2[j],怎么知道它们到底在不在 lcs 中?

可以很容易想到的是,如果某个字符在 lcs 中,那么这个字符肯定同时存在与 s1s2 中,因为 lcs 是最长公共子序列。

dp(i, j) 表示 s1[0...i]s2[0...j] 中最长公共子序列的长度,这样就可以找到状态转移关系:

  1. 如果 s1[i] == s2[j]

说明这个公共字符一定在 lcs 中,如果知道了 s1[0..i-1]s2[0..j-1] 中的 lcs 长度,再加 1 就是 s1[0..i]s2[0..j]lcs 的长度。 根据 dp 函数的定义,如下:

if (str1[i] == str2[j]) dp[i][j] = dp(i - 1, j - 1) + 1;
  1. 如果 s1[i] != s2[j]

说明 s1[i]s2[j] 这两个字符至少有一个不在 lcs 中,那到底是哪个字符不在 lcs 中呢? 根据 dp 函数的定义,如下:

if (str1[i] != str2[j]) dp[i][j] = Math.max(dp(i - 1, j), dp(i, j - 1));

明白了状态转移方程,可以直接写出解法。



二、思路实现

思路:

  1. 二维数组 dp
  2. dp 压缩
public class LeetCode_1143 {
    // Time: O(n ^ 2), Space: O(m * n), Faster: 72.28%
    public int longestCommonSubsequence(String text1, String text2) {

        int m = text1.length(), n = text2.length();
        // 定义: 对于 s1[0..i-1] 和 s2[0..j-1], 它们的 lcs 长度是 dp[i][j]
        // base case: dp[0][..] = dp[..][0] = 0 已初始化
        int [][] dp = new int[m + 1][n + 1];

        for (int i = 1; i <= m; ++i) {
            for (int j = 1; j <= n; ++j) {
                // 状态转移逻辑
                if (text1.charAt(i - 1) == text2.charAt(j - 1)) {
                    dp[i][j] = dp[i - 1][j - 1] + 1;
                } else {
                    dp[i][j] = Math.max(dp[i][j - 1], dp[i - 1][j]);
                }
            }
        }
        return dp[m][n];
    }
}