本文正在参加「Java主题月 - Java 刷题打卡」,详情查看活动链接
一、题目概述
LeetCode 1143
. 最长公共子序列
给定两个字符串 text1
和 text2
,返回这两个字符串的最长公共子序列的长度。
一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。
例如,"ace" 是 "abcde" 的子序列,但 "aec" 不是 "abcde" 的子序列。两个字符串的「公共子序列」是这两个字符串所共同拥有的子序列。
若这两个字符串没有公共子序列,则返回 0。
示例 1:
输入:text1 = "abcde", text2 = "ace"
输出:3
解释:最长公共子序列是 "ace",它的长度为 3。
示例 2:
输入:text1 = "abc", text2 = "abc"
输出:3
解释:最长公共子序列是 "abc",它的长度为 3。
示例 3:
输入:text1 = "abc", text2 = "def"
输出:0
解释:两个字符串没有公共子序列,返回 0。
题干分析
**最长公共子序列(Longest Common Subsequence
, LCS
)**是一道非常经典的面试题目,因为它的解法是典型的二维动态规划。
这个算法稍微加改造就可以用于解决其他问题,所以说
LCS
算法是值得掌握的。
动态规划思路:
- 第一步:一定要明确
dp
数组的含义 - 定义
base case
- 找状态转移方程
1. 第一步:一定要明确 dp
数组的含义。
对于两个字符串的动态规划问题,套路是通用的,一般都需要一个二维 dp
数组。
比如对于字符串 s1
和 s2
,一般来说要构造一个这样的 DP table
:
dp[i][j]
含义是:对于 s1[0..i - 1]
和 s2[0..j - 1]
,它们的 LCS
长度是 dp[i][j]
。
比如上图这个例子,dp[2][4] = 2
含义就是:对于 "ac"
和 "babc"
,它们的 LCS
长度是2。根据这个定义,最终想得到的答案应该是 dp[3][6]
。
2. 定义 base case
专门让索引为 0 的行和列表示空串,dp[0][..]
和 dp[..][0]
都应该初始化为 0,这就是 base case
。
比如按照刚才 dp
数组的定义,dp[0][3] = 0
的含义是:对于空字符串 ""
和 "bab"
,其 LCS
的长度为 0。
因为有一个字符串是空串,它们的最长公共子序列的长度显然应该是 0
3. 找状态转移方程
做 “选择”。
求 s1
和 s2
的最长公共子序列,设:子序列为 lcs
。
那么对于 s1
和 s2
中的每个字符,有什么选择?
很简单,两种选择,要么在
lcs
中,要么不在。
如图:
对于 s1[i]
和 s2[j]
,怎么知道它们到底在不在 lcs
中?
可以很容易想到的是,如果某个字符在 lcs
中,那么这个字符肯定同时存在与 s1
和 s2
中,因为 lcs
是最长公共子序列。
dp(i, j)
表示 s1[0...i]
和 s2[0...j]
中最长公共子序列的长度,这样就可以找到状态转移关系:
- 如果
s1[i] == s2[j]
说明这个公共字符一定在
lcs
中,如果知道了s1[0..i-1]
和s2[0..j-1]
中的lcs
长度,再加 1 就是s1[0..i]
和s2[0..j]
中lcs
的长度。 根据dp
函数的定义,如下:
if (str1[i] == str2[j]) dp[i][j] = dp(i - 1, j - 1) + 1;
- 如果
s1[i] != s2[j]
说明
s1[i]
和s2[j]
这两个字符至少有一个不在lcs
中,那到底是哪个字符不在lcs
中呢? 根据dp
函数的定义,如下:
if (str1[i] != str2[j]) dp[i][j] = Math.max(dp(i - 1, j), dp(i, j - 1));
明白了状态转移方程,可以直接写出解法。
二、思路实现
思路:
- 二维数组
dp
dp
压缩
public class LeetCode_1143 {
// Time: O(n ^ 2), Space: O(m * n), Faster: 72.28%
public int longestCommonSubsequence(String text1, String text2) {
int m = text1.length(), n = text2.length();
// 定义: 对于 s1[0..i-1] 和 s2[0..j-1], 它们的 lcs 长度是 dp[i][j]
// base case: dp[0][..] = dp[..][0] = 0 已初始化
int [][] dp = new int[m + 1][n + 1];
for (int i = 1; i <= m; ++i) {
for (int j = 1; j <= n; ++j) {
// 状态转移逻辑
if (text1.charAt(i - 1) == text2.charAt(j - 1)) {
dp[i][j] = dp[i - 1][j - 1] + 1;
} else {
dp[i][j] = Math.max(dp[i][j - 1], dp[i - 1][j]);
}
}
}
return dp[m][n];
}
}