Leetcode每日刷题(十)

512 阅读3分钟

题目:判断子序列

描述: 给定字符串 st ,判断 s 是否为 t 的子序列。

你可以认为 st 中仅包含英文小写字母。字符串 t 可能会很长(长度 \approx 500,000),而 s 是个短字符串(长度 \leq 100)。

字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是"abcde"的一个子序列,而"aec"不是)。

后续挑战 :

如果有大量输入的 S,称作S_1, S_2, \dots , S_k 其中 k \geq 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?

解法一:双指针

public static boolean isSubsequence1(String s, String t) {
    if (t.length() < 1) {
        return s.length() < 1;
    }
    if (s.length() < 1) {
        return true;
    }

    boolean res = false;
    int sIndex = 0, tIndex = 0;
    while (tIndex < t.length()) {
        if (s.charAt(sIndex) == t.charAt(tIndex)) {
            sIndex++;
        }
        tIndex++;
        if (sIndex == s.length()) {
            res = true;
            break;
        }
    }
    return res;
}

复杂度分析:

  • 时间复杂度 O(n) : n 表示 t 的长度;
  • 空间复杂度 O(1)

解法二:indexOf() 方法

public static boolean isSubsequence2(String s, String t) {
    char[] arr = s.toCharArray();
    int j = -1;
    for(int i = 0;i<arr.length;i++) {
        j = t.indexOf(arr[i],j+1);
        if(j==-1) {
            return false;
        }
    }
    return true;    
}

解法三:动态规划(官方题解)

思路及算法:

考虑前面的双指针的做法,我们注意到我们有大量的时间用于在 t 中找到下一个匹配字符。
这样我们可以预处理出对于 t 的每一个位置,从该位置开始往后每一个字符第一次出现的位置。

我们可以使用动态规划的方法实现预处理,令 f[i][j] 表示字符串 t 中从位置 i 开始往后字符 j 第一次出现的位置. 在进行状态转移时,如果 t 中位置 i 的字符就是 j,那么 f[i][j]=i,否则 j 出现在位置 i+1 开始往后,即 f[i][j] = f[i+1][j] , 因此我们要倒过来进行动态规划,从后往前枚举 i

这样我们可以写出状态转移方程:

f[i][j]=\begin{cases}
i & t[i]=j\\ 
f[i+1][j] & t[i] \neq j 
\end{cases}

假定下标从 0 开始,那么 f[i][j] 中有 0 \leq i \leq m(m = t.length),对于边界状态 f[m-1][..], 我们置 f[m][..]m,让 f[m-1][..] 正常进行转移。这样如果 f[i][j]=m,则表示从位置 i 开始往后不存在字符 j

这样,我们可以利用 f 数组,每次 O(1) 地跳转到下一个位置,直到位置变为 ms 中的每一个字符都匹配成功。

同时我们注意到,该解法中对 t 的处理与 s 无关,且预处理完成后,可以利用预处理数组的信息,线性地算出任意一个字符串 s 是否为 t 的子串。这样我们就可以解决「后续挑战」啦。

public static boolean isSubsequence(String s, String t) {
    int n = s.length(), m = t.length();
    int[][] f = new int[m + 1][26];
    // 初始化边界
    for (int i = 0; i < 26; i++) {
        f[m][i] = m;
    }

    // 倒序动态规划
    for (int i = m - 1; i >= 0; i--) {
        for (int j = 0; j < 26; j++) {
            if (t.charAt(i) == j + 'a')
                f[i][j] = i;
            else
                f[i][j] = f[i + 1][j];
        }
    }
    int index = 0;
    for (int i = 0; i < n; i++) {
        // 索引之后未找到对应字符
        if (f[index][s.charAt(i) - 'a'] == m) {
            return false;
        }
        index = f[index][s.charAt(i) - 'a'] + 1;
    }
    return true;
}

复杂度分析:

  • 时间复杂度:O(m \times |\Sigma| + n), 其中 ns 的长度,mt 的长度,\Sigma 为字符集,在本题中字符串只包含小写字母,|\Sigma| = 26。预处理时间复杂度 O(m),判断子序列时间复杂度 O(n)
    • 如果是计算 k 个平均长度为 n 的字符串是否为 t 的子序列,则时间复杂度为 O(m \times |\Sigma| +k \times n)
  • 空间复杂度:O(m \times |\Sigma|), 为动态规划数组的开销。