730. 统计不同回文子序列 : 枚举边缘字符的区间 DP 运用题

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第18天,点击查看活动详情

题目描述

这是 LeetCode 上的 730. 统计不同回文子序列 ,难度为 困难

Tag : 「区间 DP」、「动态规划」

给定一个字符串 s,返回 s 中不同的非空「回文子序列」个数 。

通过从 s 中删除 00 个或多个字符来获得子序列。

如果一个字符序列与它反转后的字符序列一致,那么它是「回文字符序列」。

如果有某个 ii , 满足 aia_i != bib_i ,则两个序列 a1, a2, ... 和 b1, b2, ... 不同。

注意:

  • 结果可能很大,你需要对 109 +710^9 + 7 取模 。

示例 1:

输入:s = 'bccb'

输出:6

解释:6 个不同的非空回文子字符序列分别为:'b', 'c', 'bb', 'cc', 'bcb', 'bccb'。
注意:'bcb' 虽然出现两次但仅计数一次。

示例 2:

输入:s = 'abcdabcdabcdabcdabcdabcdabcdabcddcbadcbadcbadcbadcbadcbadcbadcba'

输出:104860361

解释:共有 3104860382 个不同的非空回文子序列,104860361 对 109 + 7 取模后的值。

提示:

  • 1<=s.length<=10001 <= s.length <= 1000
  • s[i] 仅包含 'a''b''c' 或 'd' 

区间 DP

往长度较少的回文串两端添加字符,可能组成新的长度大的回文串,容易想到「区间 DP」,同时 s 仅由 44 类小写字母组成,也是一个切入点。

根据区间 DP 的一般思路,定义 f[i][j]f[i][j] 为考虑字符串 s 中的 [i,j][i,j] 范围内回文子序列的个数,最终答案为 f[0][n1]f[0][n - 1]

不失一般性考虑 f[i][j]f[i][j] 该如何转移,通过枚举 abcd 作为回文方案「边缘字符」来进行统计,即分别统计各类字符作为「边缘字符」时对 f[i][j]f[i][j] 的贡献,此类统计方式天生不存在重复性问题。

假设当前枚举到的字符为 kk

  • s[i...j]s[i...j] 中没有字符 kk,则字符 kkf[i][j]f[i][j] 贡献为 00,跳过;
  • s[i...j]s[i...j] 中存在字符 kk,根据字符 kk 在范围 s[i...j]s[i...j] 中「最小下标」和「最大下标」进行分情况讨论,假设字符 kks[i...j]s[i...j] 中「最靠左」的位置为 ll,「最靠右」的位置为 rr
    • l=rl = r 时,此时字符 kkf[i][j]f[i][j] 的贡献为 11,即 k 本身;
    • l=r1l = r - 1 时,说明字符 kk 中间不存在任何字符,此时字符 kkf[i][j]f[i][j] 的贡献为 22,包括 kkk 两种回文方案;
    • 其余情况,可根据已算得的「小区间回文方案」进行延伸(两段分别补充位于 llrr 的字符 kk),得到新的大区间方案,此部分对 f[i][j]f[i][j] 的贡献是 f[l+1][r1]f[l + 1][r - 1],另外还有 kkk 两种回文方案,因此总的对答案的贡献为 f[l+1][r1]+2f[l + 1][r - 1] + 2

统计 s[i...j]s[i...j] 中各类字符「最靠左」和「最靠右」的位置,可通过调整枚举方向来实现:从大到小枚举 ii,同时维护 L[s[i]-'a'] = i,即可得到「最靠左」的位置;在确定左端点 ii 之后,从小到达枚举右端点 jj,同时维护 R[s[i]-'a'] = j,即可得到「最靠右」的位置。

代码:

class Solution {
    int MOD = (int)1e9+7;
    public int countPalindromicSubsequences(String s) {
        char[] cs = s.toCharArray();
        int n = cs.length;
        int[][] f = new int[n][n];
        int[] L = new int[4], R = new int[4];
        Arrays.fill(L, -1);
        for (int i = n - 1; i >= 0; i--) {
            L[cs[i] - 'a'] = i;
            Arrays.fill(R, -1);
            for (int j = i; j < n; j++) {
                R[cs[j] - 'a'] = j;
                for (int k = 0; k < 4; k++) {
                    if (L[k] == -1 || R[k] == -1) continue;
                    int l = L[k], r = R[k];
                    if (l == r) f[i][j] = (f[i][j] + 1) % MOD;
                    else if (l == r - 1) f[i][j] = (f[i][j] + 2) % MOD;
                    else f[i][j] = (f[i][j] + f[l + 1][r - 1] + 2) % MOD;
                }
            }
        }
        return f[0][n - 1];
    }
}
  • 时间复杂度:O(C×n2)O(C \times n^2),其中 C=4C = 4 为字符集大小
  • 空间复杂度:O(n2)O(n^2)

最后

这是我们「刷穿 LeetCode」系列文章的第 No.730 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。

在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:github.com/SharingSour…

在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。