本文正在参加「金石计划 . 瓜分6万现金大奖」
回文串问题
前几天有读者说遇到了「回文串」的面试原题,今儿来带大家好好梳理一下关于「回文串」问题的笔试面试高频题。
开始之前要知道:回文串问题的一般解法不如括号问题那般具有可总结可提炼的特性,但回文串问题也有究极方案 Manacher 算法,本文会提供该做法的最佳实践,但不会深入讲解该算法诸多细节。
5. 最长回文子串
给你一个字符串 s,找到 s 中最长的回文子串。
示例 1:
输入:s = "babad"
输出:"bab"
解释:"aba" 同样是符合题意的答案。
示例 2:
输入:s = "cbbd"
输出:"bb"
示例 3:
输入:s = "a"
输出:"a"
示例 4:
输入:s = "ac"
输出:"a"
提示:
s仅由数字和英文字母(大写和/或小写)组成
朴素解法
这道题有一个很容易就能想到的简单做法:枚举字符串 s 中的每一位,作为回文串的中心点,左右进行扩展,直到达到边界或者不满足回文串定义为止。
这样做的思路必然是正确的。
但很显然这是一个朴素(暴力)做法,那么我们如何确定这一做法是否可行呢?
还记得我们上一节的分析思路吗?当我们有了一个简单的实现方法之后,需要从题目的数据规模、计算机的处理速度和实现方法的计算量出发,判断这样的做法是否不会超时。
由于字符串长度最多只有 1000,而我们的实现方法是 ,因此我们算法的计算量应该在 以内,是在计算机每秒的处理范围内的。
首先枚举回文串的中心 i,然后分两种情况向两边扩展边界,直到达到边界或者不满足回文串定义为止:
-
回文串长度是奇数,则依次判断
s[i − k] == s[i + k], k = 1,2,3… -
回文串长度是偶数,则依次判断
s[i − k] == s[i + k − 1], k = 1,2,3…
代码:
class Solution {
public String longestPalindrome(String s) {
String ans = "";
for (int i = 0; i < s.length(); i++) {
// 回文串为奇数
int l = i - 1, r = i + 1;
String sub = getString(s, l, r);
if (sub.length() > ans.length()) ans = sub;
// 回文串为偶数
l = i - 1;
r = i + 1 - 1;
sub = getString(s, l, r);
if (sub.length() > ans.length()) ans = sub;
}
return ans;
}
String getString(String s, int l, int r) {
while (l >= 0 && r < s.length() && s.charAt(l) == s.charAt(r)) {
l--;
r++;
}
return s.substring(l + 1, r);
}
}
- 时间复杂度:先枚举了
s中的每个字符作为回文串的中心点,再从中心点出发左右扩展,最多扩展到边界。复杂度是 - 空间复杂度:
Manacher 算法
这是一个比较冷门的算法,使用范围也比较单一,只能用于解决「回文串」问题。
Manacher 确实是「回文串」问题的最优解。
但事实上我还没有见过必须使用 Manacher 算法才能过的回文串题。
因此我这里直接给解决方案(可以直接当做模板来使用),而不再讨论算法的具体实现原理。
Manacher 算法较长,为了避免回文串长度奇偶问题的分情况讨论,我会对原字符进行处理,在边界和字符之间插入占位符。
使用了这样的技巧之后,当非占位字符作为回文串的中心时,对应了回文串长度为奇数的情况;当占位字符作为回文串的中心时,对应了回文串长度为偶数的情况。。
举个例子:
原字符:"babad",转换后:"*b*a*b*a*d*",得到的回文串:"*b*a*b*",然后再去除占位符输出:"bab"。
解释:"aba" 同样是符合题意的答案。
代码:
class Solution {
public String longestPalindrome(String s) {
if (s.length() == 1) return s;
char[] chars = manacherString(s);
int n = chars.length;
int[] pArr = new int[n];
int C = -1, R = -1, pos = -1;
int max = Integer.MIN_VALUE;
for (int i = 0; i < n; i++) {
pArr[i] = i < R ? Math.min(pArr[C * 2 - i], R - i) : 1;
while (i + pArr[i] < n && i - pArr[i] > -1) {
if (chars[i + pArr[i]] == chars[i - pArr[i]]) {
pArr[i]++;
} else {
break;
}
}
if (i + pArr[i] > R) {
R = i + pArr[i];
C = i;
}
if (pArr[i] > max) {
max = pArr[i];
pos = i;
}
}
int offset = pArr[pos];
StringBuilder sb = new StringBuilder();
for (int i = pos - offset + 1; i <= pos + offset - 1; i++) {
if (chars[i] != '#') sb.append(chars[i]);
}
return sb.toString();
}
char[] manacherString(String s) {
char[] chars = new char[s.length() * 2 + 1];
for (int i = 0, idx = 0; i < chars.length; i++) {
chars[i] = (i & 1) == 0 ? '#' : s.charAt(idx++);
}
return chars;
}
}
- 时间复杂度:只对字符串进行了一次扫描。复杂度为
- 空间复杂度:
9. 回文数
给你一个整数 x ,如果 x 是一个回文整数,返回 true ;否则,返回 false 。
回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。
例如, 是回文,而 不是。
示例 1:
输入:x = 121
输出:true
示例 2:
输入:x = -121
输出:false
解释:从左向右读, 为 -121 。 从右向左读, 为 121- 。因此它不是一个回文数。
示例 3:
输入:x = 10
输出:false
解释:从右向左读, 为 01 。因此它不是一个回文数。
示例 4:
输入:x = -101
输出:false
提示:
- - - 1
进阶:你能不将整数转为字符串来解决这个问题吗?
字符串解法
虽然进阶里提到了不能用字符串来解决,但还是提供一下吧。
代码:
class Solution {
public boolean isPalindrome(int x) {
String s = String.valueOf(x);
StringBuilder sb = new StringBuilder(s);
sb.reverse();
return sb.toString().equals(s);
}
}
- 时间复杂度:数字 的位数,数字大约有 位,翻转操作要执行循环。复杂度为
- 空间复杂度:使用了字符串作为存储。复杂度为
非字符串解法(完全翻转)
原数值 x 的不超过 int 的表示范围,但翻转后的值会有溢出的风险,所以这里使用 long 进行接收,最后对比两者是否相等。
代码:
class Solution {
public boolean isPalindrome(int x) {
if (x < 0) return false;
long ans = 0;
int t = x;
while (x > 0) {
ans = ans * 10 + x % 10;
x /= 10;
}
return ans - t == 0;
}
}
- 时间复杂度:数字 的位数,数字大约有 位。复杂度为
- 空间复杂度:
非字符串解法(部分翻转)
如果在进阶中增加一个我们熟悉的要求:环境中只能存储得下 位的有符号整数。
那么我们就连 long 也不能用了,这时候要充分利用「回文」的特性:前半部分和后半部分(翻转)相等。
这里的前半部分和后半部分(翻转)需要分情况讨论:
-
回文长度为奇数:回文中心是一个独立的数,即
忽略回文中心后,前半部分 == 后半部分(翻转)。如 1234321 回文串 -
回文长度为偶数:回文中心在中间两个数中间,即
前半部分 == 后半部分(翻转)。如 123321
代码:
class Solution {
public boolean isPalindrome(int x) {
// 对于 负数 和 x0、x00、x000 格式的数,直接返回 flase
if (x < 0 || (x % 10 == 0 && x != 0)) return false;
int t = 0;
while (x > t) {
t = t * 10 + x % 10;
x /= 10;
}
// 回文长度的两种情况:直接比较 & 忽略中心点(t 的最后一位)进行比较
return x == t || x == t / 10;
}
}
- 时间复杂度:数字 的位数,数字大约有 位。复杂度为
- 空间复杂度:
131. 分割回文串
给你一个字符串 s,请你将 s 分割成一些子串,使每个子串都是 回文串 。返回 s 所有可能的分割方案。
回文串 是正着读和反着读都一样的字符串。
示例 1:
输入:s = "aab"
输出:[["a","a","b"],["aa","b"]]
示例 2:
输入:s = "a"
输出:[["a"]]
提示:
- 1 <= s.length <= 16
- s 仅由小写英文字母组成
动态规划 + 回溯算法
求所有的分割方案,凡是求所有方案的题基本上都没有什么优化方案,就是「爆搜」。
问题在于,爆搜什么?显然我们可以爆搜每个回文串的起点。如果有连续的一段是回文串,我们再对剩下连续的一段继续爆搜。
为什么能够直接接着剩下一段继续爆搜?
因为任意的子串最终必然能够分割成若干的回文串(最坏的情况下,每个回文串都是一个字母)。
所以我们每次往下爆搜时,只需要保证自身连续一段是回文串即可。
举个🌰 来感受下我们的爆搜过程,假设有样例 abababa,刚开始我们从起点第一个 a 进行爆搜:
- 发现
a是回文串,先将a分割出来,再对剩下的bababa进行爆搜 - 发现
aba是回文串,先将aba分割出来,再对剩下的baba进行爆搜 - 发现
ababa是回文串,先将ababa分割出来,再对剩下的ba进行爆搜 - 发现
abababa是回文串,先将abababa分割出来,再对剩下的 `` 进行爆搜
...
然后再对下一个起点(下个字符) b 进行爆搜?
不需要。
因为单个字符本身构成了回文串,所以以 b 为起点,b 之前构成回文串的方案,必然覆盖在我们以第一个字符为起点所展开的爆搜方案内(在这里就是对应了上述的第一步所展开的爆搜方案中)。
因此我们只需要以首个字符为起点,枚举以其开头所有的回文串方案,加入集合,然后对剩下的字符串部分继续爆搜。就能做到以任意字符作为回文串起点进行分割的效果了。
一定要好好理解上面那句话 ~
剩下的问题是,我们如何快速判断连续一段 [i, j] 是否为回文串,因为爆搜的过程每个位置都可以作为分割点,复杂度为 的。
因此我们不可能每次都使用双指针去线性扫描一遍 [i, j] 判断是否回文。
一个直观的做法是,我们先预处理除所有的 f[i][j],f[i][j] 代表 [i, j] 这一段是否为回文串。
预处理 f[i][j] 的过程可以用递推去做。
要想 f[i][j] == true ,必须满足以下两个条件:
f[i + 1][j - 1] == trues[i] == s[j]
由于状态 f[i][j] 依赖于状态 f[i + 1][j - 1],因此需要我们左端点 i 是从大到小进行遍历;而右端点 j 是从小到大进行遍历。
因此,我们的遍历过程可以整理为:右端点 j 一直往右移动(从小到大),在 j 固定情况下,左端点 i 在 j 在左边开始,一直往左移动(从大到小)
代码:
class Solution {
public List<List<String>> partition(String s) {
int n = s.length();
char[] cs = s.toCharArray();
// f[i][j] 代表 [i, j] 这一段是否为回文串
boolean[][] f = new boolean[n][n];
for (int j = 0; j < n; j++) {
for (int i = j; i >= 0; i--) {
// 当 [i, j] 只有一个字符时,必然是回文串
if (i == j) {
f[i][j] = true;
} else {
// 当 [i, j] 长度为 2 时,满足 cs[i] == cs[j] 即回文串
if (j - i + 1 == 2) {
f[i][j] = cs[i] == cs[j];
// 当 [i, j] 长度大于 2 时,满足 (cs[i] == cs[j] && f[i + 1][j - 1]) 即回文串
} else {
f[i][j] = cs[i] == cs[j] && f[i + 1][j - 1];
}
}
}
}
List<List<String>> ans = new ArrayList<>();
List<String> cur = new ArrayList<>();
dfs(s, 0, ans, cur, f);
return ans;
}
/**
* s: 要搜索的字符串
* u: 以 s 中的那一位作为回文串分割起点
* ans: 最终结果集
* cur: 当前结果集
* f: 快速判断 [i,j] 是否为回文串
*/
void dfs(String s, int u, List<List<String>> ans, List<String> cur, boolean[][] f) {
int n = s.length();
if (u == n) ans.add(new ArrayList<>(cur));
for (int i = u; i < n; i++) {
if (f[u][i]) {
cur.add(s.substring(u, i + 1));
dfs(s, i + 1, ans, cur, f);
cur.remove(cur.size() - 1);
}
}
}
}
- 时间复杂度:动态规划预处理的复杂度为 ;爆搜过程中每个字符都可以作为分割点,并且有分割与不分割两种选择,方案数量为 ,每个字符都需要往后检查剩余字符的分割情况,复杂度为 。整体复杂度为
- 空间复杂度:动态规划部分的复杂度为 ;方案数量最多为 ,每个方案都是完整字符串
s的分割,复杂度为 ,整体复杂度为
总结
对于此类要枚举所有方案的题目,我们都应该先想到「回溯算法」。
「回溯算法」从算法定义上来说,不一定要用 DFS 实现,但通常结合 DFS 来做,难度是最低的。
「回溯算法」根据当前决策有多少种选择,对应了两套模板。
每一次独立的决策只对应 选择 和 不选 两种情况:
-
确定结束回溯过程的 base case
-
遍历每个位置,对每个位置进行决策(做选择 -> 递归 -> 撤销选择)
void dfs(当前位置, 路径(当前结果), 结果集) {
if (当前位置 == 结束位置) {
结果集.add(路径);
return;
}
选择当前位置;
dfs(下一位置, 路径(当前结果), 结果集);
撤销选择当前位置;
dfs(下一位置, 路径(当前结果), 结果集);
}
每一次独立的决策都对应了多种选择(通常对应了每次决策能选择什么,或者每次决策能选择多少个 ...):
-
确定结束回溯过程的 base case
-
遍历所有的「选择」
-
对选择进行决策 (做选择 -> 递归 -> 撤销选择)
void dfs(选择列表, 路径(当前结果), 结果集) {
if (满足结束条件) {
结果集.add(路径);
return;
}
for (选择 in 选择列表) {
做选择;
dfs(路径’, 选择列表, 结果集);
撤销选择;
}
}
132. 分割回文串 II
给你一个字符串 s,请你将 s 分割成一些子串,使每个子串都是回文。
返回符合要求的 最少分割次数 。
示例 1:
输入:s = "aab"
输出:1
解释:只需一次分割就可将 s 分割成 ["aa","b"] 这样两个回文子串。
示例 2:
输入:s = "a"
输出:0
示例 3:
输入:s = "ab"
输出:1
提示:
s仅由小写英文字母组成
动态规划
如果在 131. 分割回文串 你有使用到 DP 进行预处理的话。
这道题就很简单了,就是一道常规的动态规划题。
为了方便,我们约定所有下标从 开始。
即对于长度为 的字符串,我们使用 进行表示。估计不少看过三叶题解的同学都知道,这样做的目的是为了减少边界情况判断,这本身也是对于「哨兵」思想的运用。
- 递推「最小分割次数」思路
我们定义 为将 这一段字符分割为若干回文串的最小分割次数,那么最终答案为 。
不失一般性的考虑 如何转移:
- 从「起点字符」到「第 个字符」能形成回文串。那么最小分割次数为 0,此时有
- 从「起点字符」到「第 个字符」不能形成回文串。此时我们需要枚举左端点 ,如果 这一段是回文串的话,那么有
在 中满足回文要求的左端点位置 可能有很多个,我们在所有方案中取一个 即可。
- 快速判断「任意一段子串是否回文」思路
剩下的问题是,我们如何快速判断连续一段 是否为回文串,做法和昨天的 131. 分割回文串 一模一样。
PS. 在 131. 分割回文串,数据范围只有 ,因此我们可以不使用 DP 进行预处理,而是使用双指针来判断是否回文也能过。但是该题数据范围为 (数量级为 ),使用朴素做法判断是否回文的话,复杂度会去到 (计算量为 ),必然超时。
因此我们不可能每次都使用双指针去线性扫描一遍 判断是否回文。
一个合理的做法是,我们先预处理出所有的 , 代表 这一段是否为回文串。
预处理 的过程可以用递推去做。
要想 ,必须满足以下两个条件:
由于状态 依赖于状态 ,因此需要我们左端点 是「从大到小」进行遍历;而右端点 是「从小到大」进行遍历。
因此最终的遍历过程可以整理为:右端点 一直往右移动(从小到大),在 固定情况下,左端点 在 在左边开始,一直往左移动(从大到小)
代码:
class Solution {
public int minCut(String s) {
int n = s.length();
char[] cs = s.toCharArray();
// g[l][r] 代表 [l,r] 这一段是否为回文串
boolean[][] g = new boolean[n + 1][n + 1];
for (int r = 1; r <= n; r++) {
for (int l = r; l >= 1; l--) {
// 如果只有一个字符,则[l,r]属于回文
if (l == r) {
g[l][r] = true;
} else {
// 在 l 和 r 字符相同的前提下
if (cs[l - 1] == cs[r - 1]) {
// 如果 l 和 r 长度只有 2;或者 [l+1,r-1] 这一段满足回文,则[l,r]属于回文
if (r - l == 1 || g[l + 1][r - 1]) {
g[l][r] = true;
}
}
}
}
}
// f[r] 代表将 [1,r] 这一段分割成若干回文子串所需要的最小分割次数
int[] f = new int[n + 1];
for (int r = 1; r <= n; r++) {
// 如果 [1,r] 满足回文,不需要分割
if (g[1][r]) {
f[r] = 0;
} else {
// 先设定一个最大分割次数(r 个字符最多消耗 r - 1 次分割)
f[r] = r - 1;
// 在所有符合 [l,r] 回文的方案中取最小值
for (int l = 1; l <= r; l++) {
if (g[l][r]) f[r] = Math.min(f[r], f[l - 1] + 1);
}
}
}
return f[n];
}
}
- 时间复杂度:
- 空间复杂度:
关于「如何确定 DP 状态定义」的分享
有同学会对「如何确定 DP 的状态定义」有疑问,觉得自己总是定不下 DP 的状态定义。
首先,十分正常,不用担心。
DP 的状态定义,基本上是考经验的(猜的),猜对了 DP 的状态定义,基本上「状态转移方程」就是呼之欲出。
虽然大多数情况都是猜的,但也不是毫无规律,相当一部分是定义是与「结尾」和「答案」有所关联的。
例如本题定义 为以下标为 的字符作为结尾(结尾)的最小分割次数(答案)。
因此对于那些你没见过的 DP 模型题,可以从这两方面去「猜」。
Manacher 算法(非重要补充)
如果你还学有余力的话,可以看看下面这篇题解。
提供了「回文串」问题的究极答案:Manacher 算法。
由于 Manacher 算法较为局限,只能解决「回文串」问题,远不如 KMP 算法使用广泛,不建议大家深究原理,而是直接当做「模板」背过。
背过这样的算法的意义在于:相当于大脑里有了一个时间复杂度为 的 api 可以使用,这个 api 传入一个字符串,返回该字符串的最大回文子串。
如果觉得自己背不下来,也没有问题。事实上我还没有见过必须使用 Manacher 算法才能过的回文串题。
总结
关于回文串问题,究极答案是「Manacher 算法」,但是实际笔试面试中,并不存在必须使用「Manacher 算法」笔试面试回文串题目。
这里建议大家掌握常规求解回文串问题的解法,同时把「Manacher 算法」背下来做兜底,以确保不会因为回文串问题而出现丢分。