【一看就会一写就废 指间算法】划分字母区间 —— 贪心、哈希表、双指针

77 阅读2分钟

指尖划过的轨迹,藏着最细腻的答案~

题目

给你一个字符串 s 。我们要把这个字符串划分为尽可能多的片段,同一字母最多出现在一个片段中。例如,字符串 "ababcc" 能够被分为 ["abab", "cc"],但类似 ["aba", "bcc"] 或 ["ab", "ab", "cc"] 的划分是非法的。

注意,划分结果需要满足:将所有划分结果按顺序连接,得到的字符串仍然是 s 。

返回一个表示每个字符串片段的长度的列表。

示例 1:

输入:s = "ababcbacadefegdehijhklij"
输出:[9,7,8]
解释:
划分结果为 "ababcbaca"、"defegde"、"hijhklij" 。
每个字母最多出现在一个片段中。
像 "ababcbacadefegde", "hijhklij" 这样的划分是错误的,因为划分的片段数较少。

示例 2:

输入:s = "eccbbbbdec"
输出:[10]

提示:

1 <= s.length <= 500
s 仅由小写英文字母组成

分析:

以示例一为例,我们将每个字母出现的开始与结束下标统计如下:

字母开始结束
a08
b15
c47
d914
e1015
f1111
g1313
h1619
i1722
j1823
k2020
l2121

如果我们想要将e划分为一个区间[10,15],包含这个范围的其他字母d[9,14]、f[11,11]、g[13,13] 都应该放入这个区间,即[9,15],因此,本道题本质上是合并区间。

我们贪心的想,只需要再遍历过程中记录所有字符的最大的结束下标end,当当前下标i等于end时,说明一个合并区间结束,将区间长度放入答案。

而为了计算区间长度,上面已经有了区间结束下标end,还缺一个开始下标start,其初始为0,区间结束时更新为end+1

参考代码:

class Solution {
public:
    vector<int> partitionLabels(string s) {
        int n = s.size();
        int last[26];

        for (int i = 0; i < n; i++) {
            last[s[i] - 'a'] = i;
        }

        vector<int> ans;
        int start = 0, end = 0;
        for (int i = 0; i < n; i++) {
            end = max(end, last[s[i] - 'a']);
            if (i == end) {
                ans.push_back(end - start + 1);
                start = i + 1;
            }
        }

        return ans;
    }
};