前端算法第一九二弹-最长不含重复字符的子字符串

145 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第25天,点击查看活动详情

请从字符串中找出一个最长的不包含重复字符的子字符串,计算该最长子字符串的长度。

示例 1:

输入:"abcabcbb"
输出:3
解释: 因为无重复字符的最长子串是"abc",所以其长度为 3。

示例 2:

输入:"bbbbb"
输出:1
解释:因为无重复字符的最长子串是"b",所以其长度为 1。

示例 3:

输入: "pwwkew"
输出: 3
解释: 因为无重复字符的最长子串是 "wke",所以其长度为 3。
请注意,你的答案必须是 子串 的长度,"pwke" 是一个子序列,不是子串。

滑动窗口

我们先用一个例子考虑如何在较优的时间复杂度内通过本题。

我们不妨以示例一中的字符串 abcabcbb\texttt{abcabcbb} 为例,找出从每一个字符开始的,不包含重复字符的最长子串,那么其中最长的那个字符串即为答案。对于示例一中的字符串,我们列举出这些结果,其中括号中表示选中的字符以及最长的字符串:

  • (a)bcabcbb\texttt{(a)bcabcbb}开始的最长字符串为 (abc)abcbb\texttt{(abc)abcbb}
  • a(b)cabcbb\texttt{a(b)cabcbb} 开始的最长字符串为 a(bca)bcbb\texttt{a(bca)bcbb}
  • ab(c)abcbb\texttt{ab(c)abcbb} 开始的最长字符串为 ab(cab)cbb\texttt{ab(cab)cbb}
  • abc(a)bcbb\texttt{abc(a)bcbb} 开始的最长字符串为 abc(abc)bb\texttt{abc(abc)bb}
  • abca(b)cbb\texttt{abca(b)cbb} 开始的最长字符串为 abca(bc)bb\texttt{abca(bc)bb}
  • abcab(c)bb\texttt{abcab(c)bb} 开始的最长字符串为 abcab(cb)b\texttt{abcab(cb)b}
  • abcabc(b)b\texttt{abcabc(b)b} 开始的最长字符串为 abcabc(b)b\texttt{abcabc(b)b}
  • abcabcb(b)\texttt{abcabcb(b)} 开始的最长字符串为 abcabcb(b)\texttt{abcabcb(b)}

发现了什么?如果我们依次递增地枚举子串的起始位置,那么子串的结束位置也是递增的!这里的原因在于,假设我们选择字符串中的第 kk 个字符作为起始位置,并且得到了不包含重复字符的最长子串的结束位置为 rkr_k。那么当我们选择第 k+1k+1 个字符作为起始位置时,首先从 k+1k+1 到 rkr_krk 的字符显然是不重复的,并且由于少了原本的第 kk 个字符,我们可以尝试继续增大 rkr_k,直到右侧出现了重复字符为止。

var lengthOfLongestSubstring = function(s) {
    // 哈希集合,记录每个字符是否出现过
    const occ = new Set();
    const n = s.length;
    // 右指针,初始值为 -1,相当于我们在字符串的左边界的左侧,还没有开始移动
    let rk = -1, ans = 0;
    for (let i = 0; i < n; ++i) {
        if (i != 0) {
            // 左指针向右移动一格,移除一个字符
            occ.delete(s.charAt(i - 1));
        }
        while (rk + 1 < n && !occ.has(s.charAt(rk + 1))) {
            // 不断地移动右指针
            occ.add(s.charAt(rk + 1));
            ++rk;
        }
        // 第 i 到 rk 个字符是一个极长的无重复字符子串
        ans = Math.max(ans, rk - i + 1);
    }
    return ans;
};