Java_滑动窗口_串联所有单词的子串

70 阅读4分钟

题目链接: leetcode.cn/problems/su…

题目描述

给定一个字符串 s 和一个字符串数组 words words 中所有字符串 长度相同

 s 中的 串联子串 是指一个包含  words 中所有字符串以任意顺序排列连接起来的子串。

  • 例如,如果 words = ["ab","cd","ef"], 那么 "abcdef", "abefcd""cdabef", "cdefab""efabcd", 和 "efcdab" 都是串联子串。 "acdbef" 不是串联子串,因为他不是任何 words 排列的连接。

返回所有串联子串在 s 中的开始索引。你可以以 任意顺序 返回答案。

示例 1:

输入: s = "barfoothefoobarman", words = ["foo","bar"] 输出:[0,9] 解释: 因为 words.length == 2 同时 words[i].length == 3,连接的子字符串的长度必须为 6。 子串 "barfoo" 开始位置是 0。它是 words 中以 ["bar","foo"] 顺序排列的连接。 子串 "foobar" 开始位置是 9。它是 words 中以 ["foo","bar"] 顺序排列的连接。 输出顺序无关紧要。返回 [9,0] 也是可以的。

示例 2:

输入: s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"] 输出: [] 解释: 因为 words.length == 4 并且 words[i].length == 4,所以串联子串的长度必须为 16。 s 中没有子串长度为 16 并且等于 words 的任何顺序排列的连接。 所以我们返回一个空数组。

示例 3:

输入: = "barfoofoobarthefoobarman", words = ["bar","foo","the"] 输出:[6,9,12] 解释: 因为 words.length == 3 并且 words[i].length == 3,所以串联子串的长度必须为 9。 子串 "foobarthe" 开始位置是 6。它是 words 中以 ["foo","bar","the"] 顺序排列的连接。 子串 "barthefoo" 开始位置是 9。它是 words 中以 ["bar","the","foo"] 顺序排列的连接。 子串 "thefoobar" 开始位置是 12。它是 words 中以 ["the","foo","bar"] 顺序排列的连接。

提示:

  • 1 <= s.length <= 104
  • 1 <= words.length <= 5000
  • 1 <= words[i].length <= 30
  • words[i] 和 s 由小写英文字母组成

题目解析

本题和找到找到字符串中所有字母异位词思路相同,有一点区别就是那个是字母,这个是单词。

字母变成单词,我们需要增加的思路是什么?
在字母中,我们只需要将窗口依次往后移动,直至找到异位词。但是在单词这块,我们需要跳动,因为他给定的是一个字符串,如果它给定的也是一个单词数组,那就和《找到字符串中所有字母异位词》无异了。所以我们遍历字符串的时候,需要跳动着并且将单词拼接出来,在添加到容器中进行判断。难道只是跳动单程吗? 如上图,拿示例一进行举例,如果我们单词的长度为 3,那么一串字符串需要遍历几次,才能覆盖所有可能?
答案是三种,和单词长度一样。因为我们可以从下标 0 开始遍历,每次截取三个字母作为一个单词,也可以从 1 开始截取,也可以从 2 下标开始截取。为什么不能是 3 下标呢?因为 3 下标开始和 0 下标开始是重复的,况且还少个单词。所以这题的关键就是在这,我们需要在开始进入窗口之前再加上一个 for 循环。其他的判断方法,以及出窗口都和《找到字符串中所有字母异位词》无异。
这题还有一个头疼的事,那就是截取单词这部操作,我在编写代码时将这部操作写成了一个方法,当然在开头是将字符串转化为字符数组,然后使用 StringBuffer 拼接,再转换为 String 进行返回。当然你也可以直接使用 substring 进行截取,截取的方法有很多种,按照个人习惯。
下面就是编写代码部分了。

代码

class Solution {
    public List<Integer> findSubstring(String s, String[] words) {
	    //获取到单词长度
        int len = words[0].length();
        //创建容器
        HashMap<String,Integer> wordsmap = new HashMap<>();
        //字符串转化为字符数组
        char[] sarr = s.toCharArray();
        //记录结果
        List<Integer> list = new ArrayList<>();
        //将words存入hashmap中
        for (String str : words) {
            wordsmap.put(str, wordsmap.getOrDefault(str, 0) + 1);
        }
        //一共进行len次遍历,覆盖所有可能
        for (int i = 0; i < len; i++) {
	        //创建容器(窗口),
            HashMap<String,Integer> smap = new HashMap<>();
            for (int l = i, r = i; r < sarr.length; r += len) {
	            //截取到单词
                String sb1 = getWords(sarr,r,len);
                //开始进窗口
                smap.put(sb1,smap.getOrDefault(sb1, 0) + 1);
                //第一次判断,wordsmap种是否含有这个单词
                if (!wordsmap.containsKey(sb1)) {
                //如果不含有,直接将窗口调到这个单词的下一个单词,并且清空窗口
                    l = r + len;
                    smap.clear();
                    continue;
                }
                //判断窗口中的单词个数是否满足wordsmap种单词的个数
                while (smap.get(sb1) > wordsmap.get(sb1)) {
                //不满足就进行出窗口操作
                    String word = getWords(sarr,l,len);
                    smap.put(word, smap.get(word) - 1);
                    if (smap.get(word) == 0) smap.remove(word);
                    l += len;
                }
                //判断窗口和wordsmap是否相等,相等结果加一
                if (wordsmap.equals(smap)) list.add(l);
            }
        }
        return list;
    }
    //截取并拼接单词
    public static String getWords(char[] sarr,int r,int len) {
        StringBuffer sb = new StringBuffer();
        if (r + len - 1 < sarr.length) {
            for (int i = 0; i < len; i++) {
                sb.append(sarr[r + i]);
            }
        }
        return sb.toString();
    }
}