30 -串联所有单词的子串 - python给定一个字符串 s 和一些长度相同的单词 words。找出 s 中恰好可以由

给定一个字符串 s 和一些长度相同的单词 words。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。

注意子串要与 words 中的单词完全匹配，中间不能有其他字符，但不需要考虑 words 中单词串联的顺序。

示例 1：

输入：
  s = "barfoothefoobarman",
  words = ["foo","bar"]
输出：[0,9]
解释：
从索引 0 和 9 开始的子串分别是 "barfoo" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。

示例 2：

输入：
  s = "wordgoodgoodgoodbestword",
  words = ["word","good","best","word"]
输出：[]

首先分析题意可知：

words中所有单词的长度是相同；
题目要求s中若存在由words中所有单词组成的字串则它们中间不能有其他的字符；
答案中只保留存在的字串的起始索引

因此，我们可以采用滑动窗口的方式对s进行截取。假设words中单词数为count，每个单词长度为l，那么滑动窗口的大小就为l，窗口的起始和结束位置用指针p和q标识

如果s[p:q]组成的词在words中存在，接着判断s[p: q + (count -1) * l]按长度l进行切片后组成的单词是不是和words中的单词完全一致
- 如果一致，保存p，同时p = p + 1, q = p + 1继续往后判断，直到q到头
- 如果不一致，执行p = p + 1, q = p + 1继续往后判断，直到q到头
如果s[p:q]组成的词在words中不存在，则执行p = p + 1, q = p + 1继续往后判断，直到q到头

在判断s[p: q + (count -1) * l]按长度l进行切片后组成的单词是不是和words中的单词完全一致时，一种简便的方法是对列表使用sorted()进行字典升序排列，然后再进行比较，而不必依次比对。

在对s[p: q + (count -1) * l]按长度l进行切片时，可以采用正则表达式re.findall(r'.{%d}' % l, string)进行处理

AC code

import re
class Solution:
    def findSubstring(self, s: str, words: List[str]) -> List[int]:
        if s == '' or words == []  or len(s) < len(''.join(words)):
            return []

        count  = len(words)
        l = len(words[0])
        if len(s) == l and count == 1:
            if s == words[0]: return [0]
            else: return []
            
        p = 0
        q = p + l
        r = []
        while q < len(s):
            if s[p:q] in words:
                string = s[p: q + (count - 1) * l]
                ws = re.findall(r'.{%d}' % l, string)
                if sorted(ws) == sorted(words):
                    r.append(p)
                    p += 1
                    q = p + l
                else:
                    p += 1
                    q += 1
            else:
                p += 1
                q += 1
        
        return r