给定一个字符串 s 和一些长度相同的单词 words。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。
注意子串要与 words 中的单词完全匹配,中间不能有其他字符,但不需要考虑 words 中单词串联的顺序。
示例 1:
输入:
s = "barfoothefoobarman",
words = ["foo","bar"]
输出:[0,9]
解释:
从索引 0 和 9 开始的子串分别是 "barfoo" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。
示例 2:
输入:
s = "wordgoodgoodgoodbestword",
words = ["word","good","best","word"]
输出:[]
首先分析题意可知:
- words中所有单词的长度是相同;
- 题目要求s中若存在由words中所有单词组成的字串则它们中间不能有其他的字符;
- 答案中只保留存在的字串的起始索引
因此,我们可以采用滑动窗口的方式对s
进行截取。假设words中单词数为count
,每个单词长度为l
,那么滑动窗口的大小就为l
,窗口的起始和结束位置用指针p
和q
标识
-
如果
s[p:q]
组成的词在words中存在,接着判断s[p: q + (count -1) * l]
按长度l
进行切片后组成的单词是不是和words中的单词完全一致- 如果一致,保存
p
,同时p = p + 1, q = p + 1
继续往后判断,直到q
到头 - 如果不一致,执行
p = p + 1, q = p + 1
继续往后判断,直到q
到头
- 如果一致,保存
-
如果
s[p:q]
组成的词在words中不存在,则执行p = p + 1, q = p + 1
继续往后判断,直到q
到头
- 在判断
s[p: q + (count -1) * l]
按长度l
进行切片后组成的单词是不是和words中的单词完全一致时,一种简便的方法是对列表使用sorted()进行字典升序排列,然后再进行比较,而不必依次比对。- 在对
s[p: q + (count -1) * l]
按长度l
进行切片时,可以采用正则表达式re.findall(r'.{%d}' % l, string)
进行处理
AC code
import re
class Solution:
def findSubstring(self, s: str, words: List[str]) -> List[int]:
if s == '' or words == [] or len(s) < len(''.join(words)):
return []
count = len(words)
l = len(words[0])
if len(s) == l and count == 1:
if s == words[0]: return [0]
else: return []
p = 0
q = p + l
r = []
while q < len(s):
if s[p:q] in words:
string = s[p: q + (count - 1) * l]
ws = re.findall(r'.{%d}' % l, string)
if sorted(ws) == sorted(words):
r.append(p)
p += 1
q = p + l
else:
p += 1
q += 1
else:
p += 1
q += 1
return r