单词拆分

159 阅读1分钟

一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第26天,点击查看活动详情

一、题目

leetcode 单词拆分

给你一个字符串 s 和一个字符串列表 wordDict 作为字典。请你判断是否可以利用字典中出现的单词拼接出 s 。

注意:不要求字典中出现的单词全部都使用,并且字典中的单词可以重复使用。

示例 1:

输入: s = "leetcode", wordDict = ["leet", "code"]
输出: true
解释: 返回 true 因为 "leetcode" 可以由 "leet""code" 拼接成。

示例 2:*

输入: s = "applepenapple", wordDict = ["apple", "pen"]
输出: true
解释: 返回 true 因为 "applepenapple" 可以由 "apple" "pen" "apple" 拼接成。
     注意,你可以重复使用字典中的单词。

示例 3:

输入: s = "catsandog", wordDict = ["cats", "dog", "sand", "and", "cat"]
输出: false

提示:

1 <= s.length <= 300
1 <= wordDict.length <= 1000
1 <= wordDict[i].length <= 20
s 和 wordDict[i] 仅有小写英文字母组成
wordDict 中的所有字符串 互不相同

二、题解

需要判断一个字符串s,能否由一个字符串集合wordDict中的字符串组合而成,wordDict中的字符串可以重复使用,并且不会出现重复的字符串。

方法一

简单的可以用字符串集合wordDict中的字符串来,任意组合看看能否得到字符串s,但是这种组合可能非常多,因此可以将字符串s分割,然后看分割的字符串是否存在于字符串集合wordDict中。定义一个dp数组,那么dp[i]就表示字符串s的下标位置i前的子字符串是否可以由wordDict字符串集合中的字符串元素组成,对于dp[0]也就是空字符串就默认为true;对于dp[i]就需要判断字符串i位置前的子字符串了,需要判断s[0, i)的字符串能不能被组合而成,那就需要分割枚举改字符串,定义一个j指针,从0开始直到i来分割字符串,判断dp[j]是否满足以及ji的一个字符串能否再字符串集合wordDict中找到,都满足的话即dp[i] = true,然后结束j的枚举。为了快速的在字符串集合wordDict中查询字符串,我们可以使用一个哈希表转存字符串集合wordDict中字符串来完成。同时查询wordDict集合中字符串的时候,如果待查询的字符串长度大于wordDict集合中最长的字符串长度,那么就是没有必要继续查询之后的了,因此可以在枚举j的时候,从后往前即从i0来枚举,如果ji分割成的字符串大于集合最长字符串就没有必要继续往下枚举了。

三、代码

方法一 Java代码

class Solution {
    public boolean wordBreak(String s, List<String> wordDict) {
        int len = s.length();
        // 获取最长的单词长度
        int maxWord = 0;
        Set<String> wordSet = new HashSet<String>(wordDict);
        for (String word : wordDict) {
            maxWord = Math.max(maxWord, word.length());
        }
        boolean[] dp = new boolean[len + 1];
        dp[0] = true;
        for (int i = 1; i <= len; i++) {
            for (int j = i; j >= 0 && maxWord >= i - j; j--) {
                if (dp[j] && wordSet.contains(s.substring(j, i))) {
                    dp[i] = true;
                    break;
                }
            }
        }
        return dp[len];
    }
}


时间复杂度:O(n^2),需要对字符串s进行状态转移,以及对每个子字符串来分割枚举。

空间复杂度:O(n),需要一个dp数组以及哈希表转存字符串集合。