一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第15天,点击查看活动详情。
题目描述
给定一个段落 (paragraph) 和一个禁用单词列表 (banned)。返回出现次数最多,同时不在禁用列表中的单词。
题目保证至少有一个词不在禁用列表中,而且答案唯一。
禁用列表中的单词用小写字母表示,不含标点符号。段落中的单词不区分大小写。答案都是小写字母。
示例:
输入:
paragraph = "Bob hit a ball, the hit BALL flew far after it was hit."
banned = ["hit"]
输出: "ball"
解释:
"hit" 出现了3次,但它是一个禁用的单词。
"ball" 出现了2次 (同时没有其他单词出现2次),所以它是段落里出现次数最多的,且不在禁用列表中的单词。
注意,所有这些单词在段落里不区分大小写,标点符号需要忽略(即使是紧挨着单词也忽略, 比如 "ball,"),
"hit"不是最终的答案,虽然它出现次数更多,但它在禁用单词列表中。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/most-common-word
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
思路分析
- 今天算法每日一题是字符串处理题目,题目比较容易理解,认真阅读即可。
- 在解题过程中,需要注意的是,我们为了提高统计词频,一般采用 hashMap 存储单词出现的次数,采用 hashSet 快速判断是否是禁用词汇。
- 这个题目的细节是单词均需要转换为小写单词统计。实现代码如下:
通过代码
class Solution {
public String mostCommonWord(String paragraph, String[] banned) {
String ans = "";
String[] paragraphArr = paragraph.split(" ");
Map<String, Integer> paragraphMap = new HashMap<>();
Set<String> bannedSet = new HashSet<>();
for (String item : banned) {
bannedSet.add(item);
}
int maxCnt = Integer.MIN_VALUE;
StringBuffer sb = new StringBuffer();
int length = paragraph.length();
for (int i = 0; i <= length; i++) {
if (i < length && Character.isLetter(paragraph.charAt(i))) {
sb.append(Character.toLowerCase(paragraph.charAt(i)));
} else if (sb.length() > 0) {
String temp = sb.toString();
if (bannedSet.contains(temp)) {
sb.setLength(0);
continue;
}
int cnt = paragraphMap.getOrDefault(temp, 0) + 1;
paragraphMap.put(temp, cnt);
if (cnt > maxCnt) {
ans = temp;
maxCnt = cnt;
}
sb.setLength(0);
}
}
return ans;
}
}
总结
- 上述算法的时间复杂度是O(n),空间复杂度是O(n)。
- 题目虽然简单,也要动手写一下,才能更好的体会。
- 坚持算法每日一题,加油!