给定一个单词列表 words 和一个整数 k ,返回前 k 个出现次数最多的单词。
返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序。
示例 1:
输入: words = ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i" 和 "love" 为出现次数最多的两个单词,均为 2 次。
注意,按字母顺序 "i" 在 "love" 之前。
示例 2:
输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词,
出现次数依次为 4, 3, 2 和 1 次。
注意:
1 <= words.length <= 5001 <= words[i] <= 10words[i]由小写英文字母组成。k的取值范围是[1, **不同** words[i] 的数量]
进阶: 尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。
思路
本题基本思路是先求出每个单词的出现频率,然后在按照频率和字典升序排序,然后取前 k 个单词即可。
求每个单词的出现频率没什么好说的,就是遍历一遍。主要内容是后面的排序,为了较快的排序,我们可以选择一种较快的排序算法。因为单词数量较少,我选择的是桶排序,同一频率的单词放到同一的桶里,同一桶里的单词再按照字典序排序,最后我们从频率最高的桶里开始取单词,如果单词数量小于等于 k,就都取出,然后接着取前一个桶,直到取够 k 个单词,如果单词数量大于 k,取前 k 个单词,代码如解法一。
本题们还可以用一个大小为 k 的数组存储频率最高的 k 个元素。数组中的元素按照题目要求排序,具体思路是当我们拿到一个频率为 n 的单词 word,我们可以用二分法查找到第一个频率小于 n 或频率等于 n 但字典排序在 word 后面的单词,我们把 word 插入到该单词之前,如果此时数组长度大于 k,把数组最后一个元素删除,代码如解法二。
解题
解法一
/**
* @param {string[]} words
* @param {number} k
* @return {string[]}
*/
var topKFrequent = function (words, k) {
const map = new Map();
for (let word of words) {
let count = map.get(word) || 0;
map.set(word, count + 1);
}
let counts = new Array(words.length + 1).fill(0).map((_) => []);
for (let key of map.keys()) {
let count = map.get(key);
counts[count].push(key);
}
let res = [];
for (let i = counts.length - 1; i >= 0; i--) {
if (counts[i].length > 0) {
res.push(...counts[i].sort());
if (res.length >= k) {
break;
}
}
}
return res.slice(0, k);
};
解法二
/**
* @param {string[]} words
* @param {number} k
* @return {string[]}
*/
var topKFrequent = function (words, k) {
const map = new Map();
for (let word of words) {
let count = map.get(word) || 0;
map.set(word, count + 1);
}
let res = [];
const compare = (key1, key2) => {
if (key2 === undefined) return false;
let c1 = map.get(key1);
let c2 = map.get(key2);
return c1 > c2 || (c1 == c2 && key1 < key2);
};
const bf = (key) => {
let l = 0;
let r = res.length - 1;
while (l <= r) {
const m = (l + r) >> 1;
if (compare(key, res[m])) {
r = m - 1;
} else {
l = m + 1;
}
}
return l;
};
for (let key of map.keys()) {
let idx = bf(key);
res.splice(idx, 0, key);
if (res.length > k) {
res.pop();
}
}
return res;
};