前 K 个高频单词

224 阅读1分钟

692. 前 K 个高频单词 - 力扣(LeetCode)

给定一个单词列表  words  和一个整数 k ,返回前  k  个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序。

示例 1:

输入: words = ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i" 和 "love" 为出现次数最多的两个单词,均为 2 次。
注意,按字母顺序 "i" 在 "love" 之前。

示例 2:

输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词,
出现次数依次为 4, 3, 2 和 1 次。

注意:

  • 1 <= words.length <= 500
  • 1 <= words[i] <= 10
  • words[i]  由小写英文字母组成。
  • k 的取值范围是  [1, **不同** words[i] 的数量]

进阶: 尝试以  O(n log k) 时间复杂度和  O(n) 空间复杂度解决。

思路

本题基本思路是先求出每个单词的出现频率,然后在按照频率和字典升序排序,然后取前 k 个单词即可。

求每个单词的出现频率没什么好说的,就是遍历一遍。主要内容是后面的排序,为了较快的排序,我们可以选择一种较快的排序算法。因为单词数量较少,我选择的是桶排序,同一频率的单词放到同一的桶里,同一桶里的单词再按照字典序排序,最后我们从频率最高的桶里开始取单词,如果单词数量小于等于 k,就都取出,然后接着取前一个桶,直到取够 k 个单词,如果单词数量大于 k,取前 k 个单词,代码如解法一

本题们还可以用一个大小为 k 的数组存储频率最高的 k 个元素。数组中的元素按照题目要求排序,具体思路是当我们拿到一个频率为 n 的单词 word,我们可以用二分法查找到第一个频率小于 n 或频率等于 n 但字典排序在 word 后面的单词,我们把 word 插入到该单词之前,如果此时数组长度大于 k,把数组最后一个元素删除,代码如解法二

解题

解法一

/**
 * @param {string[]} words
 * @param {number} k
 * @return {string[]}
 */
var topKFrequent = function (words, k) {
  const map = new Map();
  for (let word of words) {
    let count = map.get(word) || 0;
    map.set(word, count + 1);
  }
  let counts = new Array(words.length + 1).fill(0).map((_) => []);
  for (let key of map.keys()) {
    let count = map.get(key);
    counts[count].push(key);
  }
  let res = [];
  for (let i = counts.length - 1; i >= 0; i--) {
    if (counts[i].length > 0) {
      res.push(...counts[i].sort());
      if (res.length >= k) {
        break;
      }
    }
  }
  return res.slice(0, k);
};

解法二

/**
 * @param {string[]} words
 * @param {number} k
 * @return {string[]}
 */
var topKFrequent = function (words, k) {
  const map = new Map();
  for (let word of words) {
    let count = map.get(word) || 0;
    map.set(word, count + 1);
  }
  let res = [];
  const compare = (key1, key2) => {
    if (key2 === undefined) return false;
    let c1 = map.get(key1);
    let c2 = map.get(key2);
    return c1 > c2 || (c1 == c2 && key1 < key2);
  };
  const bf = (key) => {
    let l = 0;
    let r = res.length - 1;
    while (l <= r) {
      const m = (l + r) >> 1;
      if (compare(key, res[m])) {
        r = m - 1;
      } else {
        l = m + 1;
      }
    }
    return l;
  };
  for (let key of map.keys()) {
    let idx = bf(key);
    res.splice(idx, 0, key);
    if (res.length > k) {
      res.pop();
    }
  }
  return res;
};