算法:前K个高频单词(多条件排序案例)

335 阅读2分钟

前K个高频单词

这是我参与2022首次更文挑战的第26天,活动详情查看:2022首次更文挑战」。

正文

前K个高频单词

给定一个单词列表 words 和一个整数 k ,返回前 k **个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序。

示例 1:

输入: words = ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i""love" 为出现次数最多的两个单词,均为2次。
    注意,按字母顺序 "i""love" 之前。

示例 2:

输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny""day" 是出现次数最多的四个单词,
    出现次数依次为 4, 3, 21 次。

解析

1. 抽取解题关键点

依题而看应该是一个排序的沿伸算法。本题的关键点在于:

  1. 出现频率最高的词: 出现频率排序。

  2. 字母遍历排序

  3. 长度排序

出现频率排序: 这个比较好理解,就是出现次数最多的排在最前面,以此类推。

字母遍历排序: 假设首字母相同,那么就比较第二个字母,以此类推,值得注意的是:字母排序比较的是ACS码

长度排序: 如果出现的频率和字母都完全相同,那么长度较短的排在最前面。

2. 建立排序条件

单纯的字符串数组是不好进行频率排序的,因为你并不知道他出现了多少次,最好的方法就是统计出现次数,然后封装成对象,次数为排序条件。

const map = {}
    for (let index = 0 ; index < words.length ; index++) {
        let mapStrObj = map[words[index]]
        map[words[index]] = mapStrObj ?  mapStrObj + 1 : 1  
    }
    // 转数组
    const list = []
    for (let key in map) {
        const count = map[key]
        list.push({key, count})
    }

对象中的 count 就是出现频率,即为数组排序条件。

3. 实现多条件排序

return list.sort(function (a, b) {
        if (a.count != b.count) {
            return b.count - a.count; // 频率排序
        }
        let index = 0
        while(a.key[index] && b.key[index]) { // 遍历排序
            if ( a.key[index].charCodeAt() != b.key[index].charCodeAt()) {
              return a.key[index].charCodeAt()- b.key[index].charCodeAt();
            }
            index++
        }
        return a.key.length - b.key.length // 长度排序
    }).slice(0,k).map(item => item.key)

完整代码

/**
 * @param {string[]} words
 * @param {number} k
 * @return {string[]}
 */
var topKFrequent = function(words, k) {
    const map = {}
    for (let index = 0 ; index < words.length ; index++) {
        let mapStrObj = map[words[index]]
        map[words[index]] = mapStrObj ?  mapStrObj + 1 : 1  
    }
    // 转数组
    const list = []
    for (let key in map) {
        const count = map[key]
        list.push({key, count})
    }
    return list.sort(function (a, b) {
        if (a.count != b.count) {
            return b.count - a.count;
        }
        let index = 0
        while(a.key[index] && b.key[index]) {
            if ( a.key[index].charCodeAt() != b.key[index].charCodeAt()) {
              return a.key[index].charCodeAt()- b.key[index].charCodeAt();
            }
            index++
        }
        return a.key.length - b.key.length
    }).slice(0,k).map(item => item.key)
    
};

提交结果:

image.png