前K个高频单词
这是我参与2022首次更文挑战的第26天,活动详情查看:2022首次更文挑战」。
正文
前K个高频单词
给定一个单词列表 words
和一个整数 k
,返回前 k
**个出现次数最多的单词。
返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序。
示例 1:
输入: words = ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i" 和 "love" 为出现次数最多的两个单词,均为2次。
注意,按字母顺序 "i" 在 "love" 之前。
示例 2:
输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词,
出现次数依次为 4, 3, 2 和 1 次。
解析
1. 抽取解题关键点
依题而看应该是一个排序的沿伸算法。本题的关键点在于:
-
出现频率最高的词: 出现频率排序。
-
字母遍历排序
-
长度排序
出现频率排序
: 这个比较好理解,就是出现次数最多的排在最前面,以此类推。
字母遍历排序
: 假设首字母相同,那么就比较第二个字母,以此类推,值得注意的是:字母排序比较的是ACS码
长度排序
: 如果出现的频率和字母都完全相同,那么长度较短的排在最前面。
2. 建立排序条件
单纯的字符串数组是不好进行频率排序的,因为你并不知道他出现了多少次,最好的方法就是统计出现次数,然后封装成对象,次数为排序条件。
const map = {}
for (let index = 0 ; index < words.length ; index++) {
let mapStrObj = map[words[index]]
map[words[index]] = mapStrObj ? mapStrObj + 1 : 1
}
// 转数组
const list = []
for (let key in map) {
const count = map[key]
list.push({key, count})
}
对象中的 count 就是出现频率,即为数组排序条件。
3. 实现多条件排序
return list.sort(function (a, b) {
if (a.count != b.count) {
return b.count - a.count; // 频率排序
}
let index = 0
while(a.key[index] && b.key[index]) { // 遍历排序
if ( a.key[index].charCodeAt() != b.key[index].charCodeAt()) {
return a.key[index].charCodeAt()- b.key[index].charCodeAt();
}
index++
}
return a.key.length - b.key.length // 长度排序
}).slice(0,k).map(item => item.key)
完整代码
/**
* @param {string[]} words
* @param {number} k
* @return {string[]}
*/
var topKFrequent = function(words, k) {
const map = {}
for (let index = 0 ; index < words.length ; index++) {
let mapStrObj = map[words[index]]
map[words[index]] = mapStrObj ? mapStrObj + 1 : 1
}
// 转数组
const list = []
for (let key in map) {
const count = map[key]
list.push({key, count})
}
return list.sort(function (a, b) {
if (a.count != b.count) {
return b.count - a.count;
}
let index = 0
while(a.key[index] && b.key[index]) {
if ( a.key[index].charCodeAt() != b.key[index].charCodeAt()) {
return a.key[index].charCodeAt()- b.key[index].charCodeAt();
}
index++
}
return a.key.length - b.key.length
}).slice(0,k).map(item => item.key)
};
提交结果: