持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第18天,点击查看活动详情
题目(H-Index)
链接:https://leetcode-cn.com/problems/h-index
解决数:710
通过率:44.4%
标签:数组 计数排序 排序
相关公司:google amazon goldman-sachs
给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数。计算并返回该研究者的 **h 指数。
根据维基百科上 h 指数的定义:h 代表“高引用次数”,一名科研人员的 h指数是指他(她)的 (n 篇论文中)总共有 h 篇论文分别被引用了至少 h 次。且其余的 n - h 篇论文每篇被引用次数 不超过 h 次。
如果 h 有多种可能的值,h 指数** 是其中最大的那个。
示例 1:
输入: citations = [3,0,6,1,5]
输出: 3
解释: 给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5 次。
由于研究者有 3 篇论文每篇 至少 被引用了 3 次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3。
示例 2:
输入: citations = [1,3,1]
输出: 1
提示:
n == citations.length1 <= n <= 50000 <= citations[i] <= 1000
思路
1. 排序:快排 或 桶排序
根据题意可知,对数组 citations 进行升序排序后,下标为 i 的数组元素最大 h 指数计算方式为:
h = citations.length -i
需要满足限制:
citations[i] >= h
即:
citations[i] >= citations.length - i
排序可以选择快排或者桶排序
快排时间复杂度为 O (nlogn) ,空间复杂度为 O(1),对于任何数据适用
桶排序时间复杂度为 O(n) , 空间复杂度为 O(n),适用条件 citations[i] <= citations.length
2. 查找:二分查找
对于排序数组的遍历可以选择从左到右逐个遍历或者二分查找
- 从左到右遍历
排序部分时间复杂度最小为 O(n) ,因此查找算法不影响最终的时间复杂度,可以选择从左到右逐个遍历 - 二分查找
二分查找目标是查找后半段的左边界
后半段的性质为:citations[i] >= citations.length - i
复杂度分析
时间复杂度: O(n) 或 O(nlogn)
空间复杂度: O(n) 或 O(1)
n 为数组长度,时间复杂度和空间复杂度大小取决于排序算法的选择
代码
/**
* lc-274. H-Index
* Read the question: citations[i] >= citations.length - i
* Solution: Sort + Binary Search
* Time complexity: O(nlogn) || O(n)
* Space complexity: O(1) || O(n)
* @param {number[]} citations
* @return {number}
*/
var hIndex = function (citations) {
// sort: quickSort or bucketSort
citations.sort((a, b) => a - b);
// left boundary of 2nd half: citations[i] >= citations.length - i
let l = 0,
r = citations.length - 1;
while (l < r) {
let m = l + r >> 1;
if (citations[m] >= citations.length - m) r = m;
else l = m + 1;
}
let h = citations.length - l;
return citations[l] >= h ? h : 0;
};