「前端刷题」274.H 指数(MEDIUM)

171 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第18天,点击查看活动详情

题目(H-Index)

链接:https://leetcode-cn.com/problems/h-index
解决数:710
通过率:44.4%
标签:数组 计数排序 排序 
相关公司:google amazon goldman-sachs 

给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数。计算并返回该研究者的 **h 指数

根据维基百科上 h 指数的定义:h 代表“高引用次数”,一名科研人员的 h指数是指他(她)的 (n 篇论文中)总共有 h 篇论文分别被引用了至少 h 次。且其余的 n - h 篇论文每篇被引用次数 不超过 h 次。

如果 h 有多种可能的值,h 指数** 是其中最大的那个。

 

示例 1:

输入: citations = [3,0,6,1,5]
输出: 3 
解释: 给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5 次。
     由于研究者有 3 篇论文每篇 至少 被引用了 3 次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3。

示例 2:

输入: citations = [1,3,1]
输出: 1

 

提示:

  • n == citations.length
  • 1 <= n <= 5000
  • 0 <= citations[i] <= 1000

思路

1. 排序:快排 或 桶排序

根据题意可知,对数组 citations 进行升序排序后,下标为 i 的数组元素最大 h 指数计算方式为:
h = citations.length -i
需要满足限制:
citations[i] >= h
即:
citations[i] >= citations.length - i
排序可以选择快排或者桶排序
快排时间复杂度为 O (nlogn) ,空间复杂度为 O(1),对于任何数据适用
桶排序时间复杂度为 O(n) , 空间复杂度为 O(n),适用条件 citations[i] <= citations.length

2. 查找:二分查找

对于排序数组的遍历可以选择从左到右逐个遍历或者二分查找

  1. 从左到右遍历
    排序部分时间复杂度最小为 O(n) ,因此查找算法不影响最终的时间复杂度,可以选择从左到右逐个遍历
  2. 二分查找
    二分查找目标是查找后半段的左边界
    后半段的性质为:citations[i] >= citations.length - i

复杂度分析

时间复杂度: O(n) 或 O(nlogn)
空间复杂度: O(n) 或 O(1)
n 为数组长度,时间复杂度和空间复杂度大小取决于排序算法的选择

代码


/**
 * lc-274. H-Index
 * Read the question: citations[i] >= citations.length - i
 * Solution: Sort + Binary Search
 * Time complexity: O(nlogn) || O(n)
 * Space complexity: O(1) || O(n)
 * @param {number[]} citations
 * @return {number}
 */
var hIndex = function (citations) {
    // sort: quickSort or bucketSort
    citations.sort((a, b) => a - b);

    // left boundary of 2nd half: citations[i] >= citations.length - i
    let l = 0,
        r = citations.length - 1;
    while (l < r) {
        let m = l + r >> 1;
        if (citations[m] >= citations.length - m) r = m;
        else l = m + 1;
    }

    let h = citations.length - l;
    return citations[l] >= h ? h : 0;
};