【路飞】算法与数据结构-H 指数

924 阅读1分钟

不管全世界所有人怎么说,我都认为自己的感受才是正确的。无论别人怎么看,我绝不打乱自己的节奏。喜欢的事自然可以坚持,不喜欢的怎么也长久不了。

LeetCode:原题地址

题目要求

给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数。计算并返回该研究者的 h 指数。

根据维基百科上 h 指数的定义:h 代表“高引用次数”,一名科研人员的 h指数是指他(她)的 (n 篇论文中)总共有 h 篇论文分别被引用了至少 h 次。且其余的 n - h 篇论文每篇被引用次数 不超过 h 次。

如果 h 有多种可能的值,h 指数 是其中最大的那个。

示例 1:

输入:citations = [3,0,6,1,5]
输出:3 
解释:给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5 次。
     由于研究者有 3 篇论文每篇 至少 被引用了 3 次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3。

示例 2:

输入: citations = [1,3,1]
输出: 1

提示:

  • n == citations.length
  • 1 <= n <= 5000
  • 0 <= citations[i] <= 1000

思路

排序:快排 或 桶排序

  • 根据题意可知,对数组 citations 进行升序排序后,下标为 i 的数组元素最大 h 指数计算方式为:h = citations.length -i
  • 需要满足限制:citations[i] >= h
  • 即: citations[i] >= citations.length - i
  • 排序可以选择快排或者桶排序
  • 快排时间复杂度为 O (nlogn) ,空间复杂度为 O(1),对于任何数据适用
  • 桶排序时间复杂度为 O(n) , 空间复杂度为 O(n),适用条件 citations[i] <= citations.length

查找:二分查找

  • 对于排序数组的遍历可以选择从左到右逐个遍历或者二分查找
  • 从左到右遍历
  • 排序部分时间复杂度最小为 O(n) ,因此查找算法不影响最终的时间复杂度,可以选择从左到右逐个遍历
  • 二分查找
  • 二分查找目标是查找后半段的左边界
  • 后半段的性质为:citations[i] >= citations.length - i
var hIndex = function (citations) {
    citations.sort((a, b) => a - b);
    let l = 0,
        r = citations.length - 1;
    while (l < r) {
        let m = l + r >> 1;
        if (citations[m] >= citations.length - m) r = m;
        else l = m + 1;
    }

    let h = citations.length - l;
    return citations[l] >= h ? h : 0;
};