LeetCode 295 - 数据流的中位数

129 阅读1分钟

中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

void addNum(int num) - 从数据流中添加一个整数到数据结构中。 double findMedian() - 返回目前所有元素的中位数。

示例:

addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3) 
findMedian() -> 2

进阶:

如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法? 如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?

思路

该题使用一个大顶堆,一个小顶堆完成。

  • 大顶堆的每个节点的值大于等于左右孩子节点的值,堆顶为最大值。
  • 小顶堆的每个节点的值小于等于左右孩子节点的值,堆顶为最小值。
  • 我们使用 大顶堆(maxHeap)  来存储数据流中较小一半的值,用 小顶堆(minHeap)  来存储数据流中较大一半的值。
  • 根据堆的性质,可以判断两个堆的值从下往上递增,即:
    maxHeap堆底 <= maxHeap堆顶 <= minHeap堆顶 <= minHeap堆底
  • 数据流为偶数时,两堆大小相等,先将新元素插入maxHeap,重新排序后将新的最值拿出并插入到minHeap。
  • 数据流为奇数时,两堆大小不等,先将新元素插入minHeap,重新排序后将新的最值拿出并插入到maxHeap。
  • 数据流为偶数时,两个堆的大小相等,两个堆的堆顶相加除二就是中位数。
  • 数据流为奇数时,两个堆的大小相差1,那么长度较大的堆的堆顶就是中位数。
class MedianFinder {
    // 大顶堆存储较小一半的值
    PriorityQueue<Integer> maxHeap;
    // 小顶堆存储较大一的值
    PriorityQueue<Integer> minHeap;
    /** initialize your data structure here. */
    public MedianFinder() {
        maxHeap = new PriorityQueue<Integer>((x, y) -> (y - x));
        minHeap = new PriorityQueue<Integer>();
    }
    
    public void addNum(int num) {
        // 长度为奇数时先放入小顶堆,重新排序后在插入到大顶堆
        if(maxHeap.size() != minHeap.size()) {
            minHeap.add(num);
            maxHeap.add(minHeap.poll());
        } else {
            // 长度为偶数时先放入大顶堆,重新排序后在插入到小顶堆
            maxHeap.add(num);
            minHeap.add(maxHeap.poll());
        }
    }
    
    public double findMedian() {
        if(maxHeap.size() != minHeap.size()) {
            return minHeap.peek();
        } else {
            return (maxHeap.peek() + minHeap.peek()) / 2.0;
        }
    }
}