刷题: 数据流中的中位数

187 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第24天,点击查看活动详情

题目来源:剑指 Offer 41. 数据流中的中位数

题目:

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

void addNum(int num) - 从数据流中添加一个整数到数据结构中。

double findMedian() - 返回目前所有元素的中位数。

示例 1:

输入:["MedianFinder","addNum","addNum","findMedian","addNum","findMedian"]

[[],[1],[2],[],[3],[]]

输出:[null,null,null,1.50000,null,2.00000]

示例 2:

输入:["MedianFinder","addNum","findMedian","addNum","findMedian"]

[[],[2],[],[3],[]]

输出:[null,null,2.00000,null,2.50000]  

限制:

最多会对 addNum、findMedian 进行 50000 次调用。

思路分析:

题目要求得到一个数据流排序后的中位数,数据流是动态的,且数据量可能会比较大,因此对数据流排序后求中位数是不可行的。

要求中位数的话,那么分别用两个堆:大根堆用于记录小于等于中位数的数字,小根堆用于记录大于中位数的数字。且规定:当元素总数为偶数时,大根堆和小跟堆中的元素个数相等,当元素总数为奇数时,大根堆的元素个数比小跟堆多一个。

这样一来,如果元素总数为奇数,那么答案就是 大根堆 的堆顶元素;如果元素总数为偶数,那么答案就是大根堆和小跟堆的堆顶元素的平均值。

AC代码:

class MedianFinder {
public:
    priority_queue<int> small;
    priority_queue<int, vector<int>, greater<int> > big;
    int n;
    MedianFinder() {
        n = 0;
    }
    void addNum(int num) {
        if(small.empty()){
            small.push(num);
            n++;
            return;
        }
        if(num<=small.top()){
            small.push(num);
            n++;
        }
        else{
            big.push(num);
            n++;
        }
        if(small.size()-big.size()==2){
            big.push(small.top());
            small.pop();
        }
        if(big.size()-small.size()==2){
            small.push(big.top());
            big.pop();
        }
    }
    
    double findMedian() {
        if(n%2){
            if(small.size()>big.size())
                return small.top();
            return big.top();
        }
        else{
            return ((long long)small.top() + big.top()) * 0.5;
        }
    }
};

image.png