中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。 double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
进阶:
如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法? 如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
思路
该题使用一个大顶堆,一个小顶堆完成。
- 大顶堆的每个节点的值大于等于左右孩子节点的值,堆顶为最大值。
- 小顶堆的每个节点的值小于等于左右孩子节点的值,堆顶为最小值。
- 我们使用 大顶堆(maxHeap) 来存储数据流中较小一半的值,用 小顶堆(minHeap) 来存储数据流中较大一半的值。
- 根据堆的性质,可以判断两个堆的值从下往上递增,即:
maxHeap堆底 <= maxHeap堆顶 <= minHeap堆顶 <= minHeap堆底 - 数据流为偶数时,两堆大小相等,先将新元素插入maxHeap,重新排序后将新的最值拿出并插入到minHeap。
- 数据流为奇数时,两堆大小不等,先将新元素插入minHeap,重新排序后将新的最值拿出并插入到maxHeap。
- 数据流为偶数时,两个堆的大小相等,两个堆的堆顶相加除二就是中位数。
- 数据流为奇数时,两个堆的大小相差1,那么长度较大的堆的堆顶就是中位数。
class MedianFinder {
// 大顶堆存储较小一半的值
PriorityQueue<Integer> maxHeap;
// 小顶堆存储较大一的值
PriorityQueue<Integer> minHeap;
/** initialize your data structure here. */
public MedianFinder() {
maxHeap = new PriorityQueue<Integer>((x, y) -> (y - x));
minHeap = new PriorityQueue<Integer>();
}
public void addNum(int num) {
// 长度为奇数时先放入小顶堆,重新排序后在插入到大顶堆
if(maxHeap.size() != minHeap.size()) {
minHeap.add(num);
maxHeap.add(minHeap.poll());
} else {
// 长度为偶数时先放入大顶堆,重新排序后在插入到小顶堆
maxHeap.add(num);
minHeap.add(maxHeap.poll());
}
}
public double findMedian() {
if(maxHeap.size() != minHeap.size()) {
return minHeap.peek();
} else {
return (maxHeap.peek() + minHeap.peek()) / 2.0;
}
}
}