这是我参与8月更文挑战的第5天,活动详情查看:8月更文挑战
如何理解“堆”?
堆是一种特殊的树。满足两点要求。
- 堆是一个完全二叉树; 完全二叉树要求,除了最后一次,其他层的节点个数都是满的,最后一层的节点都靠左排列。
- 堆中每一个节点的值都必须大于等于(小于等于)其子树中每个节点的值。 换种说法就是,堆中每个节点的值大于等于(或者小于等于)其左右子节点的值。 对于每个节点的值都大于等于子树中每个节点值的堆,我们叫作“大顶堆”。对于每个节点的值都小于等于子树中每个节点值的堆,我们叫作“小顶堆”。
图中1 ,2为大顶堆,图中 3 为小顶堆,图中 4不为堆。
如何实现一个堆?
堆中插入元素:将元素插入到堆的最后。然后从下向上进行堆化(不断的与父节点比较然后交换)。
public class Heap {
private int[] a; // 数组,从下标 1 开始存储数据
private int n; // 堆可以存储的最大数据个数
private int count; // 堆中已经存储的数据个数
public Heap(int capacity) {
a = new int[capacity + 1];
n = capacity;
count = 0;
}
public void insert(int data) {
if (count >= n) return; // 堆满了
++count;
a[count] = data;
int i = count;
while (i/2 > 0 && a[i] > a[i/2]) { // 自下往上堆化
swap(a, i, i/2); // swap() 函数作用:交换下标为 i 和 i/2 的两个元素
i = i/2;
}
}
}
删除堆顶元素:将树的最后一个元素替换掉最大的节点(即根节点),然后从上往下进行堆化(不断的与子节点进行比较然后交换)。
public void removeMax() {
if (count == 0) return -1; // 堆中没有数据
a[1] = a[count];
--count;
heapify(a, count, 1);
}
private void heapify(int[] a, int n, int i) { // 自上往下堆化
while (true) {
int maxPos = i;
if (i*2 <= n && a[i] < a[i*2]) maxPos = i*2;
if (i*2+1 <= n && a[maxPos] < a[i*2+1]) maxPos = i*2+1;
if (maxPos == i) break;
swap(a, i, maxPos);
i = maxPos;
}
}
我们知道树的高度不会超过logn,所以堆化是和树的高度成正比,即插入和删除的时间复杂度都是O(logn)。
堆的应用一:优先级队列
将优先级的之分的数据存入堆中(小顶堆或者大顶堆),堆顶即优先级最搞的数据,当需要的时候直接取堆顶,然后堆顶补充下一优先级数据,由于堆堆顶插入或者删除数据时间复杂度都是O(logn),所以效率很高。
- 合并有序小文件 加入由100个小文件,每个文件中存放的都是一些有序的字符串片段,如果要合并成一个大文件,用常规的数组取字符串需要遍历整个数组,若将从小文件中取出来的字符串放到小顶堆中,每次取堆顶字符串然后删除,效率提高。
- 高性能定时器 我们按照任务设定的执行时间,将这些任务存储在优选级队列中,队列首部(也就是小顶堆的堆顶)存储的是最先执行的任务。
堆的应用二:利用堆求Top k
我们可以维护一个大小为K的小顶堆,顺序遍历数组,从数组中取出取数据与堆顶元素比较。如果比堆顶元素大,我们就把堆顶元素删除,并且将这个元素插入到堆中;如果比堆顶元素小,则不做处理,继续遍历数组。这样等数组中的数据都遍历完之后,堆中的数据就是前K 大数据了。
堆的应用三:利用堆求中位数
我们需要维护两个堆,一个大顶堆,一个小顶堆。大顶堆中存储前半部分数据,小顶堆中存储后半部分数据,且小顶堆中的数据都大于大顶堆中的数据。