数据结构- PriorityQueue

266 阅读4分钟

PriorityQueue

what

PriorityQueue是Java中优先队列的实现。优先队列的作用是能保证每次取出的元素都是队列中权值最小的(Java的优先队列每次取最小元素,C++的优先队列每次取最大元素)。这里牵涉到了大小关系,元素大小的评判可以通过元素本身的自然顺序(natural ordering),也可以通过构造时传入的比较器(Comparator,类似于C++的仿函数) Java中PriorityQueue实现了Queue接口,不允许放入null元素;其通过堆实现,具体说是通过完全二叉树(complete binary tree)实现的小顶堆(任意一个非叶子节点的权值,都不大于其左右子节点的权值),也就意味着可以通过数组来作为PriorityQueue的底层实现 主要存储结构如下

image.png

通过上面 我们能发现节点的规律

更确切的说父子节点的编号之间有如下关系:

leftNo = parentNo*2+1

rightNo = parentNo*2+2

parentNo = (nodeNo-1)/2

通过上述三个公式,可以轻易计算出某个节点的父节点以及子节点的下标。这也就是为什么可以直接用数组来存储堆的原因。

PriorityQueue的peek()和element操作是常数时间,add(),offer(), 无参数的remove()以及poll()方法的时间复杂度都是log(N)。

主要方法

add()和offer()

add(E e)和offer(E e)的语义相同,都是向优先队列中插入元素,只是Queue接口规定二者对插入失败时的处理不同,前者在插入失败时抛出异常,后则则会返回false。对于PriorityQueue这两个方法其实没什么差别。


if (e == null)//不允许放入null元素

throw new NullPointerException();

modCount++;

int i = size;

if (i >= queue.length)

grow(i + 1);//自动扩容

size = i + 1;

if (i == 0)//队列原来为空,这是插入的第一个元素

queue[0] = e;

else

siftUp(i, e);//调整

return true;

}

上述代码中,扩容函数grow()类似于ArrayList里的grow()函数,就是再申请一个更大的数组,并将原数组的元素复制过去,这里不再赘述。需要注意的是siftUp(int k, E x)方法,该方法用于插入元素x并维持堆的特性。


while (k > 0) {

int parent = (k - 1) >>> 1;//parentNo = (nodeNo-1)/2

Object e = queue[parent];

if (comparator.compare(x, (E) e) >= 0)//调用比较器的比较方法

break;

queue[k] = e;

k = parent;

}

queue[k] = x;

}

通过上面代码可以指定siftUp 主要是通过查找上层父节点进行比较 直到满足x >= queue[parent] 并进行交换调整

image.png

element()和peek()

element()和peek()的语义完全相同,都是获取但不删除队首元素,也就是队列中权值最小的那个元素,二者唯一的区别是当方法失败时前者抛出异常,后者返回null。根据小顶堆的性质,堆顶那个元素就是全局最小的那个;由于堆用数组表示,根据下标关系,0下标处的那个元素既是堆顶元素。所以直接返回数组0下标处的那个元素即可。

remove()和poll()

remove()和poll()方法的语义也完全相同,都是获取并删除队首元素,区别是当方法失败时前者抛出异常,后者返回null。由于删除操作会改变队列的结构,为维护小顶堆的性质,需要进行必要的调整。


if (size == 0)

return null;

int s = --size;

modCount++;

E result = (E) queue[0];//0下标处的那个元素就是最小的那个

E x = (E) queue[s];

queue[s] = null;

if (s != 0)

siftDown(0, x);//调整

return result;

}

主要思路 首先记录0下标处的元素,并用最后一个元素替换0下标位置的元素,之后调用siftDown()方法对堆进行调整,最后返回原来0下标处的那个元素(也就是最小的那个元素)。重点是siftDown(int k, E x)方法,该方法的作用是从k指定的位置开始,将x逐层向下与当前点的左右孩子中较小的那个交换,直到x小于或等于左右孩子中的任何一个为止。


private void siftDown(int k, E x) {

int half = size >>> 1;

while (k < half) {

//首先找到左右孩子中较小的那个,记录到c里,并用child记录其下标

int child = (k << 1) + 1;//leftNo = parentNo*2+1

Object c = queue[child];

int right = child + 1;

if (right < size &&

comparator.compare((E) c, (E) queue[right]) > 0)

c = queue[child = right];

if (comparator.compare(x, (E) c) <= 0)

break;

queue[k] = c;//然后用c取代原来的值

k = child;

}

queue[k] = x;

}

image.png

remove(Object o)

remove(Object o)方法用于删除队列中跟o相等的某一个元素(如果有多个相等,只删除一个),该方法不是Queue接口内的方法,而是Collection接口的方法。由于删除操作会改变队列结构,所以要进行调整;又由于删除元素的位置可能是任意的,所以调整过程比其它函数稍加繁琐。具体来说,remove(Object o)可以分为3种情况:1. 删除的是最后一个元素。直接删除即可,不需要调整。2. 删除的不是最后一个元素,从删除点开始以最后一个元素为参照调用一次siftDown()即可 3向下沉淀完发现没变化则需要向上浮动,说明最后一个元素换到 i 位置后是最小元素

        E removeAt ( int i )
        {
            // assert i >= 0 && i < size;
            modCount++;
            int s = --size;
            if (s == i) // removed last element
                queue[i] = null;
                //如果要删除的元素恰巧在最后一个则直接删除不用调整
            else {
                //取出二叉堆树的最后一个节点元素
                E moved = (E) queue[s];
                //最后一个节点置为空
                queue[s] = null;
                //然后类似poll进行siftDown向下子节点比较交换(从i位置当做顶层父节点)
                siftDown(i, moved);
                // 向下沉淀完发现没变化则需要向上浮动,说明最后一个元素换到 i 位置后是最小元素
                if (queue[i] == moved) {
                    siftUp(i, moved);
                    if (queue[i] != moved) return moved;
                }
            }
            return null;

        }

日常使用

1算法 查找topk元素

2 合并 k 个有序链表的逻辑类似合并两个有序链表,难点在于,如何快速得到 k 个节点中的最小节点,接到结果链表上?

就要用到 [优先级队列(二叉堆)] 这种数据结构,把链表节点放入一个最小堆