在N个元素中选出前M个元素,且M远小于N。
如,在100万个元素中选出前100名。
如果用排序,最多优化到nlogn的复杂度,这个复杂度也还能接受。
但是如果用优先队列就可以在nlogm的复杂度完成,由于m远小于n所以这个复杂度会比nlogn小很多。
思路:使用优先队列,维护当前看到的前m个元素。对n个元素进行遍历,首先将前m个元素放进优先队列中,之后每次看到一个新的元素,如果这个新元素比当前队列中最小的元素大就将最小的元素换成这个元素,这里需要使用最小堆,因为我们需要快速取出队列中的最小值。其实用最大堆也可以实现,我们可以把优先级定义成越小的元素优先级越高。
LeetCode中的练习题
347.前K个高频元素
给定一个非空的整数数组,返回其中出现频率前 k 高的元素。
示例 1:
输入: nums = [1,1,1,2,2,3], k = 2
输出: [1,2]
示例 2:
输入: nums = [1], k = 1
输出: [1]
说明:
- 你可以假设给定的 k 总是合理的,且 1 ≤ k ≤ 数组中不相同的元素的个数。
- 你的算法的时间复杂度必须优于 O(n log n) , n 是数组的大小。
思路:
典型的优先队列问题,在优先队列的基础上多了一个统计每个元素频率的操作,这个操作在之前的二分搜索树的练习题中做过,我们可以使用TreeMap来统计每个元素的频率。然后根据频率设定优先级,频率高的优先级低(因为每次要获取队列中频率最低的元素),这样遍历一遍整个map再把结果封装成List即可。
代码:
class Solution {
private class Array<E> {
private E[] data;
private int size;
/**
* 构造函数,传入数组的容量capacity构造Array
* @param capacity
*/
public Array(int capacity){
data = (E[]) new Object[capacity];
size = 0;
}
/**
* 无参构造函数,默认数组的容量capacity = 10
*/
public Array(){
this(10);
}
public Array(E[] arr){
data = (E[])new Object[arr.length];
for (int i = 0; i < arr.length; i++){
data[i] = arr[i];
}
size = arr.length;
}
/**
* 获取数组元素个数
* @return
*/
public int getSize(){
return size;
}
/**
* 获取数组容量
* @return
*/
public int getCapacity(){
return data.length;
}
/**
* 返回数组是否为空
* @return
*/
public boolean isEmpty(){
return size == 0;
}
/**
* 在所有元素后添加一个元素
* @param e
*/
public void addLast(E e){
if (size == data.length){
resize(2 * data.length);
}
data[size] = e;
size++;
}
/**
* 在第index位置插入一个新元素e
* @param index
* @param e
*/
public void add(int index, E e){
if (size == data.length){
resize(2 * data.length);
}
if (index < 0 || index > size){
throw new IllegalArgumentException("Add failed. Require index >= 0 and <= size.");
}
for (int i = size - 1; i >= index; i--){
data[i+1] = data[i];
}
data[index] = e;
size++;
}
/**
* 获取index索引位置的元素
* @param index
* @return
*/
public E get(int index){
if (index < 0 || index >= size){
throw new IllegalArgumentException("Get failed. Index is illegal.");
}
return data[index];
}
public E getLast(){
return get(size - 1);
}
public E getFirst(){
return get(0);
}
/**
* 修改index索引位置元素为e
* @param index
* @param e
*/
void set(int index, E e){
if (index < 0 || index >= size){
throw new IllegalArgumentException("Get failed. Index is illegal.");
}
data[index] = e;
}
/**
* 查找数组中是否有元素e
* @param e
* @return
*/
public boolean contains(E e){
for (int i = 0; i < size; i++){
if (data[i].equals(e)){
return true;
}
}
return false;
}
/**
* 查找数组中元素e所在索引,不存在返回-1
* @param e
* @return
*/
public int find(E e){
for (int i = 0; i < size; i++){
if (data[i].equals(e)){
return i;
}
}
return -1;
}
/**
* 删除index位置的元素,返回删除的元素
* @param index
* @return
*/
public E remove(int index){
if (index < 0 || index >= size){
throw new IllegalArgumentException("Remove failed. Index is illegal.");
}
E ret = data[index];
for (int i = index + 1; i < size; i++){
data[i - 1] = data[i];
}
size--;
if (size == data.length / 2){
resize(data.length / 2);
}
return ret;
}
/**
* 删除数组第一个元素
* @return
*/
public E removeFirst(){
return remove(0);
}
/**
* 删除数组最后一个元素
* @return
*/
public E removeLast(){
return remove(size - 1);
}
/**
* 从数组中删除元素e
* @param e
*/
public void removeElement(E e){
int index = find(e);
if (index != -1){
remove(index);
}
}
@Override
public String toString(){
StringBuilder res = new StringBuilder();
res.append(String.format("Array: size = %d , capacity = %d\n", size, data.length));
res.append('[');
for (int i = 0; i < size; i++){
res.append(data[i]);
if (i != size - 1){
res.append(",");
}
}
res.append(']');
return res.toString();
}
/**
* 实现动态数组扩容的方法
* @param newCapacity
*/
private void resize(int newCapacity){
E[] newData = (E[]) new Object[newCapacity];
for (int i = 0; i < size; i++){
newData[i] = data[i];
}
data = newData;
}
public void swap(int i, int j){
if (i < 0 || i >= size || j < 0 || j >= size){
throw new IllegalArgumentException("Index is illegal.");
}
E t = data[i];
data[i] = data[j];
data[j] = t;
}
}
private class MaxHeap<E extends Comparable<E>> {
private Array<E> data;
public MaxHeap(int capacity){
data = new Array<>(capacity);
}
public MaxHeap(){
data = new Array<>();
}
public MaxHeap(E[] arr){
data = new Array<>();
for(int i = parent(arr.length - 1); i >= 0; i--){
siftDown(i);
}
}
public int size() {
return data.getSize();
}
public boolean isEmpty(){
return data.isEmpty();
}
/**
* 返回完全二叉树的数组表示中,一个索引表示的元素的父亲节点的索引
* @param index
* @return
*/
private int parent(int index){
if (index == 0){
throw new IllegalArgumentException("index-0 doesn't have parent");
}
return (index - 1) / 2;
}
/**
* 返回完全二叉树的数组表示中,一个索引表示的元素的左孩子节点的索引
* @param index
* @return
*/
private int leftChild(int index){
return index * 2 + 1;
}
/**
* 返回完全二叉树的数组表示中,一个索引表示的元素的右孩子节点的索引
* @param index
* @return
*/
private int rightChild(int index){
return index * 2 + 2;
}
/**
* 向堆中添加元素
* @param e
*/
public void add(E e){
data.addLast(e);
siftUp(data.getSize() - 1);
}
private void siftUp(int k){
while(k > 0 && data.get(parent(k)).compareTo(data.get(k)) < 0){
data.swap(k, parent(k));
k = parent(k);
}
}
/**
* 看堆中最大元素
* @return
*/
public E findMax() {
if (data.getSize() == 0){
throw new IllegalArgumentException("heap is empty!");
}
return data.get(0);
}
/**
* 取出堆中最大元素
* @return
*/
public E extraMax(){
E ret = findMax();
data.swap(0, data.getSize() - 1);
data.removeLast();
siftDown(0);
return ret;
}
private void siftDown(int k){
while (leftChild(k) < data.getSize()){
int j = leftChild(k);
if (j + 1 < data.getSize() && data.get(j + 1).compareTo(data.get(j)) > 0){
j = rightChild(k);
}
//此时data[j] 是左右孩子中的最大值
if (data.get(k).compareTo(data.get(j)) >= 0){
break;
}
data.swap(k, j);
k = j;
}
}
/**
* 取出堆中最大元素, 并且替换成元素e
* @param e
* @return
*/
public E replace(E e){
E ret = findMax();
data.set(0, e);
siftDown(0);
return ret;
}
}
private interface Queue<E> {
int getSize();
boolean isEmpty();
void enqueue(E e);
E dequeue();
E getFront();
}
private class PriorityQueue<E extends Comparable<E>> implements Queue<E> {
private MaxHeap<E> maxHeap;
public PriorityQueue(){
maxHeap = new MaxHeap<>();
}
@Override
public int getSize() {
return maxHeap.size();
}
@Override
public boolean isEmpty() {
return maxHeap.isEmpty();
}
@Override
public void enqueue(E e) {
maxHeap.add(e);
}
@Override
public E dequeue() {
return maxHeap.extraMax();
}
@Override
public E getFront() {
return maxHeap.findMax();
}
}
private class Freq implements Comparable<Freq> {
int e, freq;
public Freq(int e, int freq) {
this.e = e;
this.freq = freq;
}
@Override
public int compareTo(Freq o) {
if (this.freq < o.freq){
return 1;
} else if (this.freq > o.freq){
return -1;
} else {
return 0;
}
}
}
public List<Integer> topKFrequent(int[] nums, int k) {
TreeMap<Integer, Integer> map = new TreeMap<>();
for (int num : nums){
if (map.containsKey(num)){
map.put(num, map.get(num) + 1);
} else {
map.put(num, 1);
}
}
PriorityQueue<Freq> pq = new PriorityQueue<>();
for (int key : map.keySet()){
if (pq.getSize() < k){
pq.enqueue(new Freq(key, map.get(key)));
} else if (map.get(key) > pq.getFront().freq){
pq.dequeue();
pq.enqueue(new Freq(key, map.get(key)));
}
}
LinkedList<Integer> res = new LinkedList<>();
while (!pq.isEmpty()) {
res.add(pq.dequeue().e);
}
return res;
}
}