数据结构以学带练day13——滑动窗口最大值、前 K 个高频元素

170 阅读3分钟

题目

239. 滑动窗口最大值

image.png

我的思路——暴力解法O(nk)O(nk)

每次窗口滑动到一个位置就去计算一下这个窗口里的最大值:(提交超时)

class Solution {
public:
    vector<int> maxSlidingWindow(vector<int>& nums, int k) {
        if(nums.size() == 0) return {};
        vector<int> ans;
        for(int i = 0; i <= nums.size() - k; i ++){
            int maxNum = nums[i];
            for(int j = i; j < i + k; j ++){
                maxNum = max(maxNum, nums[j]);
            }
            ans.push_back(maxNum);
        }
        return ans;
    }
};

单调队列

DIY一个单调队列,其中队列的front用于存放滑动窗口内的最大数。每次窗口移动的时候,调用que.pop(滑动窗口中移除元素的数值),que.push(滑动窗口添加元素的数值),然后que.front()就返回我们要的最大值。

  • 自定义pop(value):如果窗口移除的元素value等于单调队列的出口元素,那么队列弹出元素,否则不用任何操作。
  • 自定义push(value):如果push的元素value大于入口元素的数值,那么就将队列入口的元素弹出,直到push元素的数值小于等于队列入口元素的数值为止。

保持如上规则,每次窗口移动的时候,只要问que.front()就可以返回当前窗口的最大值。

239.滑动窗口最大值-2.gif

class Solution {
private:
    class MyQueue { //单调队列(从大到小)
    public:
        deque<int> que; // 使用deque来实现单调队列
        // 每次弹出的时候,比较当前要弹出的数值是否等于队列出口元素的数值,如果相等则弹出。
        // 同时pop之前判断队列当前是否为空。
        void pop(int value) {
            if (!que.empty() && value == que.front()) {
                que.pop_front();
            }
        }
        // 如果push的数值大于入口元素的数值,那么就将队列后端的数值弹出,直到push的数值小于等于队列入口元素的数值为止。
        // 这样就保持了队列里的数值是单调从大到小的了。
        void push(int value) {
            while (!que.empty() && value > que.back()) {
                que.pop_back();
            }
            que.push_back(value);

        }
        // 查询当前队列里的最大值 直接返回队列前端也就是front就可以了。
        int front() {
            return que.front();
        }
    };
public:
    vector<int> maxSlidingWindow(vector<int>& nums, int k) {
        MyQueue que;
        vector<int> result;
        for (int i = 0; i < k; i++) { // 先将前k的元素放进队列
            que.push(nums[i]);//这里用的是自定义push函数
        }
        result.push_back(que.front()); // result 记录前k的元素的最大值
        //i相当于fast,指向第k个位置
        for (int i = k; i < nums.size(); i++) {
            que.pop(nums[i - k]); // 滑动窗口移除最前面元素,这里用的是自定义pop函数
            que.push(nums[i]); // 滑动窗口前加入最后面的元素,这里用的是自定义push函数
            result.push_back(que.front()); // 记录对应的最大值
        }
        return result;
    }
};

347.前 K 个高频元素

image.png

思路

  1. 统计元素出现频率:可以使用map来进行统计。其中key记录元素值,value统计该元素出现的次数
  2. 对频率排序:优先级队列
  • 是一个披着队列外衣的堆,因为优先级队列对外接口只是从队头取元素,从队尾添加元素,再无其他取元素的方式,看起来就是一个队列。
  • 优先级队列内部元素是自动依照元素的权值排列。
  • 缺省情况下priority_queue利用max-heap(大顶堆)完成对元素的排序,这个大顶堆是以vector为表现形式的complete binary tree(完全二叉树)
    • 堆是一棵完全二叉树,树中每个结点的值都不小于(或不大于)其左右孩子的值。  如果父亲结点是大于等于左右孩子就是大顶堆,小于等于左右孩子就是小顶堆。
    • 大顶堆(堆头是最大元素),小顶堆(堆头是最小元素),从小到大排就是小顶堆,从大到小排就是大顶堆。

    ⭐思考一下,是使用小顶堆呢,还是大顶堆?

    如果使用大顶堆,在每次移动更新大顶堆的时候,每次弹出都把最大的元素弹出去了,那么怎么保留下来前K个高频元素呢?

    所以要用小顶堆,因为要统计最大前k个元素,只有小顶堆每次将最小的元素弹出,最后小顶堆里积累的才是前k个最大元素。

  1. 找出前K个高频元素。

优先级队列知识

  • 定义:priority_queue<Type, Container, Functional>

Type 就是数据类型,Container 就是容器类型(Container必须是用数组实现的容器,比如vector,deque等等,但不能用 list。STL里面默认用的是vector),Functional 就是比较的方式,当需要用自定义的数据类型时才需要传入这三个参数,使用基本数据类型时,只需要传入数据类型,默认是大顶堆

  • 对于自定义类型:
#include <iostream>
#include <queue>
using namespace std;

//方法1
struct tmp1 //运算符重载<
{
    int x;
    tmp1(int a) {x = a;}
    bool operator<(const tmp1& a) const
    {
        return x < a.x; //大顶堆
    }
};

//方法2
struct tmp2 //重写仿函数
{
    bool operator() (tmp1 a, tmp1 b) 
    {
        return a.x < b.x; //大顶堆
    }
};

int main() 
{
    tmp1 a(1);
    tmp1 b(2);
    tmp1 c(3);
    priority_queue<tmp1> d;
    d.push(b);
    d.push(c);
    d.push(a);
    while (!d.empty()) 
    {
        cout << d.top().x << '\n';
        d.pop();
    }
    cout << endl;

    priority_queue<tmp1, vector<tmp1>, tmp2> f;
    f.push(c);
    f.push(b);
    f.push(a);
    while (!f.empty()) 
    {
        cout << f.top().x << '\n';
        f.pop();
    }
}

整体代码

// 时间复杂度:O(nlogk)
// 空间复杂度:O(n)
class Solution {
public:
    // 自定义比较函数,构造小顶堆
    class mycomparison {
    public:
        bool operator()(const pair<int, int>& lhs, const pair<int, int>& rhs) {
            return lhs.second > rhs.second;
        }
    };
    vector<int> topKFrequent(vector<int>& nums, int k) {
        // 要统计元素出现频率,key记录元素值,value统计该元素出现的次数
        unordered_map<int, int> map; // map<nums[i],对应出现的次数>
        for (int i = 0; i < nums.size(); i++) {
            map[nums[i]]++;
        }

        // 对频率排序
        // 定义一个小顶堆,大小为k
        //数据类型:pair<int, int>
        //容器类型:vector<pair<int, int>>
        //比较函数:mycomparison    ⭐   >(小顶堆)  <(大顶堆)   ⭐
        priority_queue<pair<int, int>, vector<pair<int, int>>, mycomparison> pri_que;

        // 用固定大小为k的小顶堆,扫面所有频率的数值
        for (unordered_map<int, int>::iterator it = map.begin(); it != map.end(); it++) {
            pri_que.push(*it);
            if (pri_que.size() > k) { // 如果堆的大小大于了K,则队列弹出,保证堆的大小一直为k
                pri_que.pop();
            }
        }

        // 找出前K个高频元素,因为小顶堆先弹出的是最小的,所以倒序来输出到数组
        vector<int> result(k);
        for (int i = k - 1; i >= 0; i--) {
            result[i] = pri_que.top().first;//输出这个元素的值
            pri_que.pop();
        }
        return result;
    }
};

栈与队列总结

理论基础

  • 栈里面的元素在内存中是连续分布的么?
    • 陷阱1:栈是容器适配器,底层容器使用不同的容器,导致栈内数据在内存中不是连续分布。
    • 陷阱2:缺省情况下,默认底层容器是deque,那么deque的在内存中的数据分布是什么样的呢? 答案是:不连续的。