算法之离散化

400 阅读3分钟

「这是我参与2022首次更文挑战的第2天,活动详情查看:2022首次更文挑战」。

离散化

思想

离散化,就是当我们只关心数据的大小关系时,用排名代替原数据进行处理的一种预处理方法。离散化本质上是一种哈希,是一种映射,它在保持原序列大小关系的前提下把其映射成正整数。

当原数据很大或含有负数、小数时,难以表示为数组下标,一些算法和数据结构(如BIT)无法运作,这时我们就可以考虑将其离散化。

主要功能

离散化主要是通过建立一个映射,将分散的元素的位置映射成连续的位置以节约空间

例题

例题一(离散化+前缀和)

假定有一个无限长的数轴,数轴上每个坐标上的数都是 0。

现在,我们首先进行 n 次操作,每次操作将某一位置 x 上的数加 c。

接下来,进行 m 次询问,每个询问包含两个整数 l 和 r,你需要求出在区间 [l,r][l,r] 之间的所有数的和。

输入格式

第一行包含两个整数 n 和 m。

接下来 n 行,每行包含两个整数 x 和 c。

再接下来 m 行,每行包含两个整数 l 和 r。

输出格式

共 m 行,每行输出一个询问中所求的区间内数字和。

数据范围

-10^9 ≤ x ≤ 10^9

-10^5 ≤ n , m ≤ 10^5

-10^9 ≤ l ≤ r ≤ 10^9

-1000 ≤ c ≤ 10000

输入样例

3 3
1 2
3 6
7 5
1 3
4 6
7 8

输出样例

8
0
5
#include <iostream>
#include <vector>
#include <algorithm>
/**
 * 由分析可知,本体若直接暴力,数据范围太大(2e9),特别占用空间,因此使用离散化的思想,只对输入的位置进行操作,并通过PII
 * 类型的变量将值与位置存储起来,之后去重,排序,求前缀和即可得到结果
 */
using namespace std;

typedef pair<int, int> PII;

const int N = 3e5 + 10;//之所以是3e5,是因为在最极端的情况下,n次操作与m次询问的l和r都是不同的,因此为3e5

int n, m;
int a[N], s[N];//用于求前缀和的数组

vector<int> alls;
vector<PII> add, query;

int find(int x)//使用二分查找区间的位置,因为是有序的,时间复杂度为log2 N
{
    int l = 0;
    int r = alls.size() - 1;
    
    while (l < r){
        int mid = l + r >> 1;
        if(alls[mid] >= x) r = mid;
        else l = mid + 1; 
    }
    return l + 1;
}
int unique(vector<int> &a){
    int j = 0;
    for (int i = 0; i < a.size(); i ++ ){
        if(!i || a[i] != a[i - 1]){
            a[j ++ ] = a[i];
        }
    }
    return j;
}
int main()
{
    cin >> n >> m;
    for (int i = 0; i < n; i ++ ){
        int x, c;
        cin >> x >> c;
     
        add.push_back({x, c});
        alls.push_back(x);
    }
    for (int i = 0; i < m; i ++ ){
        int l, r;
        cin >> l >> r;
        
        query.push_back({l, r});
        alls.push_back(l);
        alls.push_back(r);
    }
    sort(alls.begin(), alls.end());
    alls.erase(alls.begin() + unique(alls), alls.end());
    //erase删除函数,unique是去重函数(思想是将有重复的放入最后,删除即可得到去重后的函数)
    for (auto item : add){
        int x = find(item.first);
        a[x] += item.second;
    }
    for (int i = 1; i <= alls.size(); i ++ ) s[i] = s[i - 1] + a[i];//处理前缀和数组
    // 处理询问
    for (auto item : query)
    {
        int l = find(item.first), r = find(item.second);
        cout << s[r] - s[l - 1] << endl;
    }

    return 0;
}