「这是我参与2022首次更文挑战的第2天,活动详情查看:2022首次更文挑战」。
离散化
思想
离散化,就是当我们只关心数据的大小关系时,用排名代替原数据进行处理的一种预处理方法。离散化本质上是一种哈希,是一种映射,它在保持原序列大小关系的前提下把其映射成正整数。
当原数据很大或含有负数、小数时,难以表示为数组下标,一些算法和数据结构(如BIT)无法运作,这时我们就可以考虑将其离散化。
主要功能
离散化主要是通过建立一个映射,将分散的元素的位置映射成连续的位置以节约空间。
例题
例题一(离散化+前缀和)
假定有一个无限长的数轴,数轴上每个坐标上的数都是 0。
现在,我们首先进行 n 次操作,每次操作将某一位置 x 上的数加 c。
接下来,进行 m 次询问,每个询问包含两个整数 l 和 r,你需要求出在区间 [l,r][l,r] 之间的所有数的和。
输入格式
第一行包含两个整数 n 和 m。
接下来 n 行,每行包含两个整数 x 和 c。
再接下来 m 行,每行包含两个整数 l 和 r。
输出格式
共 m 行,每行输出一个询问中所求的区间内数字和。
数据范围
-10^9 ≤ x ≤ 10^9
-10^5 ≤ n , m ≤ 10^5
-10^9 ≤ l ≤ r ≤ 10^9
-1000 ≤ c ≤ 10000
输入样例
3 3
1 2
3 6
7 5
1 3
4 6
7 8
输出样例
8
0
5
#include <iostream>
#include <vector>
#include <algorithm>
/**
* 由分析可知,本体若直接暴力,数据范围太大(2e9),特别占用空间,因此使用离散化的思想,只对输入的位置进行操作,并通过PII
* 类型的变量将值与位置存储起来,之后去重,排序,求前缀和即可得到结果
*/
using namespace std;
typedef pair<int, int> PII;
const int N = 3e5 + 10;//之所以是3e5,是因为在最极端的情况下,n次操作与m次询问的l和r都是不同的,因此为3e5
int n, m;
int a[N], s[N];//用于求前缀和的数组
vector<int> alls;
vector<PII> add, query;
int find(int x)//使用二分查找区间的位置,因为是有序的,时间复杂度为log2 N
{
int l = 0;
int r = alls.size() - 1;
while (l < r){
int mid = l + r >> 1;
if(alls[mid] >= x) r = mid;
else l = mid + 1;
}
return l + 1;
}
int unique(vector<int> &a){
int j = 0;
for (int i = 0; i < a.size(); i ++ ){
if(!i || a[i] != a[i - 1]){
a[j ++ ] = a[i];
}
}
return j;
}
int main()
{
cin >> n >> m;
for (int i = 0; i < n; i ++ ){
int x, c;
cin >> x >> c;
add.push_back({x, c});
alls.push_back(x);
}
for (int i = 0; i < m; i ++ ){
int l, r;
cin >> l >> r;
query.push_back({l, r});
alls.push_back(l);
alls.push_back(r);
}
sort(alls.begin(), alls.end());
alls.erase(alls.begin() + unique(alls), alls.end());
//erase删除函数,unique是去重函数(思想是将有重复的放入最后,删除即可得到去重后的函数)
for (auto item : add){
int x = find(item.first);
a[x] += item.second;
}
for (int i = 1; i <= alls.size(); i ++ ) s[i] = s[i - 1] + a[i];//处理前缀和数组
// 处理询问
for (auto item : query)
{
int l = find(item.first), r = find(item.second);
cout << s[r] - s[l - 1] << endl;
}
return 0;
}