【C++】树状数组

727 阅读4分钟

「这是我参与11月更文挑战的第3天,活动详情查看:2021最后一次更文挑战」。

定义

所谓树状数组,逻辑结构是一棵树,但是采用数组实现,他能解决单点修改区间查询类的问题,属于前缀和的一种优化。

lowbit

学习树状数组,首先要引入lowbitlowbit概念,所谓lowbitlowbit,指的是二进制数最低位的11的权值,比如二进制数11001100的lowbit就是二进制表示就是100100,也就是权值为22=42^2=4,下文中我们用lowbit(x)lowbit(x)表示xxlowbitlowbit值。实际上,lowbit(x)=x&(x)lowbit(x)=x\&(-x)&\&表示按位与运算。

inline int lowbit(int i){return i&(-i);}

树状数组结构

上图摘自orangebird,在图中AiA_i表示原数组,CiC_i表示AiA_i对应的树状数组。

CiC_i维护的是AiA_i区间信息,那么CiC_i究竟维护什么区间呢?我们可以先计算下lowbit(i)lowbit(i)

lowbit(1)=1 lowbit(2)=2 lowbit(3)=1 lowbit(4)=1 lowbit(5)=1 lowbit(6)=2 lowbit(7)=1 lowbit(8)=8

我们可以发现,CiC_i维护的长度就是lowbit(i)lowbit(i),维护区间是[ilowbit(i)+1,i][i-lowbit(i)+1,i]

C3C3维护的区间是[2lowbit(2)+1,2][2-lowbit(2)+1,2][1,2][1,2]C8C8维护的区间是[8lowbit(8)+1,8][8-lowbit(8)+1,8][1,8][1,8]

那么树状数组的CiC_i可能会影响哪些位的值呢?以C1C1为例,1+lowbit(1)=22+lowbit(2)=44+lowbit(4)=81+lowbit(1)=2,2+lowbit(2)=4,4+lowbit(4)=8,我们发现第ii个数值会递归影响所有的父结点,在树状数组中编号为ii的结点的父结点编号为i+lowbit(i)i+lowbit(i)

应用举例

单点修改区间和查询

考虑一类问题,给出长度为lenlen的连续区间,并给出每个端点的初始值,现允许在询问的过程中进行单点修改,每次询问的是区间[l,r][l,r]的和。

我们可以转化连续区间为[1,len][1,len]的树状数组,假设AA为原数组,CiC_i为所维护的树状数组,维护的是区间和信息。

更新函数

  • 由于树状数组初始化需要借用更新函数,故放到前面。所做的工作是将编号iiii所影响的编号位置都增加xx,减小可以认为是增加x-x
void update(int i,int x){
	while(i<=len){
		C[i]+=x;//加上x
		i+=lowbit(i);//下一个被影响的i
	}
}

初始化函数

void init(){
	memset(C,0,sizeof(C));//初始化C数组为0
	for(int i=1;i<=len;i++){
		update(i,A[i]);//递归插入A[i]
	}
}

前缀和查询

  • 由于树状数组维护的是区间[ilowbit(i)+1,i][i-lowbit(i)+1,i],我们无法直接求得[l,r][l,r]的和,所以我们先求[1,i][1,i]的和,记为Sum(i)Sum(i),则Sum[l,r]=Sum(r)Sum(l1)Sum_{[l,r]}=Sum(r)-Sum(l-1)
int Sum(int i){//计算[1,i]的和
	int sum=0;
	while(i){
		sum+=C[i};//在区间内
		i-=lowbit(i);//上一个未被影响的编号
	}
	return sum;
}

区间查询

  • 根据差分思想,即可求得[l,r][l,r]的和,即Sum[l,r]=Sum(r)Sum(l1)Sum_{[l,r]}=Sum(r)-Sum(l-1)
int query(int l,int r){
	return Sum(r)-Sum(l-1);
}

区间修改单点查询

考虑一类问题,给出长度为lenlen的连续区间,并给出每个端点的初始值,现允许在询问的过程中增减某个区间,每次询问的是点ii的值。

我们可以转化连续区间为[1,len][1,len]的树状数组,假设AA为原数组,CiC_i为所维护的树状数组。

此问题需要引入差分数组BiB_iBiB_i记录的是AiAi1A_i-A_{i-1},不难发现i=1nBi=An\sum_{i=1}^{n} B_i=A_nCiC_i则维护BiB_i的区间[l,r][l,r]和,因此i=1nCi=An\sum_{i=1}^{n} C_i=A_n

当区间[l,r][l,r]增加xx时,ClC_l增加xx即可表示AlArA_l\sim A_r均增加xx,但是相应的Ar+1AlenA_{r+1}\sim A_{len}也被影响了,所以Cr+1C_{r+1}需要减少xx才能保证后续区间不被影响。

更新函数

void update(int i,int x){
	while(i<=len){
		C[i]+=x;//加上x
		i+=lowbit(i);//下一个被影响的i
	}
}

初始化函数

void init(){
	memset(C,0,sizeof(C));//初始化C数组为0
	for(int i=1;i<=len;i++){
		update(i,A[i]-A[i-1]);//递归插入B[i]=A[i]-A[i-1],注意需要A[0]=0
	}
}

区间修改

void change(int l,int r,int x){
	update(l,x);
	update(r+1,-x);
}

单点查询

int query(int i){
	int sum=0;
	while(i){
		sum+=C[i];
		i-=lowbit(i);
	}
	return sum;
}

区间最值问题

考虑一类问题,给出长度为lenlen的连续区间,并给出每个端点的初始值,现允许在询问的过程中进行单点修改,每次询问的是区间[l,r][l,r]的最大或最小值信息。

我们可以转化连续区间为[1,len][1,len]的树状数组,假设AA为原数组,CiC_i为所维护的树状数组,记录的是[ilowbit(i)+1,i][i-lowbit(i)+1,i]的最值。

更新函数

void update(int i,int x){
	while(i<=len){
		if(visit[i]){//如果i已被访问,需引入visit数组记录i是否被访问
			C[i]=max(C[i],x);
			//或C[i]=min(C[i],x);
		}else{
			C[i]=x;
		}
		i+=lowbit(i);//下一个被影响的i
	}
}

初始化函数

void init(){
	memset(visit,0,sizeof(visit));//初始化visit数组为0
	for(int i=1;i<=len;i++){
		update(i,A[i]);//递归插入B[i]=A[i]-A[i-1],注意需要A[0]=0
	}
}

查询函数

  1. 每次记录C[r]C[r],然后令r=r1r=r-1,跳到第二步
  2. 查询[rlowbit(r)+1,r][r-lowbit(r)+1,r]所维护的区间,更新r=rlowbit(r)r=r-lowbit(r)直到llrr的区间内,跳到第三步
  3. 重复第一步直到l=rl=r
int query(int l,int r){
	int M=A[r];
	while(1){
		M=max(M,A[r]);
		//或M=min(M,A[r]);
		if(r==l) break;
		for(r=r-1;l<=r-lowbit(r);r-=lowbit(r)){//保证l不在r维护区间内才循环
			M=max(M,C[r]);
			//或M=min(M,C[r]);
		}
	}
	return M;
}