【ACM数论】和式变换技术,也许是最好的讲解之一

80 阅读4分钟

在做数论题时,往往需要进行和式变换,然后变换成我们可以处理的和式,再针对和式做筛法、整除分块等操作。

本文将介绍一些常见的和式变换技术。

以下出现的概念大部分为个人总结,未必是学术界/竞赛界的统一说法,有不严谨的地方请谅解。

🎈 作者:Eriktse 🎈 简介:19岁,211计算机在读,现役ACM银牌选手🏆力争以通俗易懂的方式讲解算法!❤️欢迎关注我,一起交流C++/Python算法。(优质好文持续更新中……)🚀 🎈 原文链接(阅读原文获得更好阅读体验):www.eriktse.com/algorithm/1…

和式的基本形式

和式一般有两种:区间枚举型整除枚举型

区间枚举型

我们的前缀和就是一个典型的区间枚举型和式。

假设我们有一个定义域为x[1,n],xZ+x\in[1, n],x\in Z^+的函数f(x)f(x),那么我们可以设一个前缀和函数F(x)F(x),定义为:

F(x)=i=1xf(i)=f(1)+f(2)+...+fx()F(x) = \sum_{i=1}^{x}f(i) = f(1) + f(2) + ... + fx()

求和符号中,如果没有特殊说明,一般枚举的都是整数,且步长为1。

整除枚举型

约数个数是一个典型的整除枚举型和式,我们可以容易的写出它的表达式:

f(n)=dn1f(n) = \sum_{d|n}1

其中 dnd|n 表示 ii 可以整除 nn ,即 iinn 的因子。

约数之和也是一个整除枚举型和式,表达式如下:

g(n)=dndg(n) = \sum_{d|n}d

和式的基本性质

可拆分性质

第一种拆分如下:

i=1nai=i=1mai+i=m+1nai\sum_{i=1}^{n}a_i = \sum_{i=1}^{m}a_i + \sum_{i=m+1}^{n}a_i

这是显然的,但是基本上用不着。

第二种拆分如下:

i=1n(ai+bi)=i=1nai+i=1nbi\sum_{i=1}^{n}(a_i + b_i) = \sum_{i=1}^{n}a_i + \sum_{i=1}^{n}b_i

这也是显然的。

常数可提取

当我们的和式里面乘上了一个常数kk,那么这个常数是可以提出来的,由于我们讨论的数域是整数域,这个kk一般为整数。(其实对于实数也是满足条件的)。

i=1nkai=ki=1nai\sum_{i=1}^{n}ka_i = k\sum_{i=1}^{n}a_i

整除枚举型变换为区间枚举型(重要)

就比如上面那个约数之和的函数:

g(i)=dnd=i=1n[dn]g(i) = \sum_{d|n}d = \sum_{i=1}^{n}[d|n]

我们知道dd的取值一定在[1,n][1, n],所以我们可以转换枚举类型,此时枚举指标的范围就要改变,同时加上一个布尔函数来限定。

我们称枚举的东西为“指标”,例如上面和式中d|n中的di=1中的i

指标变换(重要)

给定一个整数kk,对于下面这种和式,我们可以把指标进行转换。

i=1nj=1n[gcd(i,j)=k]\sum_{i=1}^{n}\sum_{j=1}^{n}[gcd(i, j) = k]

现在令i=ik,j=jki = i'k,j=j'k,为什么会这么想呢?因为我们后面的布尔函数中要求i,ji, j都包含因子kk,如果枚举的i,ji, j不是kk的倍数的时候这个式子是没有贡献的。

所以我们可以不一个个枚举i,ji, j,变为枚举kk的倍数。我们进行整体的代换:

ik=1njk=1n[gcd(ik,jk)=k]\sum_{i'k = 1}^{n}\sum_{j'k=1}^{n}[gcd(i'k, j'k) = k]

然后变换枚举范围和布尔函数,注意这里ii的起点本应该是1k\lfloor\frac{1}{k}\rfloor,但是00是没有讨论意义的所以我们从11开始。

i=1nkj=1nk[gcd(i,j)=1]\sum_{i=1}^{\lfloor\frac{n}{k}\rfloor}\sum_{j=1}^{\lfloor\frac{n}{k}\rfloor}[gcd(i, j) = 1]

现在我们可以发现后面这个布尔函数就变成了一个常见的积性函数ϵ\epsilon,接下来就可以通过公式μI=ϵ\mu * I = \epsilon进行莫比乌斯反演(其中符号*表示狄利克雷卷积)。

交换求和次序(重要)

上式进行莫比乌斯反演后可以得到如下的和式(如果不懂莫比乌斯反演可以暂时先不管,之后再学),设m=nkm=\lfloor\frac{n}{k}\rfloor

i=1mj=1mdgcd(i,j)μ(d)\sum_{i=1}^{m}\sum_{j=1}^{m}\sum_{d|gcd(i, j)}\mu(d)

我们可以发现dgcd(i,j)d|gcd(i, j)这个条件等价于[di][dj][d|i][d|j],即dd同时是iijj的因子。

接下来我们进行一次枚举类型的转换:

i=1mj=1md=1m[di][dj]μ(d)\sum_{i=1}^{m}\sum_{j=1}^{m}\sum_{d=1}^{m}[d|i][d|j]\mu(d)

接下来我们将dd的求和符号从后面换到前面去,因为在μ(d)\mu(d)中没有包含i,ji, j的内容,可以直接换,这里需要自己理解一下。

sumd=1mμ(d)i=1m[di]j=1m[dj]\\sum_{d=1}^{m}\mu(d)\sum_{i=1}^{m}[d|i]\sum_{j=1}^{m}[d|j]

转换为整除分块形式(十分重要)

上式转换完成后,我们可以发现后面两坨是可以进行整除分块的。

i=1m[di]=md\sum_{i=1}^{m}[d|i] = \lfloor\frac{m}{d}\rfloor

怎么理解呢?这个式子表达的就是当dd确定了,在区间[1, n]中有多少整数是dd的倍数,显然是md\lfloor\frac{m}{d}\rfloor个。

那么和式就可转换为:

i=1mmdmd\sum_{i=1}^{m}\lfloor\frac{m}{d}\rfloor\lfloor\frac{m}{d}\rfloor

例题

luogu P2257 YY的GCD:www.luogu.com.cn/problem/P22…

阅读题意我们可以知道题目所求为,不妨设nmn\le m

ans=i=1nj=1m[gcd(i,j)prim]ans=\sum_{i=1}^{n}\sum_{j=1}^{m}[gcd(i,j)\in prim]

接下来开始变换:

i=1nj=1mpprim[gcd(i,j)=p]\sum_{i=1}^{n}\sum_{j=1}^{m}\sum_{p\in prim}[gcd(i,j)=p]

pprimi=1npj=1mp[gcd(i,j)=1]\sum_{p\in prim}\sum_{i=1}^{\lfloor\frac{n}{p}\rfloor}\sum_{j=1}^{\lfloor\frac{m}{p}\rfloor}[gcd(i,j)=1]

莫比乌斯反演:

pprimi=1npj=1mpdgcd(i,j)μ(d)\sum_{p\in prim}\sum_{i=1}^{\lfloor\frac{n}{p}\rfloor}\sum_{j=1}^{\lfloor\frac{m}{p}\rfloor}\sum_{d|gcd(i,j)}\mu(d)

注意这里nmn\le m,接着变换。

pprimi=1npj=1mpd=1np[di][dj]μ(d)\sum_{p\in prim}\sum_{i=1}^{\lfloor\frac{n}{p}\rfloor}\sum_{j=1}^{\lfloor\frac{m}{p}\rfloor}\sum_{d=1}^{\lfloor\frac{n}{p}\rfloor}[d|i][d|j]\mu(d)

pprimd=1npμ(d)i=1np[di]j=1mp[dj]\sum_{p\in prim}\sum_{d=1}^{\lfloor\frac{n}{p}\rfloor}\mu(d)\sum_{i=1}^{\lfloor\frac{n}{p}\rfloor}[d|i]\sum_{j=1}^{\lfloor\frac{m}{p}\rfloor}[d|j]

后面两坨可以进行整除分块,同时换一下pp的枚举类型:

p=1n[pprim]d=1npμ(d)npdmpd\sum_{p=1}^{n}[p\in prim]\sum_{d=1}^{\lfloor\frac{n}{p}\rfloor}\mu(d)\lfloor\frac{n}{pd}\rfloor\lfloor\frac{m}{pd}\rfloor

T=pdT=pd,交换求和次序。

p=1n[pprim][pT]T=1nμ(Tp)nTmT\sum_{p=1}^{n}[p\in prim][p|T]\sum_{T=1}^{n}\mu(\frac{T}{p})\lfloor\frac{n}{T}\rfloor\lfloor\frac{m}{T}\rfloor

再交换求和次序:

T=1nnTmTp=1n[pprim][pT]μ(Tp)\sum_{T=1}^{n}\lfloor\frac{n}{T}\rfloor\lfloor\frac{m}{T}\rfloor\sum_{p=1}^{n}[p\in prim][p|T]\mu(\frac{T}{p})

现在发现pp后面那一块,可以通过类似欧拉筛的方法进行预处理。

我们设一个函数:

F(T)=p=1n[pprim][pT]μ(Tp)F(T) = \sum_{p=1}^{n}[p \in prim][p|T]\mu(\frac{T}{p})

那么F(T)F(T)的含义就是对于TT的每一个质因子pp,将它的μ(Tp)\mu(\frac{T}{p})加到自身上。

做完了。

Code:

#include <bits/stdc++.h>
#define int long long
using namespace std;
const int N = 1e7 + 9;

int sum[N], mu[N];

void init(int n = N - 2)
{
	bitset<N> vis;
	vector<int> prim;
	vis[1] = true;
	mu[1] = 1;
	
	for(int i = 2;i <= n; ++ i)
	{
		if(!vis[i])prim.push_back(i), mu[i] = -1;
		
		for(int j = 0;j < prim.size() and i * prim[j] <= n; ++ j)
		{
			vis[i * prim[j]] = true;
			if(i % prim[j] == 0)break;//此时i * prim[j]含有平方因子
			
			mu[i * prim[j]] = -mu[i];//此时i * prim[j]的本质不同质因子+1,或已经含有平方因子
		}
	}
	
	for(int i = 0;i < prim.size(); ++ i)
	{
		for(int j = 1; prim[i] * j  <= n; ++ j)
		{
			sum[prim[i] * j] += mu[j];
		}
	}
	
	for(int i = 1;i <= n; ++ i)sum[i] += sum[i - 1];
	
}

void solve()
{
	int n, m;scanf("%lld %lld", &n, &m);
	if(n > m)swap(n, m);
	int ans = 0;
	for(int l = 1, r;l <= n; l = r + 1)
	{
		r = min(n / (n / l), m / (m / l));
		ans += (sum[r] - sum[l - 1]) * (n / l) * (m / l);
	}
	printf("%lld\n", ans);
}

signed main()
{
	init();
	int _;scanf("%lld", &_);
	while(_ --)solve();
	return 0;
}

结束

🎈 本文由eriktse原创,创作不易,如果对您有帮助,欢迎小伙伴们点赞👍、收藏⭐、留言💬