重积分换元公式与面积公式

445 阅读5分钟
原文链接: zhuanlan.zhihu.com

一般的数学分析课本里并不会给出重积分换元公式的完整证明, 因为完整的证明确实并不容易. 这里尝试给出证明, 并且附上适当的直观解释.

这个公式有一个简单的直观推演. 设 U\subset\mathbb{R}^n 是开集, f 是其上定义的 C^1 微分同胚. 将 f 的微分记为 J_f (并且视之为矩阵值函数), 而Jacobi行列式的绝对值记为 |J_f| . 现在希望计算 |f(U)| , 即像集合 f(U) 的测度. 为此, 将 U “近似”地“分割”成一系列很小的方块 Q_1,...,Q_m, 并设其中心为 x_1,...,x_m . 则在 Q_i 上, 当然有f(x)\approx f(x_i)+J_f(x_i)(x-x_i) , 从而应当可以期望

|f(Q_i)|\approx|J_f(x_i)||Q_i| .

i 求和, 则应有近似等式

|f(U)|\approx\sum_{i=1}^m|f(Q_i)|\approx\sum_{i=1}^m|J_f(x_i)||Q_i|\approx\int_U|J_f(x)|dx .

如果上面的约等于号实际上都是等号, 那么简单的微积分就足够给出换元公式了:

\int_{f(U)}g(y)dy=\int_U(g\circ f)(x)J_f(x)dx .

问题在于, 怎么从线性的 f(x)\approx f(x_i)+J_f(x_i)(x-x_i) 过渡到测度的 |f(Q_i)|\approx|J_f(x_i)||Q_i| ?前一个近似等式表示映射 x\rightarrow x_i+J_f(x_i)(x-x_i)f 的像在距离的意义下很接近, 而后一个则要求从此过渡到测度意义下的接近. 这就要求对映射进行更加细致的研究了.

(一)最简单的情形: 微分同胚

依旧假定 U\subset\mathbb{R}^n 是开集, f: U\rightarrow f(U)C^1 微分同胚. 则的确成立

|f(U)|=\int_U|J_f(x)|dx .

根据基本的实分析知识, 只需要证明, 对于任何闭方块 Q\subset U , 均有

|f(Q)|=\int_Q|J_f(x)|dx

就够了.

r(x,y)=f(y)-f(x)-J_f(x)(y-x) . 现在固定一个 \varepsilon>0 , 选取 \delta 使得对于 x,y\in Q , 只要 |x-y|<\delta , 就有 |r(x,y)|<\varepsilon|x-y| . 根据 fC^1 类的假定, 这总能办得到. 换句话说, 现在要求 fQ 上能够被其一级近似“一致地”逼近. 现在将 Q 分割成一系列全同的直径小于 \delta/2 的方块 Q_1,...,Q_m , 并依旧将它们的中心写为 x_1,...,x_m .

可以证明如下的逼近引理: 如果 |J_f(x_i)|>\sqrt{\varepsilon} , 则有

\left(1-\sqrt\varepsilon\right)J_f(x_i)(Q_i)\subset f(Q_i)\subset J_f(Q_i)+B_{\varepsilon\delta}(x_i) ,

f(Q_i) 包含了中心在 f(x_i) 而边长为 J_f(x_i)(Q_i) 的边长 \left(1-\sqrt\varepsilon\right) 倍的平行六面体, 同时又被包含在平行六面体 J_f(Q_i)\varepsilon\delta 邻域之中. 换句话说, 如果导数 J_f(x_i) "足够可逆", 那么在 Q_i 上, f 同其一级近似确实是“非常接近”的(不仅在距离的意义下接近, 实际上二者的像集也差得不多). 这是证明换元公式的最重要的一步.

现在来证明引理. 根据定义, 包含关系 f(Q_i)\subset J_f(Q_i)+B_{\varepsilon\delta}(x_i) 是显然的. 需要证明另一个包含关系. 可以选择 \delta 如此之小, 以至于对所有 x\in Q_i , 都有

\|\mathrm{id}-J_f(x_i)^{-1}\circ J_f(x)\|<1/2 .

固定一个 y\in Q_i , 来研究方程

f(x)=f(x_i)+J_f(x_i)(y-x_i) .

它等价于

\Phi(x)=x ,

这里 \Phi(x)=x-J_f(x_i)^{-1}[f(x)]+J_f(x_i)^{-1}[f(x_i)+J_f(x_i)(y-x_i)] . 根据有限增量定理, 易见映射 \Phi 具有Lipchitz常数1/2. 进一步的简单计算表明, 对于 x\in Q_i , 有

|\Phi(x)-y|<\sqrt{\varepsilon}|x-x_i| ,

从而只要 y\in (1-\sqrt{\varepsilon})Q_i , \Phi 便将 Q_i 映入自身, 所以是压缩映射, 故在 Q_i 中存在唯一的不动点. 这就证明了 \left(1-\sqrt\varepsilon\right)J_f(x_i)(Q_i)\subset f(Q_i) . 引理证明完毕.

现在来估计误差

\left(\sum_{i=1}^m|J_f(x_i)||Q_i|\right)-|f(Q)|=\sum_{i=1}^m\left(|J_f(x_i)||Q_i|-f(Q_i)\right) .

对每一个 i , 如果 |J_f(x_i)|\leq\varepsilon , 则可直接算得 ||J_f(x_i)||Q_i|-f(Q_i)|<C_n|Q_i|\varepsilon . 若 |J_f(x_i)|>\varepsilon , 则使用引理中的包含关系, 可得到

|J_f(x_i)|Q_i|-f(Q_i)|\leq |[J_f(x_i)Q_i+B_{\varepsilon\delta}]\setminus[(1-\sqrt{\varepsilon})J_f(x_i)Q_i]|<C_n|Q_i|\varepsilon .

这样, 只需要令分割 Q=\bigcup_{i=1}^mQ_i 的直径趋于零, 就得到了所需要的结论.

(二)一个较难的推广: 面积公式

几何测度论中的面积公式是对重积分换元公式的一个比较难的推广. 它的叙述如下:

f:\mathbb{R}^n\rightarrow\mathbb{R}^{n+k} 是Lipschitz映射, A\subset\mathbb{R}^n,B\subset\mathbb{R}^{n+k} 是可测集. 则成立公式

\int_{A\cap f^{-1}(B)}|J_f(x)|dx=\int_B\mathrm{Card}(A\cap f^{-1}(y))dH^{n}(y) .

在这里, |J_f(x)|f 的Jacobi矩阵的列向量在 \mathbb{R}^{n+k} 中张成的(维数不高于n的)平行六面体的 n维体积, 而 H^n\mathbb{R}^{n+k} 中的 n维Hausdorff测度.

等式的左边可以看成" n 维面积元的积分", 而右边则可以看成 f 的像集上的“计算重数的 n 维面积”.

为了证明面积公式, 同样需要一个逼近引理:

E_ff 的非临界点集, 即在 E_ff 可微, 而且对所有 x\in E_f , J_f(x):\mathbb{R}^n\rightarrow\mathbb{R}^{n+k} 都是单线性映射. 则对于任何 \alpha>1 , 都存在单线性映射 \{L_i\}_{i=1}^\infty , 以及分解 E_f=\bigcup_{i=1}^\infty B_i (这里每个 B_i 都是Borel集, 彼此不交), 对所有的 i 都满足

(1) 映射 f|_{B_i} 是单的.

(2) 映射f|_{B_i}\circ L_i^{-1}:\mathrm{Im}L_i\rightarrow f(B_i)L_i\circ (f_{B_i})^{-1}: f(B_i)\rightarrow\mathrm{Im}L_i 都是Lipschitz的, 具有不大于 \alpha 的Lipschitz常数.

(3) 对任何 x\in B_i , y\in\mathbb{R}^{n} , 有 \alpha^{-1}|L_iy|\leq |J_f(x)y|\leq\alpha|L_iy| .

(4) 对任何 x\in B_i , 有 \alpha^{-n}|\det L_i|\leq|J_f(x)|\leq\alpha^n|\det L_i| .

这个引理与前一节的逼近引理显然有类似的直观解释. 现在来证明它.\varepsilon>0 使得 \alpha^{-1}+\varepsilon<1<\alpha-\varepsilon . 设 \mathcal{G}\subset \mathrm{GL}(\mathbb{R}^n) 是可数稠密集. 对每个 L\in\mathcal{G} 和每个正整数 j , 令 {E}_L^j满足如下条件的 x\in E_f的集合(如果这样的 x 不存在, 则设为空集):

(a) 对任何 w\in\mathbb{R}^n, 均有(\alpha^{-1}+\varepsilon)|Lw|\leq|J_f(x)w|\leq(\alpha-\varepsilon)|Lw| .

(b) 对任何 y\in B(x,1/j) , 均有 |f(y)-f(x)-J_f(x)(y-x)|<\varepsilon|L(y-x)| .

容易说明, 任何 x\in{E}_f 都属于某个 {E}_L^j . 实际上, 写 J_f(x)=UT , 其中 U:\mathbb{R}^n\rightarrow\mathbb{R}^{n+k} 是等距嵌入, T\in \mathrm{GL}(\mathbb{R}^n) . 选充分接近 T^{-1}L\in\mathcal{G}, 使得 \|TL^{-1}\|<\alpha-\varepsilon , \|LT^{-1}\|<(\alpha^{-1}+\varepsilon){^{-1}} . 这适合(a)款. 又由可微性, 可选充分大的 j 使得

|f(y)-f(x)-J_f(x)(y-x)|<\varepsilon|y-x|/\|L\|^{-1} .

这适合(b)款.

由这两条要求, 立刻可以看出, 若 x,y\in{E}^j_L|x-y|<1/j , 则

\alpha^{-1}|L(y-x)|\leq|f(y)-f(x)|\leq\alpha|L(y-x)| .

最后来构造所需要的分解. 对每个 {E}_L^j , 显然(相对开的)集族 \{B(x,1/(2j))\cap{E}_L^j\}_{x\in{E}_L^j} 覆盖了 {E}_L^j . 根据可分性, 可以选出一个可数的子覆盖 \mathcal{C}_L^j . 则集族

\bigcup_{L\in\mathcal{G},j\in\mathbb{N}}\mathcal{C}_L^j

就给出了所要的分解. 如果集族内有集合彼此相交, 则可以用 B_i\setminus\cup_{j=1}^{i-1}B_j 来代替 B_i 而得到不交的集族. 根据 E_L^j 的定义就得到了引理的结论. 注意, 引理的第(4)条可以通过奇异值分解由第(3)条推出.

现在来证明面积公式. 显然可以以 A\cap f^{-1}(B)A , 从而只需要对 B=\mathbb{R}^{n+k} 证明就够了. 又因为 f 几乎处处可微, 且将零测集映射为 H^n- 零测集, 故又只需要假定 fA 上点点可微就够了.

沿用上面引理的记号. 首先假定 A\subset E_f . 固定 \alpha>1 , 并作相应的分解 E_f=\bigcup_{i=1}^\infty B_i . 写 A_i=A\cap B_i . 根据引理第(4)条, 有

\begin{aligned}\alpha^{-n}H^n(L_i(A_i))&=\alpha^{-n}|\det L_i||A_i|\leq\int_{A_i}|J_f(x)|dx\\&\leq\alpha^n|\det L_i||A_i|\leq\alpha^nH^n(L_i(A_i))\end{aligned}

但根据引理的第(1)(2)条和Lipschitz映射的性质(Hausdorff测度在Lipschitz映射下的变化), 得到

\alpha^{-n}H^n(L_i(A_i))\leq f(A_i)\leq\alpha^nH^n(L_i(A_i)) .

于是

\alpha^{-2n}H^n(f(A_i))\leq\int_{A_i}|J_f(x)|dx\leq\alpha^{2n}H^n(f(A_i)) .

两边对 i 求和; 注意到 \mathrm{Card}(A_i\cap f^{-1}(y))=I_{f(A_i)}(y) , 从而

\begin{aligned}\sum_{i=1}^\infty H^n(f(A_i))&=\sum_{i=1}^\infty\int_{\mathbb{R}^{n+k}}I_{f(A_i)}(y)dH^n(y)\\&=\int_{\mathbb{R}^{n+k}}\sum_{i=1}^\infty\mathrm{Card}(A_i\cap f^{-1}(y))dH^n(y)\end{aligned}.

由于诸 A_i 相互不交, 故右边的被积函数等于 \mathrm{Card}(A\cap f^{-1}(y)) . 由此

\begin{aligned}\alpha^{-2n}\int_{\mathbb{R}^{n+k}}\mathrm{Card}&(A\cap f^{-1}(y))dH^n(y)\leq\int_A|J_f(x)|dx\\&\leq\alpha^{2n}\int_{\mathbb{R}^{n+k}}\mathrm{Card}(A\cap f^{-1}(y))dH^n(y)\end{aligned}.

\alpha\rightarrow1 就得到了结论.

然后假定 J_f(x) 对于x\in A 都不是单映射. 这时只需要证明Sard型的结论: f(A)H^n- 零测集; 这样, \mathrm{Card}(A\cap f^{-1}(y))H^n- 几乎一切 y\in\mathbb{R}^{n+k} 都等于零, 从而完成证明. 为此, 固定 \varepsilon>0 , 命 p:\mathbb{R}^{n+k}\rightarrow\mathbb{R}^n 是正交投影, 又定义Lipschitz映射 g:\mathbb{R}^{n}\rightarrow\mathbb{R}^{n+k}\times\mathbb{R}^n

g(x)=(f(x),\varepsilon x) .

显然 g 是单的Lipschitz映射, 且由于 J_f(x) 不是单射, 必然有 |J_g(x)|\leq C_n\varepsilon . 注意到 f=p\circ g , 从而 H^n(f(A))\leq H^n(g(A)) . 根据刚刚得到的面积公式,

H^n(g(A))=\int_AJ_g(x)dx\leq C_n\varepsilon|A| .

\varepsilon\rightarrow0 就得到 H^n(f(A))=0 . 这完成了证明.