阅读翻译Mathematics for Machine Learning之2.8 Affine Subspaces

84 阅读1分钟

阅读翻译Mathematics for Machine Learning之2.8 Affine Subspaces

关于:

  • 首次发表日期:2024-07-24
  • Mathematics for Machine Learning官方链接: mml-book.com
  • ChatGPT和KIMI机翻,人工润色
  • 非数学专业,如有错误,请不吝指出

2.8 仿射空间

接下来,我们将更详细地考察从原点偏移的空间,即不再是向量子空间的空间。此外,我们还将简要讨论这些仿射空间之间映射的性质,这些映射类似于线性映射。

备注。在机器学习文献中,线性和仿射之间的区别有时并不明确,以至于我们可以发现将仿射空间/映射称为线性空间/映射的参考文献。

2.8.1 仿射空间

定义 2.25(仿射子空间)。设 VV 为一个向量空间,x0V\boldsymbol{x}_0 \in VUVU \subseteq V 为一个子空间。那么子集

L=x0+U:={x0+u:uU}={vVuU:v=x0+u}V\begin{align*} L & =\boldsymbol{x}_0+U:=\left\{\boldsymbol{x}_0+\boldsymbol{u}: \boldsymbol{u} \in U\right\} \tag{2.130a} \\ & =\left\{\boldsymbol{v} \in V \mid \exists \boldsymbol{u} \in U: \boldsymbol{v}=\boldsymbol{x}_0+\boldsymbol{u}\right\} \subseteq V \tag{2.130b} \end{align*}

称为 VV仿射子空间线性流形(linear manifold)UU 称为方向方向空间(direction space)x0\boldsymbol{x}_0 称为支点(support point)。在第12章中,我们将这种子空间称为超平面。

注意,如果 x0U\boldsymbol{x}_0 \notin U,则仿射子空间的定义排除了 0\mathbf{0}。因此,对于 x0U\boldsymbol{x}_0 \notin U,仿射子空间不是 VV 的(线性)子空间(向量子空间)。

仿射子空间的例子有 R3\mathbb{R}^3 中的点、线和平面,这些点、线和平面不(一定)通过原点。

备注。考虑向量空间 VV 的两个仿射子空间 L=x0+UL = \boldsymbol{x}_0 + UL~=x~0+U~\tilde{L} = \tilde{\boldsymbol{x}}_0 + \tilde{U}。当且仅当 UU~U \subseteq \tilde{U}x0x~0U~x_0 - \tilde{x}_0 \in \tilde{U} 时,LL~L \subseteq \tilde{L}

仿射子空间通常由参数描述:考虑一个 VVkk 维仿射空间 L=x0+UL = \boldsymbol{x}_0 + U。如果 (b1,,bk)\left(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_k\right)UU 的一个有序基,那么每个元素 xL\boldsymbol{x} \in L 都可以唯一地描述为

x=x0+λ1b1++λkbk,(2.131)\boldsymbol{x}=\boldsymbol{x}_0+\lambda_1 \boldsymbol{b}_1+\ldots+\lambda_k \boldsymbol{b}_k, \tag{2.131}

其中 λ1,,λkR\lambda_1, \ldots, \lambda_k \in \mathbb{R}。这种表示称为具有方向向量 b1,,bk\boldsymbol{b}_1, \ldots, \boldsymbol{b}_k 和参数 λ1,,λk\lambda_1, \ldots, \lambda_kLL 的参数方程。


**例 2.26(仿射子空间)**
  • 一维仿射子空间称为直线,可以写作 y=x0+λb1\boldsymbol{y}=\boldsymbol{x}_0+\lambda \boldsymbol{b}_1,其中 λR\lambda \in \mathbb{R}U=span[b1]RnU=\operatorname{span}\left[\boldsymbol{b}_1\right] \subseteq \mathbb{R}^nRn\mathbb{R}^n 的一维子空间。这意味着直线由一个支点 x0\boldsymbol{x}_0 和一个定义方向的向量 b1\boldsymbol{b}_1 定义。参见图 2.13 了解示意图。
  • Rn\mathbb{R}^n 的二维仿射子空间称为平面。平面的参数方程为 y=x0+λ1b1+λ2b2\boldsymbol{y}=\boldsymbol{x}_0+\lambda_1 \boldsymbol{b}_1+\lambda_2 \boldsymbol{b}_2,其中 λ1,λ2R\lambda_1, \lambda_2 \in \mathbb{R}U=span[b1,b2]RnU=\operatorname{span}\left[\boldsymbol{b}_1, \boldsymbol{b}_2\right] \subseteq \mathbb{R}^n。这意味着平面由一个支点 x0\boldsymbol{x}_0 和两个线性独立的向量 b1,b2\boldsymbol{b}_1, \boldsymbol{b}_2 定义,这两个向量张成方向空间(span the direction space)。
  • Rn\mathbb{R}^n 中,(n1)(n-1) 维仿射子空间被称为超平面,相应的参数方程为 y=x0+i=1n1λibi\boldsymbol{y}=\boldsymbol{x}_0+\sum_{i=1}^{n-1} \lambda_i \boldsymbol{b}_i,其中 b1,,bn1\boldsymbol{b}_1, \ldots, \boldsymbol{b}_{n-1} 构成 Rn\mathbb{R}^n 的一个 (n1)(n-1) 维子空间 UU 的基。这意味着超平面由一个支点 x0\boldsymbol{x}_0(n1)(n-1) 个线性独立的向量 b1,,bn1\boldsymbol{b}_1, \ldots, \boldsymbol{b}_{n-1} 定义,这些向量张成方向空间。在 R2\mathbb{R}^2 中,直线也是超平面。在 R3\mathbb{R}^3 中,平面也是超平面。

Figure 2.13 Lines are affine subspaces.png


备注(非齐次线性方程组和仿射子空间)。对于 ARm×n\boldsymbol{A} \in \mathbb{R}^{m \times n}xRm\boldsymbol{x} \in \mathbb{R}^m,线性方程组 Aλ=x\boldsymbol{A} \boldsymbol{\lambda}=\boldsymbol{x} 的解要么是空集,要么是 Rn\mathbb{R}^n 中维度为 nrk(A)n-\operatorname{rk}(\boldsymbol{A}) 的仿射子空间。特别地,当 (λ1,,λn)(0,,0)\left(\lambda_1, \ldots, \lambda_n\right) \neq (0, \ldots, 0) 时,线性方程 λ1b1++λnbn=x\lambda_1 \boldsymbol{b}_1 + \ldots + \lambda_n \boldsymbol{b}_n = \boldsymbol{x} 的解是 Rn\mathbb{R}^n 中的一个超平面。

Rn\mathbb{R}^n 中,每个 kk 维仿射子空间都是非齐次线性方程组 Ax=b\boldsymbol{A x}=\boldsymbol{b} 的解,其中 ARm×n\boldsymbol{A} \in \mathbb{R}^{m \times n}bRm\boldsymbol{b} \in \mathbb{R}^m 并且 rk(A)=nk\operatorname{rk}(\boldsymbol{A})=n-k。回想一下,对于齐次方程组 Ax=0\boldsymbol{A x}=\mathbf{0},解是一个向量子空间,我们也可以将其视为一个特殊的仿射空间,其支点为 x0=0\boldsymbol{x}_0=\mathbf{0}

2.8.2 仿射映射

类似于我们在 2.7 节讨论的向量空间之间的线性映射,我们可以在两个仿射空间之间定义仿射映射。线性映射和仿射映射密切相关。因此,我们从线性映射中已经知道的许多性质,例如线性映射的复合(composition)是一个线性映射,也适用于仿射映射。

定义 2.26(仿射映射)。对于两个向量空间 V,WV, W,一个线性映射 Φ:VW\Phi: V \rightarrow W,以及 aW\boldsymbol{a} \in W,映射

ϕ:VWxa+Φ(x)\begin{align*} \phi: V & \rightarrow W \tag{2.132} \\ \boldsymbol{x} & \mapsto \boldsymbol{a} + \Phi(\boldsymbol{x}) \tag{2.133} \end{align*}

是从 VVWW 的仿射映射。向量 a\boldsymbol{a} 被称为 ϕ\phi 的平移向量。

  • 每一个仿射映射 ϕ:VW\phi: V \rightarrow W 也是线性映射 Φ:VW\Phi: V \rightarrow WWW 中的平移 τ:WW\tau: W \rightarrow W 的复合,使得 ϕ=τΦ\phi = \tau \circ \Phi。映射 Φ\Phiτ\tau 是唯一确定的(uniquely determined)。
  • 仿射映射 ϕ:VW,ϕ:WX\phi: V \rightarrow W, \phi^{\prime}: W \rightarrow X 的复合 ϕϕ\phi^{\prime} \circ \phi 是仿射的。
  • 如果 ϕ\phi 是双射的,仿射映射保持几何结构不变。它们还保留维度和平行性。