阅读翻译Mathematics for Machine Learning之2.6 Generating Set and Basis

70 阅读1分钟

阅读翻译Mathematics for Machine Learning之2.6 Generating Set and Basis

关于:

  • 首次发表日期:2024-07-19
  • Mathematics for Machine Learning官方链接: mml-book.com
  • ChatGPT和KIMI机翻,人工润色
  • 非数学专业,如有错误,请不吝指出

2.6.1 Basis and Rank (基与秩)

定义 2.13(生成集与张成)。考虑一个向量空间 V=(V,+,)V=(\mathcal{V}, +, \cdot) 和一组向量 A={x1,,xk}V\mathcal{A}=\left\{\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k\right\} \subseteq \mathcal{V}。如果 V\mathcal{V} 中的每一个向量 v\boldsymbol{v} 都可以表示为 x1,,xk\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k 的线性组合,则称 A\mathcal{A}VV 的一个生成集。向量 A\mathcal{A} 中所有向量的线性组合构成的集合称为 A\mathcal{A} 的张成。如果 A\mathcal{A} 张成了向量空间 VV,我们写作 V=span[A]V=\operatorname{span}[\mathcal{A}]V=span[x1,,xk]V=\operatorname{span}\left[\boldsymbol{x}_1, \ldots, \boldsymbol{x}_k\right]

生成集是张成向量(子)空间的向量集合,即每一个向量都可以表示为生成集中向量的线性组合。现在,我们将更加具体地描述张成向量(子)空间的最小生成集。

定义 2.14(基)。考虑一个向量空间 V=(V,+,)V=(\mathcal{V}, +, \cdot)AV\mathcal{A} \subseteq \mathcal{V}。如果不存在比 A\mathcal{A} 更小的集合 A~AV\tilde{\mathcal{A}} \subsetneq \mathcal{A} \subseteq \mathcal{V} 能张成 VV,那么VV 的生成集 A\mathcal{A} 被称为最小生成集VV 的每一个线性无关的生成集都是最小的,并且被称为 VV 的一个基。

V=(V,+,)V=(\mathcal{V},+, \cdot) 是一个向量空间,BV,B\mathcal{B} \subseteq \mathcal{V}, \mathcal{B} \neq \emptyset。那么,以下陈述是等价的:

  • B\mathcal{B}VV 的一个基。
  • B\mathcal{B} 是一个最小生成集。
  • B\mathcal{B}VV 中的最大线性无关向量集,即向这个集合中添加任何其他向量都会使其线性相关。
  • 每一个向量 xV\boldsymbol{x} \in V 都是来自 B\mathcal{B} 的向量的线性组合,并且每个线性组合都是唯一的,即:
x=i=1kλibi=i=1kψibi(2.77)\boldsymbol{x}=\sum_{i=1}^k \lambda_i \boldsymbol{b}_i=\sum_{i=1}^k \psi_i \boldsymbol{b}_i \tag{2.77}

λi,ψiR,biB\lambda_i, \psi_i \in \mathbb{R}, \boldsymbol{b}_i \in \mathcal{B},这意味着 λi=ψi,i=1,,k\lambda_i=\psi_i, i=1, \ldots, k

基是一个最小的生成集和一个最大的线性无关向量集合。


**例2.16**
  • R3\mathbb{R}^3 中,标准基是
B={[100],[010],[001]}\mathcal{B}=\left\{\left[\begin{array}{l} 1 \\ 0 \\ 0 \end{array}\right],\left[\begin{array}{l} 0 \\ 1 \\ 0 \end{array}\right],\left[\begin{array}{l} 0 \\ 0 \\ 1 \end{array}\right]\right\}
  • R3\mathbb{R}^3 中不同的基是
B1={[100],[110],[111]},B2={[0.50.80.4],[1.80.30.3],[2.21.33.5]}.\mathcal{B}_1=\left\{\left[\begin{array}{l} 1 \\ 0 \\ 0 \end{array}\right],\left[\begin{array}{l} 1 \\ 1 \\ 0 \end{array}\right],\left[\begin{array}{l} 1 \\ 1 \\ 1 \end{array}\right]\right\}, \mathcal{B}_2=\left\{\left[\begin{array}{l} 0.5 \\ 0.8 \\ 0.4 \end{array}\right],\left[\begin{array}{l} 1.8 \\ 0.3 \\ 0.3 \end{array}\right],\left[\begin{array}{c} -2.2 \\ -1.3 \\ 3.5 \end{array}\right]\right\} .
  • 集合
A={[1234],[2102],[1104]}\mathcal{A}=\left\{\left[\begin{array}{l} 1 \\ 2 \\ 3 \\ 4 \end{array}\right],\left[\begin{array}{c} 2 \\ -1 \\ 0 \\ 2 \end{array}\right],\left[\begin{array}{c} 1 \\ 1 \\ 0 \\ -4 \end{array}\right]\right\}

是线性无关的,但不是 R4\mathbb{R}^4 的生成集(也不是基):例如,向量 [1,0,0,0][1,0,0,0]^{\top} 不能通过 A\mathcal{A} 中元素的线性组合得到。


注释 每个向量空间 VV 都有一个基 B\mathcal{B}。前面的例子表明,一个向量空间 VV 可以有许多不同的基,即没有唯一的基。然而,所有的基都具有相同数量的元素,即基向量

我们只考虑有限维向量空间 VV。在这种情况下,VV 的维数是其基向量的数量,记作 dim(V)\operatorname{dim}(V)。如果 UVU \subseteq VVV 的子空间,则 dim(U)dim(V)\operatorname{dim}(U) \leqslant \operatorname{dim}(V),且当且仅当 U=VU=Vdim(U)=dim(V)\operatorname{dim}(U) = \operatorname{dim}(V) 。直观地说,向量空间的维数可以理解为这个空间中独立方向的数量。

注释 向量空间的维数不一定是向量中元素的数量。例如,向量空间 V=span[[01]]V=\operatorname{span}[\left[\begin{array}{l}0 \\ 1\end{array}\right]] 是一维的,尽管基向量具有两个元素。

向量空间的维数对应于其基向量的数量。

注释 子空间 U=span[x1,,xm]RnU=\operatorname{span}\left[\boldsymbol{x}_1, \ldots, \boldsymbol{x}_m\right] \subseteq \mathbb{R}^n 的一个基可以通过以下步骤找到:

  1. 将张成向量写成矩阵 A\boldsymbol{A} 的列。
  2. 求解矩阵 A\boldsymbol{A} 的行阶梯形式。
  3. 与枢轴列相关联的张成向量构成 UU 的一个基。

2.6.2 Rank(秩)

一个矩阵 ARm×n\boldsymbol{A} \in \mathbb{R}^{m \times n} 的线性无关列的数量等于线性无关行的数量,并且被称为 A\boldsymbol{A} 的秩,表示为 rk(A)\operatorname{rk}(\boldsymbol{A})

注释。矩阵的秩具有一些重要性质:

  • rk(A)=rk(A)\operatorname{rk}(\boldsymbol{A})=\operatorname{rk}\left(\boldsymbol{A}^{\top}\right),即,列秩等于行秩。
  • ARm×n\boldsymbol{A} \in \mathbb{R}^{m \times n} 的列张成一个子空间 URmU \subseteq \mathbb{R}^m,其维数为 dim(U)=rk(A)\operatorname{dim}(U)=\operatorname{rk}(\boldsymbol{A})。稍后我们将这个子空间称为像或值域。通过应用高斯消元法到 A\boldsymbol{A} 可以找到 UU 的一个基,以识别枢轴列。
  • ARm×n\boldsymbol{A} \in \mathbb{R}^{m \times n} 的行张成一个子空间 WRnW \subseteq \mathbb{R}^n,其维数为 dim(W)=rk(A)\operatorname{dim}(W)=\operatorname{rk}(\boldsymbol{A})。通过应用高斯消元法到 A\boldsymbol{A}^{\top} 可以找到 WW 的一个基。
  • 对于所有的 ARn×n\boldsymbol{A} \in \mathbb{R}^{n \times n},如果且仅如果 rk(A)=n\operatorname{rk}(\boldsymbol{A})=nA\boldsymbol{A} 是正则的(可逆的)。
  • 对于所有的 ARm×n\boldsymbol{A} \in \mathbb{R}^{m \times n} 和所有的 bRm\boldsymbol{b} \in \mathbb{R}^m,线性方程组 Ax=b\boldsymbol{A} \boldsymbol{x}=\boldsymbol{b} 可以求解当且仅当 rk(A)=rk(Ab)\operatorname{rk}(\boldsymbol{A})=\operatorname{rk}(\boldsymbol{A} \mid \boldsymbol{b}),其中 Ab\boldsymbol{A} \mid \boldsymbol{b} 表示增广系统。
  • 对于 ARm×n\boldsymbol{A} \in \mathbb{R}^{m \times n}Ax=0\boldsymbol{A x}=\mathbf{0} 的解空间具有维数 nrk(A)n-\operatorname{rk}(\boldsymbol{A})。稍后,我们将这个子空间称为核或零空间。
  • 如果矩阵 ARm×n\boldsymbol{A} \in \mathbb{R}^{m \times n} 的秩等于相同维度矩阵的最大可能秩,则称其具有满秩。这意味着满秩矩阵的秩是行数和列数中的较小者,即 rk(A)=min(m,n)\operatorname{rk}(\boldsymbol{A})=\min (m, n)。如果矩阵没有满秩,则称其为秩亏损的。

例子2.18(秩)
  • A=[101011000]\boldsymbol{A}=\left[\begin{array}{lll}1 & 0 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 0\end{array}\right]

矩阵 A\boldsymbol{A} 有两行/列是线性无关的,因此 rk(A)=2\operatorname{rk}(\boldsymbol{A})=2

  • A=[121231350]\boldsymbol{A}=\left[\begin{array}{ccc}1 & 2 & 1 \\ -2 & -3 & 1 \\ 3 & 5 & 0\end{array}\right]

我们使用高斯消元法来确定秩:

[121231350][121013000].\left[\begin{array}{ccc} 1 & 2 & 1 \\ -2 & -3 & 1 \\ 3 & 5 & 0 \end{array}\right] \rightsquigarrow \cdots \rightsquigarrow\left[\begin{array}{ccc} 1 & 2 & 1 \\ 0 & 1 & 3 \\ 0 & 0 & 0 \end{array}\right] .

在这里,我们看到线性无关的行和列的数量是 2,因此 rk(A)=2\operatorname{rk}(\boldsymbol{A})=2