第三章矩阵-3.列空间以及秩以及零空间

6 阅读2分钟

列空间以及秩以及零空间

列空间、秩、零空间是线性代数中理解矩阵“行为”的三大核心概念。它们分别描述了:

  • 列空间(Column Space):矩阵能把向量“映射到哪里”?
  • 秩(Rank):这个映射能覆盖多大维度的空间?
  • 零空间(Null Space):哪些向量会被“压扁”成零?

下面用清晰定义 + 三维直观例子 + 几何图像为你彻底讲透。

1.线性变换

线性变换通用定义: 若映射 T:RnRmT: \mathbb R^n \to \mathbb R^m,满足

T(α+β)=T(α)+T(β),T(kα)=kT(α)T(\boldsymbol\alpha+\boldsymbol\beta)=T(\boldsymbol\alpha)+T(\boldsymbol\beta),\quad T(k\boldsymbol\alpha)=kT(\boldsymbol\alpha)

它就是线性变换,对应矩阵是:Am×n\boldsymbol A_{m\times n}


分清两种场景

① 方阵 n×nn\times n:同一个空间内部变换

T:RnRnT:\mathbb R^n \to \mathbb R^n

  • 输入n维,输出还是n维
  • 旋转、镜像、伸缩、二维平面变换,大多是方阵
  • 能求行列式、可逆、特征值(这些只有方阵才有
② 非方阵 m×n, mnm\times n,\ m\ne n:不同空间之间线性映射

你刚才的投影就是经典例子:

T:R3R2,A=(100010)2×3T:\mathbb R^3\to\mathbb R^2,\quad A=\begin{pmatrix}1&0&0\\0&1&0\end{pmatrix}_{2\times 3}

✅ 它妥妥是标准线性变换 特点:

  • 降维映射、升维嵌入都属于线性变换
  • 非方阵:没有行列式、没有逆矩阵、不谈特征值

3 高频实例帮你固化理解

  1. 三维→二维投影(2×3非方阵):线性变换 ✅
  2. 二维→三维嵌入(3×2非方阵):
(x,y)(x,y,0),A=(100100)(x,y)\mapsto(x,y,0),\quad A=\begin{pmatrix}1&0\\0&1\\0&0\end{pmatrix}

也是线性变换 ✅

  1. 平面旋转(2×2方阵):线性变换 ✅

4 一句话极简记忆

  • 线性变换:任意 Am×n\boldsymbol A_{m\times n} 都能代表,跨维度也可以
  • 行列式、逆、特征值:专属 n阶方阵 结合你刚才学的投影矩阵,完美印证:非方阵照样是线性变换。

5.线性变换的公式是:

y=Ax\mathbf{y} = A \mathbf{x}

在线性代数中,我们通常将向量视为列向量(竖着写的)。 例如:

  • 输入向量 x\mathbf{x} 是 3 维的,所以它是一个 3×13 \times 1 的矩阵(3 行 1 列)。
  • 输出向量 y\mathbf{y} 是 2 维的,所以它是一个 2×12 \times 1 的矩阵(2 行 1 列)。

根据矩阵乘法规则:“前一个矩阵的列数”必须等于“后一个矩阵的行数”,结果的行数取前者,列数取后者。 即:(m×n)(n×p)=(m×p)(m \times n) \cdot (n \times p) = (m \times p)

所以,AA 的维度必须是 2×32 \times 3

(2×3)A(3×1)x=(2×1)y\underbrace{(2 \times 3)}_{A} \cdot \underbrace{(3 \times 1)}_{\mathbf{x}} = \underbrace{(2 \times 1)}_{\mathbf{y}}

具体例子:

假设变换 T:R3R2T: \mathbb{R}^3 \to \mathbb{R}^2 定义为投影:(x,y,z)(x,y)(x, y, z) \mapsto (x, y)

  • 输入 (1,0,0)(1, 0, 0) (3维) \to 输出 (1,0)(1, 0) (2维)。这是矩阵的第 1 列
  • 输入 (0,1,0)(0, 1, 0) (3维) \to 输出 (0,1)(0, 1) (2维)。这是矩阵的第 2 列
  • 输入 (0,0,1)(0, 0, 1) (3维) \to 输出 (0,0)(0, 0) (2维)。这是矩阵的第 3 列

拼起来就是: A=(100010)A = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \end{pmatrix} 这是一个 2 行 3 列 的矩阵。

所以:矩阵的形状是 (输出维度) ×\times (输入维度)。也就是:行数看输出,列数看输入

总结对照表
变换方向输入维度 (x\mathbf{x})输出维度 (y\mathbf{y})矩阵 AA 的维度矩阵形状描述是否有行列式
3 维 \to 2 维322×32 \times 32 行,3 列 (扁胖子)
2 维 \to 3 维233×23 \times 23 行,2 列 (高瘦子)
3 维 \to 3 维333×33 \times 33 行,3 列 (方阵)

由此引入:用一个数值,精确描述变换后空间的维度。

原文两层定义
  1. 几何直观定义:线性变换后输出空间的维数
  2. 精确代数定义:秩表示矩阵列空间的维数

形象比喻:

  • 输出空间的维度:是「目的地整个大房间」的总维数,固定死;

  • 列空间的维数(就是秩):是「你实际映射过去,真正占了多大子空间」,是有效承载维度。

变换 T:R3R2T:\mathbb R^3\to \mathbb R^2

A=(100010)2×3 A= \begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0 \end{pmatrix}_{2\times 3}
1. 输出空间的维度

映射终点是 R2\boldsymbol{\mathbb R^2}

👉 输出空间维度 = 2

含义:整个目标空间天生就是2维平面,不管你怎么映射,房间本身大小不变。

2. 列空间 & 列空间的维数

列空间 C(A)C(A):矩阵所有列向量张成的空间,列空间的维数也即线性无关的列数

线性无关列判断方法肉眼观察(简单快速):

  1. 零列:零列一定和其他列线性相关
  2. 两列成比例:必相关
  3. 单位矩阵各列:天然两两无关
C(A)=span ⁣{(10),  (01),  (00)} C(A)=\mathrm{span}\!\left\{ \begin{pmatrix}1\\0\end{pmatrix},\; \begin{pmatrix}0\\1\end{pmatrix},\; \begin{pmatrix}0\\0\end{pmatrix} \right\}

例题解释列空间的维数和输出空间的维度

👉 列空间的维数 =rank(A)=2=\mathrm{rank}(A) = \boldsymbol{2}

这里刚好相等,再看反例区别。

B=(1224)2×2 B= \begin{pmatrix} 1 & 2\\ 2 & 4 \end{pmatrix}_{2\times 2}

映射依然是 R2R2\mathbb R^2\to \mathbb R^2

  1. 输出空间的维度:终点是R2\mathbb R^2,维度 = 2\boldsymbol{2}

  2. 求秩:r(B)=1\mathrm r(B)=1

👉 列空间的维数 = 1

✅ 区别肉眼可见:

目标房间是2维平面,但你的映射只铺满了一条1维直线,没占满整个房间。

结合例子理解
  • 2×2矩阵

    • 秩=2:变换后仍张成整个二维平面,det0\det\neq0满秩
    • 秩=1:变换后所有向量落在一条直线上(二维→一维压缩),det=0\det=0
  • 3×3矩阵

    • 秩=3:输出充满整个三维空间,det0\det\neq0,满秩;
    • 秩=2:输出是二维平面(三维→二维压缩),det=0\det=0
    • 秩=1:输出是一维直线(三维→一维压缩),det=0\det=0
  • 线性变换全体坍缩为一点     \iff 变换矩阵是全零矩阵     \iff 矩阵秩为0。

举例:三维→二维 压缩成一个点

T(x,y,z)=(0,0)T(x,y,z) = (0,0)

变换矩阵:

A=(000000)2×3A= \begin{pmatrix} 0 & 0 & 0\\ 0 & 0 & 0 \end{pmatrix}_{2\times 3}

验算:

(000000)(xyz)=(00)\begin{pmatrix}0&0&0\\0&0&0\end{pmatrix} \begin{pmatrix}x\\y\\z\end{pmatrix} = \begin{pmatrix}0\\0\end{pmatrix}

✅ 所有三维向量,全部被压成二维原点一个点

满秩定义

当秩 = 矩阵的列数(方阵中即阶数),称为满秩

  • 非满秩 ⇨ 变换有压缩、不可逆、行列式为零。
  • 满秩 ⇨ 变换无压缩、可逆、行列式非零;

非满秩如:

A=[123014000]A = \begin{bmatrix} 1 & 2 & 3 \\ 0 & 1 & 4 \\ 0 & 0 & 0 \end{bmatrix}

满秩:

B=[100010001]=I3B = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix} = I_3
总结:

方阵行列式为零 ⇨ 线性变换发生空间压缩 ⇨ 压缩后空间的维度 = 秩 ⇨ 所有变换输出的集合 = 列空间 ⇨ 被压缩到原点的输入集合 = 零空间

它解决了一个关键问题:同样行列式为0,不同矩阵的压缩程度不一样,用「秩」做精细区分

与线性方程组解的直接关联

齐次线性方程组Ax=0A\vec{x}=\vec{0}

  • 它的所有解,恰好就是这个矩阵的零空间
  • 满秩矩阵:零空间只有零向量一个元素 ⇨Ax=0A\vec{x}=\vec{0}仅有零解x=0\vec{x}=\vec{0}
  • 非满秩矩阵:零空间是一维/二维…的子空间 ⇨Ax=0A\vec{x}=\vec{0}有无穷多非零解。
概念间的核心关系梳理
概念含义与其他概念的绑定
行列式det(A)\det(A)变换的缩放/定向因子,是否降维det0\det\neq0\Leftrightarrow满秩;det=0\det=0\Leftrightarrow非满秩
列空间变换的所有输出集合由矩阵列向量张成,其维数=秩
列空间的维数、输出空间的维度满秩=列数,对应变换可逆、无空间压缩
零空间变换中被映射到0\vec{0}所有输入集合是齐次方程Ax=0A\vec{x}=\vec{0}的全部解
重要延伸定理(秩-零化度定理,原文未提但可辅助理解)

m×nm\times n矩阵,恒成立: (A)+零化度(A)=n\text{秩}(A) + \text{零化度}(A) = n

  • 零化度:零空间的维数; -nn:矩阵列数(原输入空间的维度)。

用原文例子验证:

  • 3×3矩阵,秩=2(输出是平面),则零化度=1=1(零空间是直线),和你文中描述完全一致;
  • 3×3矩阵,秩=1(输出是直线),则零化度=2=2(零空间是平面),也和文中几何描述严格匹配。

这个定理定量解释了:输出空间维度减少多少,就有多少维度的输入向量被压缩到原点


2.列空间(Column Space)

✅ 定义:

矩阵AA列空间,记作Col(A)\operatorname{Col}(A),是由AA的所有列向量张成的子空间

换句话说:

所有形如AxA\mathbf{x}的向量(即AA的输出)构成的集合,就是列空间。

🔹 三维例子:

A=[123014000]A = \begin{bmatrix} 1 & 2 & 3 \\ 0 & 1 & 4 \\ 0 & 0 & 0 \end{bmatrix}
  • 列向量为:
a1=[100],a2=[210],a3=[340] \mathbf{a}_1 = \begin{bmatrix}1\\0\\0\end{bmatrix},\quad \mathbf{a}_2 = \begin{bmatrix}2\\1\\0\end{bmatrix},\quad \mathbf{a}_3 = \begin{bmatrix}3\\4\\0\end{bmatrix}
  • 注意:所有列向量的 z 分量都是 0 → 它们都落在 xy 平面上!

  • 虽然有3个向量,但a3=5a1+4a2\mathbf{a}_3 = -5\mathbf{a}_1 + 4\mathbf{a}_2(可验证),所以实际只有2个线性无关向量。

结论Col(A)=\operatorname{Col}( A ) =xy 平面(一个二维子空间)

🌟 几何意义
无论你输入什么xR3\mathbf{x} \in \mathbb{R}^3,输出AxA\mathbf{x}永远在 xy 平面上 —— 空间被“压扁”了!


二、秩(Rank)

✅ 定义:

矩阵AA,记作rank(A)\operatorname{rank}(A),是其列空间的维数,即线性无关列向量的最大个数

也等于行空间的维数(行秩 = 列秩)

🔹 接上例:

A=[123014000]A = \begin{bmatrix} 1 & 2 & 3 \\ 0 & 1 & 4 \\ 0 & 0 & 0 \end{bmatrix}
  • 列向量中,a1,a2\mathbf{a}_1, \mathbf{a}_2线性无关(不成比例) -a3\mathbf{a}_3可由前两个表示 → 不增加维度

✅ 所以:rank(A)=2\operatorname{rank}(A) = 2

🔸 对比另一个例子(满秩):

B=[100010001]=I3B = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix} = I_3
  • 列空间 = 整个R3\mathbb{R}^3 -rank(B)=3\operatorname{rank}(B) = 3(满秩)

🔸 再对比(秩为1):

C=[123246369]C = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 3 & 6 & 9 \end{bmatrix}
  • 所有列都是[123]\begin{bmatrix}1\\2\\3\end{bmatrix}的倍数
  • 列空间 = 一条过原点的直线 -rank(C)=1\operatorname{rank}(C) = 1

三、零空间(Null Space / Kernel)

✅ 定义:

矩阵AA零空间,记作Null(A)\operatorname{Null}(A)ker(A)\ker(A),是所有满足

Ax=0A\mathbf{x} = \mathbf{0}

的向量x\mathbf{x}构成的集合。

即:被AA“压扁”成零向量的所有输入。

🔹 回到第一个例子:

A=[123014000]A = \begin{bmatrix} 1 & 2 & 3 \\ 0 & 1 & 4 \\ 0 & 0 & 0 \end{bmatrix}

Ax=0A\mathbf{x} = \mathbf{0}

{x+2y+3z=0y+4z=00=0{y=4zx=2y3z=8z3z=5z\begin{cases} x + 2y + 3z = 0 \\ \quad y + 4z = 0 \\ \quad 0 = 0 \end{cases} \Rightarrow \begin{cases} y = -4z \\ x = -2y - 3z = 8z - 3z = 5z \end{cases}

z=tz = t(自由变量),则解为:

x=t[541],tR\mathbf{x} = t \begin{bmatrix} 5 \\ -4 \\ 1 \end{bmatrix}, \quad t \in \mathbb{R}

零空间 = 由[541]\begin{bmatrix}5\\-4\\1\end{bmatrix}张成的一条直线

🌟 几何意义
这条直线上的所有向量,经过AA变换后都变成0\mathbf{0}—— 它们被“完全压扁”了!


四、三大概念的关系:秩-零化度定理(Rank-Nullity Theorem)

这是连接它们的核心公式:

rank(A)+dim(Null(A))=n\boxed{ \operatorname{rank}(A) + \dim(\operatorname{Null}(A)) = n }

其中nnAA列数(即输入空间的维数)。

🔹 验证我们的例子:

  • AA3×33 \times 3矩阵 →n=3n = 3
  • rank(A)=2\operatorname{rank}(A) = 2
  • dim(Null(A))=1\dim(\operatorname{Null}(A)) = 1(一条直线,维数=1)
  • 2+1=32 + 1 = 3✅ 成立!

其他例子:

矩阵零空间维数输入维数
I3I_330(只有零向量)3
CC(秩1)12(一个平面)3

💡 直觉
矩阵“保留”的维度(秩) + “丢失”的维度(零空间维数) = 原始输入维度


五、三维几何全景图

想象一个3×33 \times 3矩阵AA作为空间变换器

情况列空间零空间几何效果
满秩(rank=3)整个R3\mathbb{R}^33{0}\{\mathbf{0}\}空间被拉伸/旋转,但不压扁(可逆)
秩=2一个平面(如 xy 平面)2一条直线3D → 2D(压成平面),沿某方向坍缩
秩=1一条直线1一个平面3D → 1D(压成线),整个平面坍缩到原点
秩=0{0}\{\mathbf{0}\}0整个R3\mathbb{R}^3一切归零(零矩阵)

✅ 总结一句话

  • 列空间:矩阵能“到达”的地方(输出空间)
  • :这个空间有多大(维数)
  • 零空间:被“消灭”的输入(映射到零的向量)
  • 三者关系+零空间维数=输入维数\text{秩} + \text{零空间维数} = \text{输入维数}

掌握这三个概念,你就真正理解了矩阵如何扭曲、压缩、映射空间——这是计算机图形学、机器学习、物理模拟等领域的基石!

六、参考文献

本文参考AI回答,豆包,Deepseek,千问