第三章矩阵-3.列空间以及秩以及零空间列空间以及秩以及零空间列空间、秩、零空间是线性代数中理解矩阵“行为”的三大核心概

列空间以及秩以及零空间

列空间、秩、零空间是线性代数中理解矩阵“行为”的三大核心概念。它们分别描述了：

列空间（Column Space）：矩阵能把向量“映射到哪里”？
秩（Rank）：这个映射能覆盖多大维度的空间？
零空间（Null Space）：哪些向量会被“压扁”成零？

下面用清晰定义 + 三维直观例子 + 几何图像为你彻底讲透。

1.线性变换

线性变换通用定义：若映射 $T: \mathbb R^n \to \mathbb R^m$ ，满足

T(\boldsymbol\alpha+\boldsymbol\beta)=T(\boldsymbol\alpha)+T(\boldsymbol\beta),\quad T(k\boldsymbol\alpha)=kT(\boldsymbol\alpha)

它就是线性变换，对应矩阵是： $\boldsymbol A_{m\times n}$

分清两种场景

① 方阵 $n\times n$ ：同一个空间内部变换

$T:\mathbb R^n \to \mathbb R^n$

输入n维，输出还是n维
旋转、镜像、伸缩、二维平面变换，大多是方阵
能求行列式、可逆、特征值（这些只有方阵才有）

② 非方阵 $m\times n,\ m\ne n$ ：不同空间之间线性映射

你刚才的投影就是经典例子：

T:\mathbb R^3\to\mathbb R^2,\quad A=\begin{pmatrix}1&0&0\\0&1&0\end{pmatrix}_{2\times 3}

✅ 它妥妥是标准线性变换 特点：

降维映射、升维嵌入都属于线性变换
非方阵：没有行列式、没有逆矩阵、不谈特征值

高频实例帮你固化理解

三维→二维投影（2×3非方阵）：线性变换 ✅
二维→三维嵌入（3×2非方阵）：

(x,y)\mapsto(x,y,0),\quad A=\begin{pmatrix}1&0\\0&1\\0&0\end{pmatrix}

也是线性变换 ✅

平面旋转（2×2方阵）：线性变换 ✅

一句话极简记忆

线性变换：任意 $\boldsymbol A_{m\times n}$ 都能代表，跨维度也可以
行列式、逆、特征值：专属 n阶方阵 结合你刚才学的投影矩阵，完美印证：非方阵照样是线性变换。

线性变换的公式是：

$\mathbf{y} = A \mathbf{x}$

在线性代数中，我们通常将向量视为列向量（竖着写的）。 例如：

输入向量 $\mathbf{x}$ 是 3 维的，所以它是一个 $3 \times 1$ 的矩阵（3 行 1 列）。
输出向量 $\mathbf{y}$ 是 2 维的，所以它是一个 $2 \times 1$ 的矩阵（2 行 1 列）。

根据矩阵乘法规则：“前一个矩阵的列数”必须等于“后一个矩阵的行数”，结果的行数取前者，列数取后者。即： $(m \times n) \cdot (n \times p) = (m \times p)$

所以， $A$ 的维度必须是 $2 \times 3$ 。

$\underbrace{(2 \times 3)}_{A} \cdot \underbrace{(3 \times 1)}_{\mathbf{x}} = \underbrace{(2 \times 1)}_{\mathbf{y}}$

具体例子：

假设变换 $T: \mathbb{R}^3 \to \mathbb{R}^2$ 定义为投影： $(x, y, z) \mapsto (x, y)$ 。

输入 $(1, 0, 0)$ (3维) $\to$ 输出 $(1, 0)$ (2维)。这是矩阵的第 1 列。
输入 $(0, 1, 0)$ (3维) $\to$ 输出 $(0, 1)$ (2维)。这是矩阵的第 2 列。
输入 $(0, 0, 1)$ (3维) $\to$ 输出 $(0, 0)$ (2维)。这是矩阵的第 3 列。

拼起来就是： $A = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \end{pmatrix}$ 这是一个 2 行 3 列 的矩阵。

所以：矩阵的形状是 (输出维度) $\times$ (输入维度)。也就是：行数看输出，列数看输入。

总结对照表

变换方向	输入维度 ( $\mathbf{x}$ )	输出维度 ( $\mathbf{y}$ )	矩阵 $A$ 的维度	矩阵形状描述	是否有行列式
3 维 $\to$ 2 维	3	2	$2 \times 3$	2 行，3 列 (扁胖子)	无
2 维 $\to$ 3 维	2	3	$3 \times 2$	3 行，2 列 (高瘦子)	无
3 维 $\to$ 3 维	3	3	$3 \times 3$	3 行，3 列 (方阵)	有

由此引入秩：用一个数值，精确描述变换后空间的维度。

原文两层定义

几何直观定义：线性变换后输出空间的维数
精确代数定义：秩表示矩阵列空间的维数

形象比喻：

输出空间的维度：是「目的地整个大房间」的总维数，固定死；
列空间的维数（就是秩）：是「你实际映射过去，真正占了多大子空间」，是有效承载维度。

变换 $T:\mathbb R^3\to \mathbb R^2$

A= \begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0 \end{pmatrix}_{2\times 3}

1. 输出空间的维度

映射终点是 $\boldsymbol{\mathbb R^2}$

👉 输出空间维度 = 2

含义：整个目标空间天生就是2维平面，不管你怎么映射，房间本身大小不变。

2. 列空间 & 列空间的维数

列空间 $C(A)$ ：矩阵所有列向量张成的空间，列空间的维数也即线性无关的列数

线性无关列判断方法肉眼观察（简单快速）：

有零列：零列一定和其他列线性相关
两列成比例：必相关
单位矩阵各列：天然两两无关

C(A)=\mathrm{span}\!\left\{ \begin{pmatrix}1\\0\end{pmatrix},\; \begin{pmatrix}0\\1\end{pmatrix},\; \begin{pmatrix}0\\0\end{pmatrix} \right\}

例题解释列空间的维数和输出空间的维度

👉 列空间的维数 $=\mathrm{rank}(A) = \boldsymbol{2}$

这里刚好相等，再看反例区别。

设

B= \begin{pmatrix} 1 & 2\\ 2 & 4 \end{pmatrix}_{2\times 2}

映射依然是 $\mathbb R^2\to \mathbb R^2$

输出空间的维度：终点是 $\mathbb R^2$ ，维度 = $\boldsymbol{2}$
求秩： $\mathrm r(B)=1$

👉 列空间的维数 = 1

✅ 区别肉眼可见：

目标房间是2维平面，但你的映射只铺满了一条1维直线，没占满整个房间。

结合例子理解

2×2矩阵
- 秩=2：变换后仍张成整个二维平面， $\det\neq0$ ，满秩；
- 秩=1：变换后所有向量落在一条直线上（二维→一维压缩）， $\det=0$ ；
3×3矩阵
- 秩=3：输出充满整个三维空间， $\det\neq0$ ，满秩；
- 秩=2：输出是二维平面（三维→二维压缩）， $\det=0$ ；
- 秩=1：输出是一维直线（三维→一维压缩）， $\det=0$ 。
线性变换全体坍缩为一点 $\iff$ 变换矩阵是全零矩阵 $\iff$ 矩阵秩为0。

举例：三维→二维压缩成一个点

T(x,y,z) = (0,0)

变换矩阵：

A= \begin{pmatrix} 0 & 0 & 0\\ 0 & 0 & 0 \end{pmatrix}_{2\times 3}

验算：

\begin{pmatrix}0&0&0\\0&0&0\end{pmatrix} \begin{pmatrix}x\\y\\z\end{pmatrix} = \begin{pmatrix}0\\0\end{pmatrix}

✅ 所有三维向量，全部被压成二维原点一个点

满秩定义

当秩 = 矩阵的列数（方阵中即阶数），称为满秩。

非满秩 ⇨ 变换有压缩、不可逆、行列式为零。
满秩 ⇨ 变换无压缩、可逆、行列式非零；

非满秩如：

A = \begin{bmatrix} 1 & 2 & 3 \\ 0 & 1 & 4 \\ 0 & 0 & 0 \end{bmatrix}

满秩：

B = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix} = I_3

总结：

方阵行列式为零 ⇨ 线性变换发生空间压缩 ⇨ 压缩后空间的维度 = 秩 ⇨ 所有变换输出的集合 = 列空间 ⇨ 被压缩到原点的输入集合 = 零空间

它解决了一个关键问题：同样行列式为0，不同矩阵的压缩程度不一样，用「秩」做精细区分。

与线性方程组解的直接关联

对齐次线性方程组 $A\vec{x}=\vec{0}$ ：

它的所有解，恰好就是这个矩阵的零空间；
满秩矩阵：零空间只有零向量一个元素 ⇨ $A\vec{x}=\vec{0}$ 仅有零解 $\vec{x}=\vec{0}$ ；
非满秩矩阵：零空间是一维/二维…的子空间 ⇨ $A\vec{x}=\vec{0}$ 有无穷多非零解。

概念间的核心关系梳理

概念	含义	与其他概念的绑定
行列式 $\det(A)$	变换的缩放/定向因子，是否降维	$\det\neq0\Leftrightarrow$ 满秩； $\det=0\Leftrightarrow$ 非满秩
列空间	变换的所有输出集合	由矩阵列向量张成，其维数=秩
秩	列空间的维数、输出空间的维度	满秩=列数，对应变换可逆、无空间压缩
零空间	变换中被映射到 $\vec{0}$ 的所有输入集合	是齐次方程 $A\vec{x}=\vec{0}$ 的全部解

重要延伸定理（秩-零化度定理，原文未提但可辅助理解）

对 $m\times n$ 矩阵，恒成立： $\text{秩}(A) + \text{零化度}(A) = n$

零化度：零空间的维数； - $n$ ：矩阵列数（原输入空间的维度）。

用原文例子验证：

3×3矩阵，秩=2（输出是平面），则零化度 $=1$ （零空间是直线），和你文中描述完全一致；
3×3矩阵，秩=1（输出是直线），则零化度 $=2$ （零空间是平面），也和文中几何描述严格匹配。

这个定理定量解释了：输出空间维度减少多少，就有多少维度的输入向量被压缩到原点。

2.列空间（Column Space）

✅ 定义：

矩阵 $A$ 的列空间，记作 $\operatorname{Col}(A)$ ，是由 $A$ 的所有列向量张成的子空间。

换句话说：

所有形如 $A\mathbf{x}$ 的向量（即 $A$ 的输出）构成的集合，就是列空间。

🔹 三维例子：

设

A = \begin{bmatrix} 1 & 2 & 3 \\ 0 & 1 & 4 \\ 0 & 0 & 0 \end{bmatrix}

列向量为：

\mathbf{a}_1 = \begin{bmatrix}1\\0\\0\end{bmatrix},\quad \mathbf{a}_2 = \begin{bmatrix}2\\1\\0\end{bmatrix},\quad \mathbf{a}_3 = \begin{bmatrix}3\\4\\0\end{bmatrix}

注意：所有列向量的 z 分量都是 0 → 它们都落在 xy 平面上！
虽然有3个向量，但 $\mathbf{a}_3 = -5\mathbf{a}_1 + 4\mathbf{a}_2$ （可验证），所以实际只有2个线性无关向量。

✅ 结论： $\operatorname{Col}( A ) =$ xy 平面（一个二维子空间）

🌟 几何意义：
无论你输入什么 $\mathbf{x} \in \mathbb{R}^3$ ，输出 $A\mathbf{x}$ 永远在 xy 平面上 —— 空间被“压扁”了！

二、秩（Rank）

✅ 定义：

矩阵 $A$ 的秩，记作 $\operatorname{rank}(A)$ ，是其列空间的维数，即线性无关列向量的最大个数。

也等于行空间的维数（行秩 = 列秩）

🔹 接上例：

A = \begin{bmatrix} 1 & 2 & 3 \\ 0 & 1 & 4 \\ 0 & 0 & 0 \end{bmatrix}

列向量中， $\mathbf{a}_1, \mathbf{a}_2$ 线性无关（不成比例） - $\mathbf{a}_3$ 可由前两个表示 → 不增加维度

✅ 所以： $\operatorname{rank}(A) = 2$

🔸 对比另一个例子（满秩）：

B = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix} = I_3

列空间 = 整个 $\mathbb{R}^3$ - $\operatorname{rank}(B) = 3$ （满秩）

🔸 再对比（秩为1）：

C = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 3 & 6 & 9 \end{bmatrix}

所有列都是 $\begin{bmatrix}1\\2\\3\end{bmatrix}$ 的倍数
列空间 = 一条过原点的直线 - $\operatorname{rank}(C) = 1$

三、零空间（Null Space / Kernel）

✅ 定义：

矩阵 $A$ 的零空间，记作 $\operatorname{Null}(A)$ 或 $\ker(A)$ ，是所有满足

A\mathbf{x} = \mathbf{0}

的向量 $\mathbf{x}$ 构成的集合。

即：被 $A$ “压扁”成零向量的所有输入。

🔹 回到第一个例子：

A = \begin{bmatrix} 1 & 2 & 3 \\ 0 & 1 & 4 \\ 0 & 0 & 0 \end{bmatrix}

解 $A\mathbf{x} = \mathbf{0}$ ：

\begin{cases} x + 2y + 3z = 0 \\ \quad y + 4z = 0 \\ \quad 0 = 0 \end{cases} \Rightarrow \begin{cases} y = -4z \\ x = -2y - 3z = 8z - 3z = 5z \end{cases}

令 $z = t$ （自由变量），则解为：

\mathbf{x} = t \begin{bmatrix} 5 \\ -4 \\ 1 \end{bmatrix}, \quad t \in \mathbb{R}

✅ 零空间 = 由 $\begin{bmatrix}5\\-4\\1\end{bmatrix}$ 张成的一条直线

🌟 几何意义：
这条直线上的所有向量，经过 $A$ 变换后都变成 $\mathbf{0}$ —— 它们被“完全压扁”了！

四、三大概念的关系：秩-零化度定理（Rank-Nullity Theorem）

这是连接它们的核心公式：

\boxed{ \operatorname{rank}(A) + \dim(\operatorname{Null}(A)) = n }

其中 $n$ 是 $A$ 的列数（即输入空间的维数）。

🔹 验证我们的例子：

$A$ 是 $3 \times 3$ 矩阵 → $n = 3$
$\operatorname{rank}(A) = 2$
$\dim(\operatorname{Null}(A)) = 1$ （一条直线，维数=1）
$2 + 1 = 3$ ✅ 成立！

其他例子：

矩阵	秩	零空间维数	输入维数
$I_3$	3	0（只有零向量）	3
$C$ （秩1）	1	2（一个平面）	3

💡 直觉：
矩阵“保留”的维度（秩） + “丢失”的维度（零空间维数） = 原始输入维度

五、三维几何全景图

想象一个 $3 \times 3$ 矩阵 $A$ 作为空间变换器：

情况	列空间	秩	零空间	几何效果
满秩（rank=3）	整个 $\mathbb{R}^3$	3	$\{\mathbf{0}\}$	空间被拉伸/旋转，但不压扁（可逆）
秩=2	一个平面（如 xy 平面）	2	一条直线	3D → 2D（压成平面），沿某方向坍缩
秩=1	一条直线	1	一个平面	3D → 1D（压成线），整个平面坍缩到原点
秩=0	$\{\mathbf{0}\}$	0	整个 $\mathbb{R}^3$	一切归零（零矩阵）

✅ 总结一句话

列空间：矩阵能“到达”的地方（输出空间）

秩：这个空间有多大（维数）

零空间：被“消灭”的输入（映射到零的向量）

三者关系： $\text{秩} + \text{零空间维数} = \text{输入维数}$

掌握这三个概念，你就真正理解了矩阵如何扭曲、压缩、映射空间——这是计算机图形学、机器学习、物理模拟等领域的基石！

六、参考文献

本文参考AI回答，豆包，Deepseek,千问

第三章矩阵-3.列空间以及秩以及零空间

列空间以及秩以及零空间

1.线性变换

分清两种场景

① 方阵 n×nn\times nn×n：同一个空间内部变换

② 非方阵 m×n, m≠nm\times n,\ m\ne nm×n, m=n：不同空间之间线性映射

高频实例帮你固化理解

一句话极简记忆

线性变换的公式是：

总结对照表

由此引入秩：用一个数值，精确描述变换后空间的维度。

原文两层定义

1. 输出空间的维度

2. 列空间 & 列空间的维数

结合例子理解

满秩定义

总结：

与线性方程组解的直接关联

概念间的核心关系梳理

重要延伸定理（秩-零化度定理，原文未提但可辅助理解）

2.列空间（Column Space）

✅ 定义：

🔹 三维例子：

二、秩（Rank）

✅ 定义：

🔹 接上例：

🔸 对比另一个例子（满秩）：

🔸 再对比（秩为1）：

三、零空间（Null Space / Kernel）

✅ 定义：

🔹 回到第一个例子：

四、三大概念的关系：秩-零化度定理（Rank-Nullity Theorem）

🔹 验证我们的例子：

其他例子：

五、三维几何全景图

✅ 总结一句话

六、参考文献

① 方阵 $n\times n$ ：同一个空间内部变换

② 非方阵 $m\times n,\ m\ne n$ ：不同空间之间线性映射