列空间以及秩以及零空间
列空间、秩、零空间是线性代数中理解矩阵“行为”的三大核心概念。它们分别描述了:
- 列空间(Column Space):矩阵能把向量“映射到哪里”?
- 秩(Rank):这个映射能覆盖多大维度的空间?
- 零空间(Null Space):哪些向量会被“压扁”成零?
下面用清晰定义 + 三维直观例子 + 几何图像为你彻底讲透。
1.线性变换
线性变换通用定义:
若映射 T:Rn→Rm,满足
T(α+β)=T(α)+T(β),T(kα)=kT(α)
它就是线性变换,对应矩阵是:Am×n
分清两种场景
① 方阵 n×n:同一个空间内部变换
T:Rn→Rn
- 输入n维,输出还是n维
- 旋转、镜像、伸缩、二维平面变换,大多是方阵
- 能求行列式、可逆、特征值(这些只有方阵才有)
② 非方阵 m×n, m=n:不同空间之间线性映射
你刚才的投影就是经典例子:
T:R3→R2,A=(100100)2×3
✅ 它妥妥是标准线性变换
特点:
- 降维映射、升维嵌入都属于线性变换
- 非方阵:没有行列式、没有逆矩阵、不谈特征值
3 高频实例帮你固化理解
- 三维→二维投影(2×3非方阵):线性变换 ✅
- 二维→三维嵌入(3×2非方阵):
(x,y)↦(x,y,0),A=100010
也是线性变换 ✅
- 平面旋转(2×2方阵):线性变换 ✅
4 一句话极简记忆
- 线性变换:任意 Am×n 都能代表,跨维度也可以
- 行列式、逆、特征值:专属 n阶方阵
结合你刚才学的投影矩阵,完美印证:非方阵照样是线性变换。
5.线性变换的公式是:
y=Ax
在线性代数中,我们通常将向量视为列向量(竖着写的)。
例如:
- 输入向量 x 是 3 维的,所以它是一个 3×1 的矩阵(3 行 1 列)。
- 输出向量 y 是 2 维的,所以它是一个 2×1 的矩阵(2 行 1 列)。
根据矩阵乘法规则:“前一个矩阵的列数”必须等于“后一个矩阵的行数”,结果的行数取前者,列数取后者。
即:(m×n)⋅(n×p)=(m×p)
所以,A 的维度必须是 2×3。
A(2×3)⋅x(3×1)=y(2×1)
具体例子:
假设变换 T:R3→R2 定义为投影:(x,y,z)↦(x,y)。
- 输入 (1,0,0) (3维) → 输出 (1,0) (2维)。这是矩阵的第 1 列。
- 输入 (0,1,0) (3维) → 输出 (0,1) (2维)。这是矩阵的第 2 列。
- 输入 (0,0,1) (3维) → 输出 (0,0) (2维)。这是矩阵的第 3 列。
拼起来就是:
A=(100100)
这是一个 2 行 3 列 的矩阵。
所以:矩阵的形状是 (输出维度) × (输入维度)。也就是:行数看输出,列数看输入。
总结对照表
| 变换方向 | 输入维度 (x) | 输出维度 (y) | 矩阵 A 的维度 | 矩阵形状描述 | 是否有行列式 |
|---|
| 3 维 → 2 维 | 3 | 2 | 2×3 | 2 行,3 列 (扁胖子) | 无 |
| 2 维 → 3 维 | 2 | 3 | 3×2 | 3 行,2 列 (高瘦子) | 无 |
| 3 维 → 3 维 | 3 | 3 | 3×3 | 3 行,3 列 (方阵) | 有 |
由此引入秩:用一个数值,精确描述变换后空间的维度。
原文两层定义
- 几何直观定义:线性变换后输出空间的维数
- 精确代数定义:秩表示矩阵列空间的维数
形象比喻:
变换 T:R3→R2
A=(100100)2×3
1. 输出空间的维度
映射终点是 R2
👉 输出空间维度 = 2
含义:整个目标空间天生就是2维平面,不管你怎么映射,房间本身大小不变。
2. 列空间 & 列空间的维数
列空间 C(A):矩阵所有列向量张成的空间,列空间的维数也即线性无关的列数
线性无关列判断方法肉眼观察(简单快速):
- 有零列:零列一定和其他列线性相关
- 两列成比例:必相关
- 单位矩阵各列:天然两两无关
C(A)=span{(10),(01),(00)}
例题解释列空间的维数和输出空间的维度
👉 列空间的维数 =rank(A)=2
这里刚好相等,再看反例区别。
设
B=(1224)2×2
映射依然是 R2→R2
-
输出空间的维度:终点是R2,维度 = 2
-
求秩:r(B)=1
👉 列空间的维数 = 1
✅ 区别肉眼可见:
目标房间是2维平面,但你的映射只铺满了一条1维直线,没占满整个房间。
结合例子理解
举例:三维→二维 压缩成一个点
T(x,y,z)=(0,0)
变换矩阵:
A=(000000)2×3
验算:
(000000)xyz=(00)
✅ 所有三维向量,全部被压成二维原点一个点
满秩定义
当秩 = 矩阵的列数(方阵中即阶数),称为满秩。
- 非满秩 ⇨ 变换有压缩、不可逆、行列式为零。
- 满秩 ⇨ 变换无压缩、可逆、行列式非零;
非满秩如:
A=100210340
满秩:
B=100010001=I3
总结:
方阵行列式为零 ⇨ 线性变换发生空间压缩 ⇨ 压缩后空间的维度 = 秩 ⇨ 所有变换输出的集合 = 列空间 ⇨
被压缩到原点的输入集合 = 零空间
它解决了一个关键问题:同样行列式为0,不同矩阵的压缩程度不一样,用「秩」做精细区分。
与线性方程组解的直接关联
对齐次线性方程组Ax=0:
- 它的所有解,恰好就是这个矩阵的零空间;
- 满秩矩阵:零空间只有零向量一个元素 ⇨Ax=0仅有零解x=0;
- 非满秩矩阵:零空间是一维/二维…的子空间 ⇨Ax=0有无穷多非零解。
概念间的核心关系梳理
| 概念 | 含义 | 与其他概念的绑定 |
|---|
| 行列式det(A) | 变换的缩放/定向因子,是否降维 | det=0⇔满秩;det=0⇔非满秩 |
| 列空间 | 变换的所有输出集合 | 由矩阵列向量张成,其维数=秩 |
| 秩 | 列空间的维数、输出空间的维度 | 满秩=列数,对应变换可逆、无空间压缩 |
| 零空间 | 变换中被映射到0的所有输入集合 | 是齐次方程Ax=0的全部解 |
重要延伸定理(秩-零化度定理,原文未提但可辅助理解)
对m×n矩阵,恒成立:
秩(A)+零化度(A)=n
- 零化度:零空间的维数;
-n:矩阵列数(原输入空间的维度)。
用原文例子验证:
- 3×3矩阵,秩=2(输出是平面),则零化度=1(零空间是直线),和你文中描述完全一致;
- 3×3矩阵,秩=1(输出是直线),则零化度=2(零空间是平面),也和文中几何描述严格匹配。
这个定理定量解释了:输出空间维度减少多少,就有多少维度的输入向量被压缩到原点。
2.列空间(Column Space)
✅ 定义:
矩阵A的列空间,记作Col(A),是由A的所有列向量张成的子空间。
换句话说:
所有形如Ax的向量(即A的输出)构成的集合,就是列空间。
🔹 三维例子:
设
A=100210340
a1=100,a2=210,a3=340
✅ 结论:Col(A)=xy 平面(一个二维子空间)
🌟 几何意义:
无论你输入什么x∈R3,输出Ax永远在 xy 平面上 —— 空间被“压扁”了!
二、秩(Rank)
✅ 定义:
矩阵A的秩,记作rank(A),是其列空间的维数,即线性无关列向量的最大个数。
也等于行空间的维数(行秩 = 列秩)
🔹 接上例:
A=100210340
- 列向量中,a1,a2线性无关(不成比例)
-a3可由前两个表示 → 不增加维度
✅ 所以:rank(A)=2
🔸 对比另一个例子(满秩):
B=100010001=I3
- 列空间 = 整个R3
-rank(B)=3(满秩)
🔸 再对比(秩为1):
C=123246369
- 所有列都是123的倍数
- 列空间 = 一条过原点的直线
-rank(C)=1
三、零空间(Null Space / Kernel)
✅ 定义:
矩阵A的零空间,记作Null(A)或ker(A),是所有满足
Ax=0
的向量x构成的集合。
即:被A“压扁”成零向量的所有输入。
🔹 回到第一个例子:
A=100210340
解Ax=0:
⎩⎨⎧x+2y+3z=0y+4z=00=0⇒{y=−4zx=−2y−3z=8z−3z=5z
令z=t(自由变量),则解为:
x=t5−41,t∈R
✅ 零空间 = 由5−41张成的一条直线
🌟 几何意义:
这条直线上的所有向量,经过A变换后都变成0—— 它们被“完全压扁”了!
四、三大概念的关系:秩-零化度定理(Rank-Nullity Theorem)
这是连接它们的核心公式:
rank(A)+dim(Null(A))=n
其中n是A的列数(即输入空间的维数)。
🔹 验证我们的例子:
- A是3×3矩阵 →n=3
- rank(A)=2
- dim(Null(A))=1(一条直线,维数=1)
- 2+1=3✅ 成立!
其他例子:
| 矩阵 | 秩 | 零空间维数 | 输入维数 |
|---|
| I3 | 3 | 0(只有零向量) | 3 |
| C(秩1) | 1 | 2(一个平面) | 3 |
💡 直觉:
矩阵“保留”的维度(秩) + “丢失”的维度(零空间维数) = 原始输入维度
五、三维几何全景图
想象一个3×3矩阵A作为空间变换器:
| 情况 | 列空间 | 秩 | 零空间 | 几何效果 |
|---|
| 满秩(rank=3) | 整个R3 | 3 | {0} | 空间被拉伸/旋转,但不压扁(可逆) |
| 秩=2 | 一个平面(如 xy 平面) | 2 | 一条直线 | 3D → 2D(压成平面),沿某方向坍缩 |
| 秩=1 | 一条直线 | 1 | 一个平面 | 3D → 1D(压成线),整个平面坍缩到原点 |
| 秩=0 | {0} | 0 | 整个R3 | 一切归零(零矩阵) |
✅ 总结一句话
- 列空间:矩阵能“到达”的地方(输出空间)
- 秩:这个空间有多大(维数)
- 零空间:被“消灭”的输入(映射到零的向量)
- 三者关系:秩+零空间维数=输入维数
掌握这三个概念,你就真正理解了矩阵如何扭曲、压缩、映射空间——这是计算机图形学、机器学习、物理模拟等领域的基石!
六、参考文献
本文参考AI回答,豆包,Deepseek,千问