1. 先分清:齐次 vs 非齐次 线性方程组
设未知数:x1,x2,…,xn
1.1齐次线性方程组
右边全是 0
⎩⎨⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋮am1x1+am2x2+⋯+amnxn=0
简写:Ax=0
1.2 非齐次线性方程组
右边不全是 0
⎩⎨⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮am1x1+am2x2+⋯+amnxn=bm
简写:Ax=b,且 b=0
1.3. 什么是 零解?什么是 非零解?
这两个概念只对齐次方程组 Ax=0 说。
1.3.1零解
所有未知数都等于 0:
x1=0,x2=0,…,xn=0
记作:x=0
任何齐次方程组一定有零解!
(把 0 代进去,左边一定等于 0)
1.3.2非零解
不是全 0 的解
至少有一个未知数 ≠ 0,比如:
x1=1,x2=2,x3=0
这就是非零解。
1.4 对齐次方程组 Ax=0
- 一定有零解
- 有没有非零解,看秩:
- 若 r(A)<n ⇒ 有非零解(无穷多解)
- 若 r(A)=n ⇒ 只有零解
(n 是未知数个数,r(A) 是系数矩阵的秩)
1.4.1 什么是零解、非零解
例子:
{x+y=02x+2y=0
-
零解:
x=0,y=0
代入一定成立,所有齐次方程都一定有零解。
-
非零解:
比如 x=1,y=−1
这就是不全为0的解,叫非零解。
1.4.2. 只有零解 的例子(唯一解就是零解)
{x+y=0x−y=0
解:
只有这一组解,就是只有零解。
系数矩阵:
A=(111−1),r(A)=2
未知数个数 n=2
r(A)=n⟹只有零解
3.3. 有非零解 的例子
{x+y=02x+2y=0
第二个方程是第一个的2倍,真正只有一个方程。
解:y=−x,有无穷多解,比如:
(1,−1),(2,−2),…
这些都是非零解。
系数矩阵:
A=(1212)
未知数个数 n=2
求秩(行变换)
第2行 − 2×第1行:
(1010)
非零行只有 1 行,r(A)=1。
r(A)<n⟹有非零解(无穷多)
1.5. 非齐次方程组 Ax=b 怎么说?
对非齐次,不说“零解/非零解”,只说:
判据:
- r(A)=r(A) ⇒ 无解
- r(A)=r(A)=n ⇒ 唯一解
- r(A)=r(A)<n ⇒ 无穷多解
(A 是增广矩阵)
1.5.1. 唯一解 的例子
{x+y=3x−y=1
解:
只有这一组解 → 唯一解。
1.5.2. 无穷多解 的例子
{x+y=32x+2y=6
第二个方程就是第一个乘2,
解:y=3−x,有无穷多组:
(0,3),(1,2),(2,1),…
→ 无穷多解。
系数矩阵:
A=(1212)
未知数个数 n=2
求秩(行变换)
第2行 − 2×第1行:
(1010)
非零行只有 1 行,r(A)=1。
r(A)<n⟹有非零解(无穷多)
1.5.3. 无解 的例子
{x+y=3x+y=5
同一个 x+y 不可能既等于3又等于5
→ 无解。
1.6. 一句话总结
- 零解:全是 0 的解,齐次必有。
- 非零解:不全是 0 的解,齐次才有这说法。
- 齐次:看有没有非零解。
- 非齐次:看有无解、唯一还是无穷多。
2.矩阵
2.1矩阵的定义
矩阵就是:按行、按列整齐排列的一张数表。
写成这样:
A=a11a21⋮am1a12a22⋮am2……⋱…a1na2n⋮amn
它不是一个数,它是一整块数据。
教科书版:
假设我们有一个包含 m 个方程和 n 个未知数的线性方程组:
⎩⎨⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮am1x1+am2x2+⋯+amnxn=bm
我们可以定义三个矩阵(或向量):
- 系数矩阵 (Coefficient Matrix) A:由未知数前面的系数组成,是一个 m×n 的矩阵。
A=a11a21⋮am1a12a22⋮am2……⋱…a1na2n⋮amn
- 未知数向量 (Variable Vector) x:由所有未知数组成,是一个 n×1 的列向量。
x=x1x2⋮xn
- 常数向量 (Constant Vector) b:由等号右边的常数组成,是一个 m×1 的列向量。
b=b1b2⋮bm
利用矩阵乘法的定义,上述庞大的方程组可以简洁地写为:
此外,为了进行高斯消元法等操作,我们常将 A 和 b 合并为一个增广矩阵 (Augmented Matrix),记作 [A∣b]:
[A∣b]=a11a21⋮am1a12a22⋮am2……⋱…a1na2n⋮amnb1b2⋮bm
几何与代数意义的对应
矩阵不仅仅是方程组的简写,它还提供了更深层次的视角:
-
行视角 (Row Picture):
矩阵 A 的每一行代表方程组中的一个方程(在二维中是直线,三维中是平面)。求解方程组就是寻找这些直线或平面的交点。
-
列视角 (Column Picture):
矩阵乘法 Ax 可以看作是矩阵 A 的列向量的线性组合。
x1a11a21⋮+x2a12a22⋮+⋯+xna1namn⋮=b1b2⋮
求解方程组的问题转化为:是否存在一组标量 x1,…,xn,使得 A 的列向量线性组合后等于向量 b?
- 如果 b 在 A 的列空间(Column Space)内,方程组有解。
- 如果 b 不在 A 的列空间内,方程组无解。
2.2 矩阵和线性方程组到底啥关系?
看方程组:
{x+2y=34x+5y=6
2.2.1 系数矩阵 A
只把未知数前面的系数抽出来:
A=(1425)
2.2.2 常数项列向量 b
把等号右边的数抽出来:
b=(36)
2.2.3 什么是增广矩阵 A?
增广矩阵 = 系数矩阵 A 右边再接上常数 b 这一列。
上面那个方程组:
A=(142536)
- 左边:系数
- 右边:常数
- 中间竖线只是为了好看,方便区分
2.2.4 整个方程组可以简写为:
Ax=b
这就是矩阵的巨大作用:把一长串方程,缩成一行公式。
因为写方程组太啰嗦,所以用矩阵只写数字,干净、好算、好判断
我们之前说的:
- 秩 r(A)
- 有没有零解 / 非零解
- 非齐次有没有解
- 唯一解 / 无穷多解
全都是在看矩阵,不用再写一长串方程。
2.2.5 增广矩阵和方程组的关系:完全等价
1) 先看一个方程组
{x+y=3x−y=1
我们平时手算解方程,是这么做的:
- 第一个方程不动:
x+y=3
- 第二个方程 减去 第一个方程:
(x−y)−(x+y)=1−3
得到:
−2y=−2
这就叫:
对方程组做加减消元
2) 再看它的增广矩阵
A=(111−131)
现在我们对矩阵做行变换:
- 第1行不动
- 第2行 = 第2行 − 第1行
(101−23−2)
你看:
矩阵这一行算出来的结果,
正好就是方程组消元后的新方程!
0x−2y=−2
3) 核心对应关系(一定要记)
| 你对矩阵做的操作 | 等于对方程组做什么 |
|---|
| 交换两行 | 交换两个方程的顺序 |
| 某一行乘一个数 | 某个方程两边同乘一个数 |
| 一行加减另一行 | 两个方程相加减,消元 |
矩阵行变换 = 方程组加减消元
只是写法更简洁,不用每次都写 x、y、=
4) 一句话终极理解
- 方程组:带 x、y、= 的一长串式子
- 矩阵:只把系数和常数抽出来,变成表格
- 行变换:就是在偷偷帮你做消元,不写字母,只算数
所以:你看到矩阵行变换,就等于在脑子里做解方程的消元。
2.2.4 解的存在性与唯一性 (通过矩阵性质判断)
矩阵的理论直接决定了线性方程组解的情况。对于 n 个方程 n 个未知数的系统 (Ax=b):
-
唯一解:
- 当且仅当系数矩阵 A 是可逆的(非奇异的),即行列式 det(A)=0。
- 此时解可以直接通过逆矩阵求得:x=A−1b。
- 这也意味着 A 的秩 (Rank) 等于 n。
-
无解:
- 当增广矩阵 [A∣b] 的秩 大于 系数矩阵 A 的秩时 (rank(A)<rank([A∣b]))。
- 这通常发生在化简后出现类似 0=1 的矛盾方程时。
-
无穷多解:
- 当 rank(A)=rank([A∣b])<n 时。
- 这意味着方程组中存在“自由变量”,解集构成一个线性流形(如直线、平面等)。
- rank就是求矩阵的秩
2.2.5. 求解方法上的联系
几乎所有求解线性方程组的高效算法都是基于矩阵操作的:
- 高斯消元法 (Gaussian Elimination):通过对增广矩阵 [A∣b] 进行初等行变换,将其化为行阶梯形矩阵,从而回代求解。
- 克拉默法则 (Cramer's Rule):利用行列式直接计算解(适用于小规模且 det(A)=0 的情况)。
- 矩阵分解:如 LU 分解、QR 分解、奇异值分解 (SVD),这些是将复杂矩阵拆解为简单矩阵乘积的方法,用于数值稳定地求解大型方程组。
2.2.6 总结
-
形式上:线性方程组是矩阵方程 Ax=b 的展开形式,矩阵是方程组的压缩表示。
-
本质上:解线性方程组等价于寻找向量 b 是否在矩阵 A 的列空间中,以及如何在基向量(A 的列)下表示 b。
-
应用上:矩阵理论(秩、行列式、逆、特征值等)为判断方程组解的性质(存在性、唯一性)提供了完美的判据,并提供了系统的计算方法。
2.4 增广矩阵到底有什么用
作用只有一个:
用来判断非齐次线性方程组 Ax=b 有没有解。
判断规则:
- 算系数矩阵的秩:r(A)
- 算增广矩阵的秩:r(A)
- r(A)=r(A) ⇒ 有解
- r(A)=r(A) ⇒ 无解
举个最经典的例子:无解的情况
{x+y=3x+y=5
系数矩阵 A
A=(1111)
化简:
(1010)⟹r(A)=1
增广矩阵 A
A=(111135)
第2行−第1行:
(101032)
非零行有 2 行 ⇒ r(A)=2
比较
r(A)=1,r(A)=2
r(A)=r(A)
⇒ 方程组无解!
2.4.1 高斯消元法
增广矩阵(Augmented Matrix)就是为了配合高斯消元法而诞生的“最佳载体
1) 核心目标
将线性方程组的增广矩阵 [A∣b] 转化为 行阶梯形矩阵 (Row Echelon Form, REF)。
2) 三大基本操作 (初等行变换)
高斯消元法只允许对矩阵的行进行以下三种操作,这些操作不会改变方程组的解:
- 交换两行 (Ri↔Rj):交换两个方程的位置。
- 倍乘某一行 (k⋅Ri→Ri, k=0):将一个方程两边同时乘以非零常数。
- 倍加某一行到另一行 (Ri+k⋅Rj→Ri):将一个方程的 k 倍加到另一个方程上(这是消元的关键步骤)。
3) 具体步骤演示
假设我们要解以下方程组:
⎩⎨⎧x+y+z=62x+3y+z=11x+2y+2z=10
第一步:写成增广矩阵
12113211261110
第二步:消元 (向前消去)
目标:让第一列主元(第1行第1列的1)下方的元素全变为0。
-
消去第2行的 2:用第2行减去第1行的2倍 (R2−2R1→R2)。
- 2−2(1)=0
- 3−2(1)=1
- 1−2(1)=−1
- 11−2(6)=−1
- 矩阵变为:
1011121−126−110
-
消去第3行的 1:用第3行减去第1行 (R3−R1→R3)。
- 矩阵变为:
1001111−116−14
-
处理第二列:现在看第2行第2列的主元(是1),要消去它下方的元素(第3行的1)。
- 用第3行减去第2行 (R3−R2→R3)。
- 1−1=0, 1−(−1)=2, 4−(−1)=5.
- 矩阵变为行阶梯形:
1001101−126−15
第三步:回代 (Back Substitution)
现在矩阵已经对应了一个简化的方程组,我们从下往上解:
- 由第3行:2z=5⟹z=2.5
- 代入第2行:y−z=−1⟹y−2.5=−1⟹y=1.5
- 代入第1行:x+y+z=6⟹x+1.5+2.5=6⟹x+4=6⟹x=2
最终解:x=2,y=1.5,z=2.5。
4) 高斯消元法能告诉我们什么?
在消元过程中,我们可以直接判断解的情况:
- 出现矛盾行:如果某一行变成了 [0,0,…,0∣c] (其中 c=0),即 0=c,则方程组无解。
- 唯一解:如果没有矛盾行,且主元的个数等于未知数的个数(每列都有主元),则有唯一解。
- 无穷多解:如果没有矛盾行,但主元个数少于未知数个数(存在没有主元的列,即自由变量),则有无穷多解。
2.5 一句话终极总结
-
矩阵:把方程组的系数排成表。
-
系数矩阵 A:只存未知数系数。
-
增广矩阵 A:A + 右边常数,多一列。
-
增广矩阵唯一作用:
看 r(A) 和 r(A) 是否相等,判断非齐次方程组有没有解。
3.参考文献
本文参考AI回答,豆包,Deepseek,千问