第二章矩阵-1.线性方程组和矩阵

6 阅读3分钟

1. 先分清:齐次 vs 非齐次 线性方程组

设未知数:x1,x2,,xnx_1,x_2,\dots,x_n

1.1齐次线性方程组

右边全是 0

{a11x1+a12x2++a1nxn=0a21x1+a22x2++a2nxn=0am1x1+am2x2++amnxn=0\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = 0\\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = 0\\ \qquad\vdots\\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n = 0 \end{cases}

简写:Ax=0A\boldsymbol{x}=\boldsymbol{0}

1.2 非齐次线性方程组

右边不全是 0

{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1\\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2\\ \qquad\vdots\\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n = b_m \end{cases}

简写:Ax=bA\boldsymbol{x}=\boldsymbol{b},且 b0\boldsymbol{b}\neq\boldsymbol{0}

1.3. 什么是 零解?什么是 非零解

这两个概念只对齐次方程组 Ax=0A\boldsymbol{x}=\boldsymbol{0}

1.3.1零解

所有未知数都等于 0:

x1=0,  x2=0,  ,  xn=0x_1=0,\;x_2=0,\;\dots,\;x_n=0

记作:x=0\boldsymbol{x}=\boldsymbol{0}

任何齐次方程组一定有零解! (把 0 代进去,左边一定等于 0)

1.3.2非零解

不是全 0 的解 至少有一个未知数 ≠ 0,比如:

x1=1,  x2=2,  x3=0x_1=1,\;x_2=2,\;x_3=0

这就是非零解。

1.4 对齐次方程组 Ax=0A\boldsymbol{x}=\boldsymbol{0}

  1. 一定有零解
  2. 有没有非零解,看秩
    • r(A)<nr(A) < n有非零解(无穷多解)
    • r(A)=nr(A) = n只有零解

nn 是未知数个数,r(A)r(A) 是系数矩阵的秩)

1.4.1 什么是零解、非零解

例子:

{x+y=02x+2y=0\begin{cases} x + y = 0\\ 2x + 2y = 0 \end{cases}
  • 零解x=0,  y=0x=0,\;y=0 代入一定成立,所有齐次方程都一定有零解

  • 非零解: 比如 x=1,  y=1x=1,\;y=-1 这就是不全为0的解,叫非零解。


1.4.2. 只有零解 的例子(唯一解就是零解

{x+y=0xy=0\begin{cases} x + y = 0\\ x - y = 0 \end{cases}

解:

x=0,  y=0x=0,\;y=0

只有这一组解,就是只有零解

系数矩阵:

A=(1111),r(A)=2A=\begin{pmatrix}1&1\\1&-1\end{pmatrix},\quad r(A)=2

未知数个数 n=2n=2

r(A)=n    只有零解r(A)=n \implies \textbf{只有零解}

3.3. 有非零解 的例子

{x+y=02x+2y=0\begin{cases} x + y = 0\\ 2x + 2y = 0 \end{cases}

第二个方程是第一个的2倍,真正只有一个方程。 解:y=xy=-x,有无穷多解,比如:

(1,1),  (2,2),  (1,-1),\;(2,-2),\;\dots

这些都是非零解

系数矩阵:

A=(1122)A=\begin{pmatrix}1&1\\2&2\end{pmatrix}

未知数个数 n=2n=2

求秩(行变换)

第2行 − 2×第1行:

(1100)\begin{pmatrix} 1 & 1\\ 0 & 0 \end{pmatrix}

非零行只有 1 行,r(A)=1\quad r(A)=1

r(A)<n    有非零解(无穷多)r(A) < n \implies \textbf{有非零解(无穷多)}

1.5. 非齐次方程组 Ax=bA\boldsymbol{x}=\boldsymbol{b} 怎么说?

对非齐次,不说“零解/非零解”,只说:

  • 无解
  • 唯一解
  • 无穷多解

判据:

  • r(A)r(A)r(A) \neq r(\overline{A}) ⇒ 无解
  • r(A)=r(A)=nr(A) = r(\overline{A}) = n ⇒ 唯一解
  • r(A)=r(A)<nr(A) = r(\overline{A}) < n ⇒ 无穷多解

A\overline{A} 是增广矩阵)

1.5.1. 唯一解 的例子

{x+y=3xy=1\begin{cases} x + y = 3\\ x - y = 1 \end{cases}

解:

x=2,  y=1x=2,\;y=1

只有这一组解 → 唯一解


1.5.2. 无穷多解 的例子

{x+y=32x+2y=6\begin{cases} x + y = 3\\ 2x + 2y = 6 \end{cases}

第二个方程就是第一个乘2, 解:y=3xy=3-x,有无穷多组:

(0,3),  (1,2),  (2,1),(0,3),\;(1,2),\;(2,1),\dots

无穷多解

系数矩阵:

A=(1122)A=\begin{pmatrix}1&1\\2&2\end{pmatrix}

未知数个数 n=2n=2

求秩(行变换)

第2行 − 2×第1行:

(1100)\begin{pmatrix} 1 & 1\\ 0 & 0 \end{pmatrix}

非零行只有 1 行,r(A)=1\quad r(A)=1

r(A)<n    有非零解(无穷多)r(A) < n \implies \textbf{有非零解(无穷多)}

1.5.3. 无解 的例子

{x+y=3x+y=5\begin{cases} x + y = 3\\ x + y = 5 \end{cases}

同一个 x+yx+y 不可能既等于3又等于5 → 无解

1.6. 一句话总结

  • 零解:全是 0 的解,齐次必有。
  • 非零解:不全是 0 的解,齐次才有这说法。
  • 齐次:看有没有非零解。
  • 非齐次:看有无解、唯一还是无穷多。

2.矩阵

2.1矩阵的定义

矩阵就是:按行、按列整齐排列的一张数表。

写成这样:

A=(a11a12a1na21a22a2nam1am2amn)A= \begin{pmatrix} a_{11} & a_{12} & \dots & a_{1n}\\ a_{21} & a_{22} & \dots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots\\ a_{m1} & a_{m2} & \dots & a_{mn} \end{pmatrix}
  • 横着叫
  • 竖着叫
  • 里面每个数字叫 元素

不是一个数,它是一整块数据

教科书版:

假设我们有一个包含 mm 个方程和 nn 个未知数的线性方程组:

{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n = b_m \end{cases}

我们可以定义三个矩阵(或向量):

  • 系数矩阵 (Coefficient Matrix) AA:由未知数前面的系数组成,是一个 m×nm \times n 的矩阵。
    A=[a11a12a1na21a22a2nam1am2amn]A = \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \dots & a_{mn} \end{bmatrix}
  • 未知数向量 (Variable Vector) xx:由所有未知数组成,是一个 n×1n \times 1 的列向量。
    x=[x1x2xn]x = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}
  • 常数向量 (Constant Vector) bb:由等号右边的常数组成,是一个 m×1m \times 1 的列向量。
    b=[b1b2bm]b = \begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_m \end{bmatrix}

利用矩阵乘法的定义,上述庞大的方程组可以简洁地写为:

Ax=bAx = b

此外,为了进行高斯消元法等操作,我们常将 AAbb 合并为一个增广矩阵 (Augmented Matrix),记作 [Ab][A|b]

[Ab]=[a11a12a1nb1a21a22a2nb2am1am2amnbm][A|b] = \left[\begin{array}{cccc|c} a_{11} & a_{12} & \dots & a_{1n} & b_1 \\ a_{21} & a_{22} & \dots & a_{2n} & b_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{m1} & a_{m2} & \dots & a_{mn} & b_m \end{array}\right]

几何与代数意义的对应

矩阵不仅仅是方程组的简写,它还提供了更深层次的视角:

  • 行视角 (Row Picture): 矩阵 AA 的每一行代表方程组中的一个方程(在二维中是直线,三维中是平面)。求解方程组就是寻找这些直线或平面的交点

  • 列视角 (Column Picture): 矩阵乘法 AxAx 可以看作是矩阵 AA列向量的线性组合

    x1[a11a21]+x2[a12a22]++xn[a1namn]=[b1b2]x_1 \begin{bmatrix} a_{11} \\ a_{21} \\ \vdots \end{bmatrix} + x_2 \begin{bmatrix} a_{12} \\ a_{22} \\ \vdots \end{bmatrix} + \dots + x_n \begin{bmatrix} a_{1n} \\ a_{mn} \\ \vdots \end{bmatrix} = \begin{bmatrix} b_1 \\ b_2 \\ \vdots \end{bmatrix}

    求解方程组的问题转化为:是否存在一组标量 x1,,xnx_1, \dots, x_n,使得 AA 的列向量线性组合后等于向量 bb

    • 如果 bbAA 的列空间(Column Space)内,方程组有解。
    • 如果 bb 不在 AA 的列空间内,方程组无解。

2.2 矩阵和线性方程组到底啥关系?

看方程组:

{x+2y=34x+5y=6\begin{cases} x + 2y = 3\\ 4x + 5y = 6 \end{cases}

2.2.1 系数矩阵 A

只把未知数前面的系数抽出来:

A=(1245)A = \begin{pmatrix}1 & 2\\4 & 5\end{pmatrix}

2.2.2 常数项列向量 b

把等号右边的数抽出来:

b=(36)\boldsymbol{b} = \begin{pmatrix}3\\6\end{pmatrix}

2.2.3 什么是增广矩阵 A\overline{A}

增广矩阵 = 系数矩阵 A 右边再接上常数 b 这一列。

上面那个方程组:

A=(123456)\overline{A} = \left(\begin{array}{cc|c} 1 & 2 & 3\\ 4 & 5 & 6 \end{array}\right)
  • 左边:系数
  • 右边:常数
  • 中间竖线只是为了好看,方便区分

2.2.4 整个方程组可以简写为:

Ax=bA\boldsymbol{x}=\boldsymbol{b}

这就是矩阵的巨大作用:把一长串方程,缩成一行公式。

因为写方程组太啰嗦,所以用矩阵只写数字,干净、好算、好判断

我们之前说的:

  • 秩 r(A)
  • 有没有零解 / 非零解
  • 非齐次有没有解
  • 唯一解 / 无穷多解

全都是在看矩阵,不用再写一长串方程。

2.2.5 增广矩阵和方程组的关系:完全等价
  • 你对矩阵做行变换 ↔ 等于你在对方程组加减消元

  • 矩阵里有全零行 ↔ 方程组里有多余方程

  • 矩阵里出现 0 0 | 5 这种行 ↔ 方程组矛盾,无解

1) 先看一个方程组
{x+y=3xy=1\begin{cases} x + y = 3 \\ x - y = 1 \end{cases}

我们平时手算解方程,是这么做的:

  1. 第一个方程不动: x+y=3x + y = 3
  2. 第二个方程 减去 第一个方程: (xy)(x+y)=13(x - y) - (x + y) = 1 - 3 得到: 2y=2-2y = -2

这就叫: 对方程组做加减消元

2) 再看它的增广矩阵
A=(113111)\overline{A}= \left(\begin{array}{cc|c} 1 & 1 & 3\\ 1 & -1 & 1 \end{array}\right)

现在我们对矩阵做行变换

  1. 第1行不动
  2. 第2行 = 第2行 − 第1行
(113022)\left(\begin{array}{cc|c} 1 & 1 & 3\\ 0 & -2 & -2 \end{array}\right)

你看: 矩阵这一行算出来的结果, 正好就是方程组消元后的新方程!

0x2y=20x - 2y = -2
3) 核心对应关系(一定要记)
你对矩阵做的操作等于对方程组做什么
交换两行交换两个方程的顺序
某一行乘一个数某个方程两边同乘一个数
一行加减另一行两个方程相加减,消元

矩阵行变换 = 方程组加减消元 只是写法更简洁,不用每次都写 x、y、=

4) 一句话终极理解
  • 方程组:带 x、y、= 的一长串式子
  • 矩阵:只把系数和常数抽出来,变成表格
  • 行变换:就是在偷偷帮你做消元,不写字母,只算数

所以:你看到矩阵行变换,就等于在脑子里做解方程的消元。

2.2.4 解的存在性与唯一性 (通过矩阵性质判断)

矩阵的理论直接决定了线性方程组解的情况。对于 nn 个方程 nn 个未知数的系统 (Ax=bAx=b):

  1. 唯一解

    • 当且仅当系数矩阵 AA可逆的(非奇异的),即行列式 det(A)0\det(A) \neq 0
    • 此时解可以直接通过逆矩阵求得:x=A1bx = A^{-1}b
    • 这也意味着 AA 的秩 (Rank) 等于 nn
  2. 无解

    • 当增广矩阵 [Ab][A|b] 的秩 大于 系数矩阵 AA 的秩时 (rank(A)<rank([Ab])\text{rank}(A) < \text{rank}([A|b]))。
    • 这通常发生在化简后出现类似 0=10 = 1 的矛盾方程时。
  3. 无穷多解

    • rank(A)=rank([Ab])<n\text{rank}(A) = \text{rank}([A|b]) < n 时。
    • 这意味着方程组中存在“自由变量”,解集构成一个线性流形(如直线、平面等)。
    • rank就是求矩阵的秩

2.2.5. 求解方法上的联系

几乎所有求解线性方程组的高效算法都是基于矩阵操作的:

  • 高斯消元法 (Gaussian Elimination):通过对增广矩阵 [Ab][A|b] 进行初等行变换,将其化为行阶梯形矩阵,从而回代求解。
  • 克拉默法则 (Cramer's Rule):利用行列式直接计算解(适用于小规模且 det(A)0\det(A) \neq 0 的情况)。
  • 矩阵分解:如 LULU 分解、QRQR 分解、奇异值分解 (SVDSVD),这些是将复杂矩阵拆解为简单矩阵乘积的方法,用于数值稳定地求解大型方程组。

2.2.6 总结

  • 形式上:线性方程组是矩阵方程 Ax=bAx=b 的展开形式,矩阵是方程组的压缩表示。

  • 本质上:解线性方程组等价于寻找向量 bb 是否在矩阵 AA 的列空间中,以及如何在基向量(AA 的列)下表示 bb

  • 应用上:矩阵理论(秩、行列式、逆、特征值等)为判断方程组解的性质(存在性、唯一性)提供了完美的判据,并提供了系统的计算方法。

2.4 增广矩阵到底有什么用

作用只有一个:

用来判断非齐次线性方程组 Ax=bA\boldsymbol{x}=\boldsymbol{b} 有没有解。

判断规则:

  1. 算系数矩阵的秩:r(A)r(A)
  2. 算增广矩阵的秩:r(A)r(\overline{A})
  • r(A)=r(A)r(A) = r(\overline{A})有解
  • r(A)r(A)r(A) \neq r(\overline{A})无解

举个最经典的例子:无解的情况

{x+y=3x+y=5\begin{cases} x + y = 3\\ x + y = 5 \end{cases}
系数矩阵 A
A=(1111)A = \begin{pmatrix}1 & 1\\1 & 1\end{pmatrix}

化简:

(1100)    r(A)=1\begin{pmatrix}1 & 1\\0 & 0\end{pmatrix} \implies r(A)=1
增广矩阵 A\overline{A}
A=(113115)\overline{A} = \left(\begin{array}{cc|c} 1 & 1 & 3\\ 1 & 1 & 5 \end{array}\right)

第2行−第1行:

(113002)\left(\begin{array}{cc|c} 1 & 1 & 3\\ 0 & 0 & 2 \end{array}\right)

非零行有 2 行 ⇒ r(A)=2r(\overline{A})=2

比较
r(A)=1,r(A)=2r(A)=1,\quad r(\overline{A})=2
r(A)r(A)r(A)\neq r(\overline{A})

⇒ 方程组无解!


2.4.1 高斯消元法

增广矩阵(Augmented Matrix)就是为了配合高斯消元法而诞生的“最佳载体

1) 核心目标

将线性方程组的增广矩阵 [Ab][A|b] 转化为 行阶梯形矩阵 (Row Echelon Form, REF)

  • 行阶梯形矩阵的样子

    • 所有非零行都在全零行的上面。
    • 每一行的第一个非零元素(称为主元,Pivot)所在的列,严格位于上一行主元所在列的右侧。
    • 主元下方的元素全部为 0

    例如,一个化简后的阶梯形矩阵看起来像这样(*代表任意数,代表主元):

    [0000000]\left[\begin{array}{ccc|c} \mathbf{▲} & * & * & * \\ 0 & \mathbf{▲} & * & * \\ 0 & 0 & \mathbf{▲} & * \\ 0 & 0 & 0 & 0 \end{array}\right]

    这种形状使得我们可以从最后一行开始,依次向上回代求出所有未知数。


2) 三大基本操作 (初等行变换)

高斯消元法只允许对矩阵的进行以下三种操作,这些操作不会改变方程组的解

  1. 交换两行 (RiRjR_i \leftrightarrow R_j):交换两个方程的位置。
  2. 倍乘某一行 (kRiRik \cdot R_i \to R_i, k0k \neq 0):将一个方程两边同时乘以非零常数。
  3. 倍加某一行到另一行 (Ri+kRjRiR_i + k \cdot R_j \to R_i):将一个方程的 kk 倍加到另一个方程上(这是消元的关键步骤)。

3) 具体步骤演示

假设我们要解以下方程组:

{x+y+z=62x+3y+z=11x+2y+2z=10\begin{cases} x + y + z = 6 \\ 2x + 3y + z = 11 \\ x + 2y + 2z = 10 \end{cases}

第一步:写成增广矩阵

[11162311112210]\left[\begin{array}{ccc|c} 1 & 1 & 1 & 6 \\ 2 & 3 & 1 & 11 \\ 1 & 2 & 2 & 10 \end{array}\right]

第二步:消元 (向前消去) 目标:让第一列主元(第1行第1列的1)下方的元素全变为0。

  1. 消去第2行的 22:用第2行减去第1行的2倍 (R22R1R2R_2 - 2R_1 \to R_2)。

    • 22(1)=02 - 2(1) = 0
    • 32(1)=13 - 2(1) = 1
    • 12(1)=11 - 2(1) = -1
    • 112(6)=111 - 2(6) = -1
    • 矩阵变为:
      [1116011112210]\left[\begin{array}{ccc|c} 1 & 1 & 1 & 6 \\ 0 & 1 & -1 & -1 \\ 1 & 2 & 2 & 10 \end{array}\right]
  2. 消去第3行的 11:用第3行减去第1行 (R3R1R3R_3 - R_1 \to R_3)。

    • 矩阵变为:
      [111601110114]\left[\begin{array}{ccc|c} 1 & 1 & 1 & 6 \\ 0 & 1 & -1 & -1 \\ 0 & 1 & 1 & 4 \end{array}\right]
  3. 处理第二列:现在看第2行第2列的主元(是1),要消去它下方的元素(第3行的1)。

    • 用第3行减去第2行 (R3R2R3R_3 - R_2 \to R_3)。
    • 11=01-1=0, 1(1)=21-(-1)=2, 4(1)=54-(-1)=5.
    • 矩阵变为行阶梯形
      [111601110025]\left[\begin{array}{ccc|c} 1 & 1 & 1 & 6 \\ 0 & 1 & -1 & -1 \\ 0 & 0 & 2 & 5 \end{array}\right]

第三步:回代 (Back Substitution) 现在矩阵已经对应了一个简化的方程组,我们从下往上解:

  1. 由第3行2z=5    z=2.52z = 5 \implies z = 2.5
  2. 代入第2行yz=1    y2.5=1    y=1.5y - z = -1 \implies y - 2.5 = -1 \implies y = 1.5
  3. 代入第1行x+y+z=6    x+1.5+2.5=6    x+4=6    x=2x + y + z = 6 \implies x + 1.5 + 2.5 = 6 \implies x + 4 = 6 \implies x = 2

最终解x=2,y=1.5,z=2.5x=2, y=1.5, z=2.5


4) 高斯消元法能告诉我们什么?

在消元过程中,我们可以直接判断解的情况:

  1. 出现矛盾行:如果某一行变成了 [0,0,,0c][0, 0, \dots, 0 | c] (其中 c0c \neq 0),即 0=c0 = c,则方程组无解
  2. 唯一解:如果没有矛盾行,且主元的个数等于未知数的个数(每列都有主元),则有唯一解
  3. 无穷多解:如果没有矛盾行,但主元个数少于未知数个数(存在没有主元的列,即自由变量),则有无穷多解

2.5 一句话终极总结

  1. 矩阵:把方程组的系数排成表。

  2. 系数矩阵 A:只存未知数系数。

  3. 增广矩阵 A\overline{A}:A + 右边常数,多一列。

  4. 增广矩阵唯一作用: 看 r(A)r(A)r(A)r(\overline{A}) 是否相等,判断非齐次方程组有没有解

3.参考文献

本文参考AI回答,豆包,Deepseek,千问