一、矩阵的初等变换
矩阵的初等变换分为初等行变换 和初等列变换 ,二者是对偶的。通常我们更常用行变换,因为它与线性方程组的同解变形对应。
1. 三种初等行变换
设矩阵 A A A 有 m m m 行,则:
交换两行 :r i ↔ r j r_i \leftrightarrow r_j r i ↔ r j
将第 i i i 行与第 j j j 行互换位置。
倍乘某一行 :r i ← k r i r_i \leftarrow k r_i r i ← k r i (k ≠ 0 k \neq 0 k = 0 )
将第 i i i 行所有元素乘以非零常数 k k k 。
倍加某一行 :r i ← r i + k r j r_i \leftarrow r_i + k r_j r i ← r i + k r j (j ≠ i j \neq i j = i )
将第 j j j 行的 k k k 倍加到第 i i i 行上,其它行不变。
2. 初等矩阵
初等矩阵 是指对单位矩阵 进行一次初等变换得到的矩阵。
设 I I I 是 n n n 阶单位矩阵。对 I I I 施行一次初等变换,得到的矩阵称为初等矩阵 。
由于初等变换有三种类型,初等矩阵也相应分为三类:
2.1 第一类初等矩阵:交换两行(或两列)
记 E i j E_{ij} E ij 为交换单位矩阵的第 i i i 行与第 j j j 行(或第 i i i 列与第 j j j 列)得到的矩阵。
例子 (3阶):
E 13 = ( 0 0 1 0 1 0 1 0 0 ) E_{13} = \begin{pmatrix}
0 & 0 & 1 \\
0 & 1 & 0 \\
1 & 0 & 0
\end{pmatrix} E 13 = 0 0 1 0 1 0 1 0 0
(交换了第1行和第3行)
特点 :
主对角线上除了 i i i 和 j j j 位置外都是1,i i i 和 j j j 位置变为0
非对角线上有两个1,位于 ( i , j ) (i,j) ( i , j ) 和 ( j , i ) (j,i) ( j , i ) 位置
E i j − 1 = E i j E_{ij}^{-1} = E_{ij} E ij − 1 = E ij (交换两次复原)
2.2 第二类初等矩阵:某行(或某列)乘以非零常数
记 E i ( k ) E_i(k) E i ( k ) 为单位矩阵的第 i i i 行乘以 k k k (k ≠ 0 k \neq 0 k = 0 )得到的矩阵。
例子 (3阶):
E 2 ( k ) = ( 1 0 0 0 k 0 0 0 1 ) E_2(k) = \begin{pmatrix}
1 & 0 & 0 \\
0 & k & 0 \\
0 & 0 & 1
\end{pmatrix} E 2 ( k ) = 1 0 0 0 k 0 0 0 1
(第2行乘以 k k k )
特点 :
对角线上除了第 i i i 个位置是 k k k ,其余都是1
其他位置都是0
E i ( k ) − 1 = E i ( 1 / k ) E_i(k)^{-1} = E_i(1/k) E i ( k ) − 1 = E i ( 1/ k )
2.3 第三类初等矩阵:某行加上另一行的倍数(或某列加上另一列的倍数)
记 E i j ( k ) E_{ij}(k) E ij ( k ) 为单位矩阵的第 j j j 行乘以 k k k 加到第 i i i 行(i ≠ j i \neq j i = j )得到的矩阵。
例子 (3阶):
E 13 ( k ) = ( 1 0 k 0 1 0 0 0 1 ) E_{13}(k) = \begin{pmatrix}
1 & 0 & k \\
0 & 1 & 0 \\
0 & 0 & 1
\end{pmatrix} E 13 ( k ) = 1 0 0 0 1 0 k 0 1
(第3行乘以 k k k 加到第1行)
特点 :
主对角线都是1
在 ( i , j ) (i,j) ( i , j ) 位置有一个 k k k ,其余非对角元为0
E i j ( k ) − 1 = E i j ( − k ) E_{ij}(k)^{-1} = E_{ij}(-k) E ij ( k ) − 1 = E ij ( − k )
2.4 初等矩阵的作用
初等矩阵左乘或右乘一个矩阵,相当于对该矩阵施行初等变换。
2.4.1 左乘:行变换
定理 :设 A A A 是 m × n m \times n m × n 矩阵,P P P 是 m m m 阶初等矩阵,则 P A PA P A 等于对 A A A 施行一次初等行变换。
E i j A E_{ij} A E ij A :交换 A A A 的第 i i i 行和第 j j j 行
E i ( k ) A E_i(k) A E i ( k ) A :将 A A A 的第 i i i 行乘以 k k k
E i j ( k ) A E_{ij}(k) A E ij ( k ) A :将 A A A 的第 j j j 行的 k k k 倍加到第 i i i 行
2.4.2 右乘:列变换
定理 :设 A A A 是 m × n m \times n m × n 矩阵,Q Q Q 是 n n n 阶初等矩阵,则 A Q AQ A Q 等于对 A A A 施行一次初等列变换。
A E i j A E_{ij} A E ij :交换 A A A 的第 i i i 列和第 j j j 列
A E i ( k ) A E_i(k) A E i ( k ) :将 A A A 的第 i i i 列乘以 k k k
A E i j ( k ) A E_{ij}(k) A E ij ( k ) :将 A A A 的第 j j j 列的 k k k 倍加到第 i i i 列
这个问题一句话抓住本质 :
左乘 = 作用在行上;右乘 = 作用在列上。
2.4.3 具体的数字例子
通过具体的数字例子,直观展示初等矩阵左乘和右乘的作用效果。
设我们有一个 3 × 3 3 \times 3 3 × 3 矩阵:
A = ( a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ) A = \begin{pmatrix}
a_{11} & a_{12} & a_{13} \\
a_{21} & a_{22} & a_{23} \\
a_{31} & a_{32} & a_{33}
\end{pmatrix} A = a 11 a 21 a 31 a 12 a 22 a 32 a 13 a 23 a 33
为看得更清楚,我用具体数字:
A = ( 1 2 3 4 5 6 7 8 9 ) A = \begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
7 & 8 & 9
\end{pmatrix} A = 1 4 7 2 5 8 3 6 9
1) 第一类初等矩阵:交换行/列
初等矩阵 E 13 E_{13} E 13 (交换第1行和第3行)
E 13 = ( 0 0 1 0 1 0 1 0 0 ) E_{13} = \begin{pmatrix}
0 & 0 & 1 \\
0 & 1 & 0 \\
1 & 0 & 0
\end{pmatrix} E 13 = 0 0 1 0 1 0 1 0 0
左乘 E 13 A E_{13} A E 13 A (行变换):
E 13 A = ( 0 0 1 0 1 0 1 0 0 ) ( 1 2 3 4 5 6 7 8 9 ) = ( 7 8 9 4 5 6 1 2 3 ) E_{13}A = \begin{pmatrix}
0 & 0 & 1 \\
0 & 1 & 0 \\
1 & 0 & 0
\end{pmatrix}
\begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
7 & 8 & 9
\end{pmatrix}
= \begin{pmatrix}
7 & 8 & 9 \\
4 & 5 & 6 \\
1 & 2 & 3
\end{pmatrix} E 13 A = 0 0 1 0 1 0 1 0 0 1 4 7 2 5 8 3 6 9 = 7 4 1 8 5 2 9 6 3
✅ 效果 :交换了原矩阵的第1行和第3行。
右乘 A E 13 A E_{13} A E 13 (列变换):
A E 13 = ( 1 2 3 4 5 6 7 8 9 ) ( 0 0 1 0 1 0 1 0 0 ) = ( 3 2 1 6 5 4 9 8 7 ) A E_{13} = \begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
7 & 8 & 9
\end{pmatrix}
\begin{pmatrix}
0 & 0 & 1 \\
0 & 1 & 0 \\
1 & 0 & 0
\end{pmatrix}
= \begin{pmatrix}
3 & 2 & 1 \\
6 & 5 & 4 \\
9 & 8 & 7
\end{pmatrix} A E 13 = 1 4 7 2 5 8 3 6 9 0 0 1 0 1 0 1 0 0 = 3 6 9 2 5 8 1 4 7
✅ 效果 :交换了原矩阵的第1列和第3列。
2) 第二类初等矩阵:行/列乘以常数
初等矩阵 E 2 ( 3 ) E_2(3) E 2 ( 3 ) (第2行乘以3)
E 2 ( 3 ) = ( 1 0 0 0 3 0 0 0 1 ) E_2(3) = \begin{pmatrix}
1 & 0 & 0 \\
0 & 3 & 0 \\
0 & 0 & 1
\end{pmatrix} E 2 ( 3 ) = 1 0 0 0 3 0 0 0 1
左乘 E 2 ( 3 ) A E_2(3) A E 2 ( 3 ) A :
E 2 ( 3 ) A = ( 1 0 0 0 3 0 0 0 1 ) ( 1 2 3 4 5 6 7 8 9 ) = ( 1 2 3 12 15 18 7 8 9 ) E_2(3)A = \begin{pmatrix}
1 & 0 & 0 \\
0 & 3 & 0 \\
0 & 0 & 1
\end{pmatrix}
\begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
7 & 8 & 9
\end{pmatrix}
= \begin{pmatrix}
1 & 2 & 3 \\
12 & 15 & 18 \\
7 & 8 & 9
\end{pmatrix} E 2 ( 3 ) A = 1 0 0 0 3 0 0 0 1 1 4 7 2 5 8 3 6 9 = 1 12 7 2 15 8 3 18 9
✅ 效果 :原矩阵的第2行每个元素乘以3。
右乘 A E 2 ( 3 ) A E_2(3) A E 2 ( 3 ) :
A E 2 ( 3 ) = ( 1 2 3 4 5 6 7 8 9 ) ( 1 0 0 0 3 0 0 0 1 ) = ( 1 6 3 4 15 6 7 24 9 ) A E_2(3) = \begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
7 & 8 & 9
\end{pmatrix}
\begin{pmatrix}
1 & 0 & 0 \\
0 & 3 & 0 \\
0 & 0 & 1
\end{pmatrix}
= \begin{pmatrix}
1 & 6 & 3 \\
4 & 15 & 6 \\
7 & 24 & 9
\end{pmatrix} A E 2 ( 3 ) = 1 4 7 2 5 8 3 6 9 1 0 0 0 3 0 0 0 1 = 1 4 7 6 15 24 3 6 9
✅ 效果 :原矩阵的第2列每个元素乘以3。
3) 第三类初等矩阵:行/列加上另一行的倍数
初等矩阵 E 13 ( 2 ) E_{13}(2) E 13 ( 2 ) (第3行乘以2加到第1行
E 13 ( 2 ) = ( 1 0 2 0 1 0 0 0 1 ) E_{13}(2) = \begin{pmatrix}
1 & 0 & 2 \\
0 & 1 & 0 \\
0 & 0 & 1
\end{pmatrix} E 13 ( 2 ) = 1 0 0 0 1 0 2 0 1
注意:这个矩阵的含义是:将第3行的2倍加到第1行(左乘时)。
左乘 E 13 ( 2 ) A E_{13}(2) A E 13 ( 2 ) A :
E 13 ( 2 ) A = ( 1 0 2 0 1 0 0 0 1 ) ( 1 2 3 4 5 6 7 8 9 ) E_{13}(2)A = \begin{pmatrix}
1 & 0 & 2 \\
0 & 1 & 0 \\
0 & 0 & 1
\end{pmatrix}
\begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
7 & 8 & 9
\end{pmatrix} E 13 ( 2 ) A = 1 0 0 0 1 0 2 0 1 1 4 7 2 5 8 3 6 9
计算第1行:1 × ( 1 , 2 , 3 ) + 0 × ( 4 , 5 , 6 ) + 2 × ( 7 , 8 , 9 ) = ( 1 + 14 , 2 + 16 , 3 + 18 ) = ( 15 , 18 , 21 ) 1 \times (1,2,3) + 0 \times (4,5,6) + 2 \times (7,8,9) = (1+14, 2+16, 3+18) = (15, 18, 21) 1 × ( 1 , 2 , 3 ) + 0 × ( 4 , 5 , 6 ) + 2 × ( 7 , 8 , 9 ) = ( 1 + 14 , 2 + 16 , 3 + 18 ) = ( 15 , 18 , 21 )
结果:
= ( 15 18 21 4 5 6 7 8 9 ) = \begin{pmatrix}
15 & 18 & 21 \\
4 & 5 & 6 \\
7 & 8 & 9
\end{pmatrix} = 15 4 7 18 5 8 21 6 9
✅ 效果 :原矩阵的第3行乘以2,加到第1行。
对于列变换,需要用 E 13 ( 2 ) E_{13}(2) E 13 ( 2 ) 右乘
右乘 A E 13 ( 2 ) A E_{13}(2) A E 13 ( 2 ) :
但注意:E 13 ( 2 ) E_{13}(2) E 13 ( 2 ) 右乘时,表示将第1列的2倍加到第3列 (与左乘的行操作是对偶的)。
验证:
A E 13 ( 2 ) = ( 1 2 3 4 5 6 7 8 9 ) ( 1 0 2 0 1 0 0 0 1 ) A E_{13}(2) = \begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
7 & 8 & 9
\end{pmatrix}
\begin{pmatrix}
1 & 0 & 2 \\
0 & 1 & 0 \\
0 & 0 & 1
\end{pmatrix} A E 13 ( 2 ) = 1 4 7 2 5 8 3 6 9 1 0 0 0 1 0 2 0 1
计算第3列:2 × 第1列 + 0 × 第2列 + 1 × 第3列 2 \times \text{第1列} + 0 \times \text{第2列} + 1 \times \text{第3列} 2 × 第 1 列 + 0 × 第 2 列 + 1 × 第 3 列
= 2 ( 1 4 7 ) + ( 3 6 9 ) = ( 2 + 3 8 + 6 14 + 9 ) = ( 5 14 23 ) 2 \begin{pmatrix}1 \\ 4 \\ 7\end{pmatrix} + \begin{pmatrix}3 \\ 6 \\ 9\end{pmatrix} = \begin{pmatrix}2+3 \\ 8+6 \\ 14+9\end{pmatrix} = \begin{pmatrix}5 \\ 14 \\ 23\end{pmatrix} 2 1 4 7 + 3 6 9 = 2 + 3 8 + 6 14 + 9 = 5 14 23
结果:
= ( 1 2 5 4 5 14 7 8 23 ) = \begin{pmatrix}
1 & 2 & 5 \\
4 & 5 & 14 \\
7 & 8 & 23
\end{pmatrix} = 1 4 7 2 5 8 5 14 23
✅ 效果 :原矩阵的第1列乘以2,加到第3列。
4) 组合应用:用初等矩阵实现行最简形
我们通过一系列左乘初等矩阵,将 A A A 化为行阶梯形。
原矩阵 :
A = ( 1 2 3 4 5 6 7 8 9 ) A = \begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
7 & 8 & 9
\end{pmatrix} A = 1 4 7 2 5 8 3 6 9
步骤1 :将第1行的-4倍加到第2行
用 E 21 ( − 4 ) = ( 1 0 0 − 4 1 0 0 0 1 ) E_{21}(-4) = \begin{pmatrix}1 & 0 & 0 \\ -4 & 1 & 0 \\ 0 & 0 & 1\end{pmatrix} E 21 ( − 4 ) = 1 − 4 0 0 1 0 0 0 1
E 21 ( − 4 ) A = ( 1 2 3 0 − 3 − 6 7 8 9 ) E_{21}(-4)A = \begin{pmatrix}
1 & 2 & 3 \\
0 & -3 & -6 \\
7 & 8 & 9
\end{pmatrix} E 21 ( − 4 ) A = 1 0 7 2 − 3 8 3 − 6 9
步骤2 :将第1行的-7倍加到第3行
用 E 31 ( − 7 ) = ( 1 0 0 0 1 0 − 7 0 1 ) E_{31}(-7) = \begin{pmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -7 & 0 & 1\end{pmatrix} E 31 ( − 7 ) = 1 0 − 7 0 1 0 0 0 1
E 31 ( − 7 ) ⋅ ( E 21 ( − 4 ) A ) = ( 1 2 3 0 − 3 − 6 0 − 6 − 12 ) E_{31}(-7) \cdot (E_{21}(-4)A) = \begin{pmatrix}
1 & 2 & 3 \\
0 & -3 & -6 \\
0 & -6 & -12
\end{pmatrix} E 31 ( − 7 ) ⋅ ( E 21 ( − 4 ) A ) = 1 0 0 2 − 3 − 6 3 − 6 − 12
步骤3 :将第2行的-2倍加到第3行
用 E 32 ( − 2 ) = ( 1 0 0 0 1 0 0 − 2 1 ) E_{32}(-2) = \begin{pmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & -2 & 1\end{pmatrix} E 32 ( − 2 ) = 1 0 0 0 1 − 2 0 0 1
E 32 ( − 2 ) ⋅ ( 上一步结果 ) = ( 1 2 3 0 − 3 − 6 0 0 0 ) E_{32}(-2) \cdot (\text{上一步结果}) = \begin{pmatrix}
1 & 2 & 3 \\
0 & -3 & -6 \\
0 & 0 & 0
\end{pmatrix} E 32 ( − 2 ) ⋅ ( 上一步结果 ) = 1 0 0 2 − 3 0 3 − 6 0
最终得到行阶梯形。整个过程可写成:
E 32 ( − 2 ) ⋅ E 31 ( − 7 ) ⋅ E 21 ( − 4 ) ⋅ A = U ( 行阶梯形 ) E_{32}(-2) \cdot E_{31}(-7) \cdot E_{21}(-4) \cdot A = U \quad (\text{行阶梯形}) E 32 ( − 2 ) ⋅ E 31 ( − 7 ) ⋅ E 21 ( − 4 ) ⋅ A = U ( 行阶梯形 )
5)总结对照表
初等矩阵 左乘效果(行变换) 右乘效果(列变换) E i j E_{ij} E ij 交换第 i i i 行和第 j j j 行 交换第 i i i 列和第 j j j 列 E i ( k ) E_i(k) E i ( k ) 第 i i i 行乘以 k k k 第 i i i 列乘以 k k k E i j ( k ) E_{ij}(k) E ij ( k ) 第 j j j 行的 k k k 倍加到第 i i i 行 第 i i i 列的 k k k 倍加到第 j j j 列
关键记忆点 :
左乘 = 行变换
右乘 = 列变换
对于 E i j ( k ) E_{ij}(k) E ij ( k ) ,左乘时下标含义:将第 j j j 行 的 k k k 倍加到第 i i i 行
对于 E i j ( k ) E_{ij}(k) E ij ( k ) ,右乘时下标含义:将第 i i i 列 的 k k k 倍加到第 j j j 列 (注意行列下标对应关系有镜像效果)
这种用矩阵乘法表示初等变换的方式,为后续学习矩阵分解(如LU分解)、求解线性方程组、求逆矩阵等奠定了代数基础。
2.4.3 矩阵乘法怎么算?(关键)
矩阵相乘时:
左边矩阵的行 去点乘 右边矩阵的列
结果的第 i i i 行,完全由 左边第 i i i 行 决定
结果的第 j j j 列,完全由 右边第 j j j 列 决定
所以:
想改 行 ⇒ 改左边矩阵
想改 列 ⇒ 改右边矩阵
这就是根本原因。
我用最直观、一步一步拆开算 的方式,把这句话彻底讲透:
矩阵相乘 C = A B C=AB C = A B 时:
结果 C C C 的第 i i i 行,只由 A A A 的第 i i i 行决定
结果 C C C 的第 j j j 列,只由 B B B 的第 j j j 列决定
这就是为什么:
左乘影响行,右乘影响列。
先回忆矩阵乘法怎么算
其中
c i j = ( 第 A 第 i 行 ) ⋅ ( 第 B 第 j 列 ) c_{ij} = (\text{第 }A\text{ 第 }i\text{ 行}) \cdot (\text{第 }B\text{ 第 }j\text{ 列}) c ij = ( 第 A 第 i 行 ) ⋅ ( 第 B 第 j 列 )
为什么:C 的第 i 行,只由 A 的第 i 行决定?
看一行就够了。
设:
A A A 第 i i i 行:( a i 1 a i 2 … a i n ) \begin{pmatrix}a_{i1}&a_{i2}&\dots&a_{in}\end{pmatrix} ( a i 1 a i 2 … a in )
B B B 是任意矩阵
那么 C C C 第 i i i 行的每一个元素是:
c i 1 = a i 1 b 11 + a i 2 b 21 + ⋯ + a i n b n 1 c i 2 = a i 1 b 12 + a i 2 b 22 + ⋯ + a i n b n 2 ⋮ c i j = a i 1 b 1 j + ⋯ + a i n b n j \begin{aligned}
c_{i1}&=a_{i1}b_{11}+a_{i2}b_{21}+\dots+a_{in}b_{n1}\\
c_{i2}&=a_{i1}b_{12}+a_{i2}b_{22}+\dots+a_{in}b_{n2}\\
&\vdots\\
c_{ij}&=a_{i1}b_{1j}+\dots+a_{in}b_{nj}
\end{aligned} c i 1 c i 2 c ij = a i 1 b 11 + a i 2 b 21 + ⋯ + a in b n 1 = a i 1 b 12 + a i 2 b 22 + ⋯ + a in b n 2 ⋮ = a i 1 b 1 j + ⋯ + a in b nj
你发现没:
整一行 c i 1 , c i 2 , … c_{i1},c_{i2},\dots c i 1 , c i 2 , … 从头到尾,只用到了 A A A 的第 i i i 行,跟 A A A 其他行完全没关系!
所以:
左边矩阵控制“结果的每一行怎么来”
想改哪一行,就改左边矩阵的那一行
⇒ 左乘 = 行变换
为什么:C 的第 j 列,只由 B 的第 j 列决定?
同样道理,看一列:
C C C 第 j j j 列的元素:
c 1 j = a 11 b 1 j + a 12 b 2 j + ⋯ + a 1 n b n j c 2 j = a 21 b 1 j + a 22 b 2 j + ⋯ + a 2 n b n j ⋮ c i j = a i 1 b 1 j + ⋯ + a i n b n j \begin{aligned}
c_{1j}&=a_{11}b_{1j}+a_{12}b_{2j}+\dots+a_{1n}b_{nj}\\
c_{2j}&=a_{21}b_{1j}+a_{22}b_{2j}+\dots+a_{2n}b_{nj}\\
&\vdots\\
c_{ij}&=a_{i1}b_{1j}+\dots+a_{in}b_{nj}
\end{aligned} c 1 j c 2 j c ij = a 11 b 1 j + a 12 b 2 j + ⋯ + a 1 n b nj = a 21 b 1 j + a 22 b 2 j + ⋯ + a 2 n b nj ⋮ = a i 1 b 1 j + ⋯ + a in b nj
整一列,从头到尾只用到 B B B 的第 j j j 列 ,跟 B B B 其他列没关系。
所以:
右边矩阵控制“结果的每一列怎么来”
想改哪一列,就改右边矩阵的那一列
⇒ 右乘 = 列变换
用一句超级通俗的话总结
2.4.4 左乘 E E E = 行变换(直观例子)
设
A = ( a b c d ) , E = ( 0 1 1 0 ) ( 交换1,2行的初等矩阵 ) A=
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix},\qquad
E=
\begin{pmatrix}
0 & 1 \\
1 & 0
\end{pmatrix}
\quad(\text{交换1,2行的初等矩阵}) A = ( a c b d ) , E = ( 0 1 1 0 ) ( 交换 1,2 行的初等矩阵 )
计算 E A EA E A :
E A = ( c d a b ) EA=
\begin{pmatrix}
c & d \\
a & b
\end{pmatrix} E A = ( c a d b )
结果:A 的两行被交换了。
因为 E E E 在左边,它控制行怎么组合 。
2.4.5 右乘 E E E = 列变换(同样例子)
计算 A E AE A E :
A E = ( b a d c ) AE=
\begin{pmatrix}
b & a \\
d & c
\end{pmatrix} A E = ( b d a c )
结果:A 的两列被交换了。
因为 E E E 在右边,它控制列怎么组合 。
2.4.6 一句话总结(最本质)
2.4.7 推广到任意初等矩阵
不管是:
交换行/列
某行/列乘常数
某行/列加到另一行/列
永远是:
2.5 初等矩阵的性质
2.5.1 可逆性
所有初等矩阵都是可逆的,且逆矩阵仍是同类型的初等矩阵:
E i j − 1 = E i j E_{ij}^{-1} = E_{ij} E ij − 1 = E ij
E i ( k ) − 1 = E i ( 1 / k ) E_i(k)^{-1} = E_i(1/k) E i ( k ) − 1 = E i ( 1/ k )
E i j ( k ) − 1 = E i j ( − k ) E_{ij}(k)^{-1} = E_{ij}(-k) E ij ( k ) − 1 = E ij ( − k )
2.5.2 行列式
det ( E i j ) = − 1 \det(E_{ij}) = -1 det ( E ij ) = − 1
det ( E i ( k ) ) = k \det(E_i(k)) = k det ( E i ( k )) = k
det ( E i j ( k ) ) = 1 \det(E_{ij}(k)) = 1 det ( E ij ( k )) = 1
2.5.3. 初等矩阵的乘积
任何一个可逆矩阵都可以表示为一系列初等矩阵的乘积(因为可逆矩阵可以通过初等变换化为单位矩阵,逆过程就是初等矩阵的乘积)。
2.6应用:用初等矩阵求逆矩阵
如果 A A A 可逆,则存在初等矩阵 P 1 , P 2 , … , P k P_1, P_2, \ldots, P_k P 1 , P 2 , … , P k 使得:
P k ⋯ P 2 P 1 A = I P_k \cdots P_2 P_1 A = I P k ⋯ P 2 P 1 A = I
于是:
A − 1 = P k ⋯ P 2 P 1 A^{-1} = P_k \cdots P_2 P_1 A − 1 = P k ⋯ P 2 P 1
这意味着:对 ( A ∣ I ) (A \mid I) ( A ∣ I ) 施行与 A A A 化为 I I I 相同的初等行变换,当左边变成 I I I 时,右边就是 A − 1 A^{-1} A − 1 。
2.7总结
类型 名称 初等矩阵形式 作用 逆矩阵 第一类 交换矩阵 E i j E_{ij} E ij 交换第 i , j i, j i , j 行/列 E i j E_{ij} E ij 第二类 倍乘矩阵 E i ( k ) E_i(k) E i ( k ) 第 i i i 行/列乘以 k k k E i ( 1 / k ) E_i(1/k) E i ( 1/ k ) 第三类 倍加矩阵 E i j ( k ) E_{ij}(k) E ij ( k ) 第 j j j 行/列的 k k k 倍加到第 i i i 行/列 E i j ( − k ) E_{ij}(-k) E ij ( − k )
核心思想 :初等矩阵是初等变换的代数表示,它将"对矩阵的操作"转化为"矩阵乘法",使得我们能够用代数的语言来研究初等变换,是连接矩阵运算与线性变换的桥梁。
二、线性方程组与矩阵初等变换
考虑 m m m 个方程 n n n 个未知数的线性方程组:
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋮ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m \begin{cases}
a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \\
a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2 \\
\vdots \\
a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m
\end{cases} ⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋮ a m 1 x 1 + a m 2 x 2 + ⋯ + a mn x n = b m
写成矩阵形式:
A x = b A \mathbf{x} = \mathbf{b} A x = b
其中 A = ( a i j ) m × n A = (a_{ij})_{m\times n} A = ( a ij ) m × n 是系数矩阵,增广矩阵为:
( A ∣ b ) = ( a 11 a 12 ⋯ a 1 n b 1 a 21 a 22 ⋯ a 2 n b 2 ⋮ ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m n b m ) (A \mid \mathbf{b}) =
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\
a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\
\vdots & \vdots & & \vdots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn} & b_m
\end{pmatrix} ( A ∣ b ) = a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a mn b 1 b 2 ⋮ b m
核心思想 :对增广矩阵进行初等行变换,不改变方程组的解集。
通过初等行变换,可以将增广矩阵化为行阶梯形 (行最简形),从而判断解的情况并求解。
1. 消元过程与矩阵行阶梯形
通过行变换,我们得到行阶梯形 (每个非零行首非零元下方全为0)和行最简形 (每个非零行首非零元为1,且所在列其他元素为0)。
例:
( 1 2 − 1 0 5 0 1 3 1 2 0 0 0 1 4 ) \left(\begin{array}{cccc|c}
1 & 2 & -1 & 0 & 5 \\
0 & 1 & 3 & 1 & 2 \\
0 & 0 & 0 & 1 & 4
\end{array}\right) 1 0 0 2 1 0 − 1 3 0 0 1 1 5 2 4
这是行阶梯形。若再将每行首元化为1,并消除其上方的元素,则得行最简形。
行阶梯形定义:
如果某一行全是 0(全零行),它必须排在所有非零行的下面
每一行第一个不为 0 的数字(我们叫它主元或领头羊),必须比上一行的“领头羊”更靠右。
每个“领头羊”所在的这一列,它下面的所有元素必须全是 0。
行阶梯形,类似下楼梯:想象你在走楼梯,每一步都要往右走,并且往下走。不能往左回退,也不能在同一层平铺。
2. 解的判定
非齐次线性方程组 (A x = b Ax=b A x = b )
设线性方程组 A x = b Ax=b A x = b 的系数矩阵为 A A A ,增广矩阵为 A ˉ \bar{A} A ˉ ,未知数个数为 n n n 。
令 R ( A ) R(A) R ( A ) 表示矩阵 A A A 的秩,R ( A ˉ ) R(\bar{A}) R ( A ˉ ) 表示增广矩阵的秩。
无解 :当且仅当 R ( A ) < R ( A ˉ ) R(A) < R(\bar{A}) R ( A ) < R ( A ˉ ) 。
在行阶梯形中表现为出现了一行 ( 0 , 0 , … , 0 ∣ d ) (0, 0, \dots, 0 | d) ( 0 , 0 , … , 0∣ d ) ,其中 d ≠ 0 d \neq 0 d = 0 (即 0 = d 0=d 0 = d 的矛盾方程)。
有唯一解 :当且仅当 R ( A ) = R ( A ˉ ) = n R(A) = R(\bar{A}) = n R ( A ) = R ( A ˉ ) = n 。
有无穷多解 :当且仅当 R ( A ) = R ( A ˉ ) < n R(A) = R(\bar{A}) < n R ( A ) = R ( A ˉ ) < n 。
此时自由未知量(自由变量)的个数为 n − R ( A ) n - R(A) n − R ( A ) 。通解可以表示为特解加上齐次方程组通解的线性组合。
齐次线性方程组 (A x = 0 Ax=0 A x = 0 )
永远有解(至少有零解 x = 0 x=0 x = 0 )。
只有零解 ⟺ R ( A ) = n \iff R(A) = n ⟺ R ( A ) = n 。
有非零解 ⟺ R ( A ) < n \iff R(A) < n ⟺ R ( A ) < n 。
三、矩阵的秩
1. 定义
矩阵 A A A 的秩 r a n k ( A ) \mathrm{rank}(A) rank ( A ) 有几种等价定义:
行列式定义 :矩阵中非零子式的最高阶数。
行秩定义 :行向量组的极大线性无关组的向量个数(行秩)。
列秩定义 :列向量组的极大线性无关组的向量个数(列秩)。
重要结论 :行秩 = 列秩 = 秩。
1.1 核心结论:形状不同,但“秩”相同
行数与列数 :描述的是矩阵的物理尺寸 (外形)。
例如:一个 3 × 5 3 \times 5 3 × 5 的矩阵,有 3 行、5 列。显然 3 ≠ 5 3 \neq 5 3 = 5 。
行秩与列秩 :描述的是矩阵内部包含的有效信息量 (维度)。
行秩 :行向量中线性无关的个数。
列秩 :列向量中线性无关的个数。
定理 :对于任意 m × n m \times n m × n 矩阵 A A A ,都有:
行秩 ( A ) = 列秩 ( A ) = R ( A ) \text{行秩}(A) = \text{列秩}(A) = R(A) 行秩 ( A ) = 列秩 ( A ) = R ( A )
这个共同的值,就是我们常说的矩阵的秩 。
1.2 直观理解:为什么它们会相等?
你可能会觉得奇怪:行数和列数都不一样,为什么它们能挑出的“独立代表”(秩)数量会一样呢?
我们可以用**“行阶梯形”**(也就是上一轮对话提到的“楼梯”)来解释,这是最直观的方法:
想象你对这个 3 × 5 3 \times 5 3 × 5 的矩阵进行高斯消元,把它化成行阶梯形:
( 1 2 3 4 5 0 2 4 6 8 0 0 0 3 9 ) \begin{pmatrix}
\mathbf{1} & 2 & 3 & 4 & 5 \\
0 & \mathbf{2} & 4 & 6 & 8 \\
0 & 0 & 0 & \mathbf{3} & 9
\end{pmatrix} 1 0 0 2 2 0 3 4 0 4 6 3 5 8 9
在这个阶梯形中:
看行(行秩) :数一数有多少个非零行 (有台阶的行)。这里有 3 个非零行。所以行秩 = 3 。
看列(列秩) :数一数有多少个主元列 (也就是包含台阶“领头羊”的列,即第1、2、4列)。这里也有 3 个主元列。所以列秩 = 3 。
结论 :
无论矩阵长什么样,“非零行的数量”永远等于“主元列的数量” 。因为每一个台阶(非零行)必然对应一个唯一的“领头羊”(主元列)。这就是行秩等于列秩的根本原因。
1.3 限制条件:秩受限于“短板”
虽然行秩等于列秩,但它们的最大值 受限于行数和列数中较小的那一个。
对于一个 m × n m \times n m × n 的矩阵,其秩 R ( A ) R(A) R ( A ) 满足:
R ( A ) ≤ min ( m , n ) R(A) \le \min(m, n) R ( A ) ≤ min ( m , n )
例子 A (3 × 5 3 \times 5 3 × 5 矩阵) :
行数 3,列数 5。
行秩最多是 3(因为只有 3 行)。
列秩最多是 5(因为只有 5 列)。
因为行秩=列秩,所以这个矩阵的秩最大只能是 3 。不可能达到 5。
例子 B (5 × 3 5 \times 3 5 × 3 矩阵) :
行数 5,列数 3。
这个矩阵的秩最大只能是 3 。
1.4 总结
比较项目 行数 vs 列数 行秩 vs 列秩 定义 矩阵的长和宽 矩阵内部独立信息的维度 非方阵情况 不相等 (例如 3 × 5 3 \times 5 3 × 5 )始终相等 (例如都是 3)关系 决定了秩的上限 是同一个数值,统称为矩阵的秩
所以,不用担心矩阵是不是方方正正的,只要算出了行秩,你就同时也知道了列秩,它们永远是一对“双胞胎”。
2. 秩的性质
设 A , B A, B A , B 为 m × n m \times n m × n 矩阵,k k k 为非零常数:
范围限制 :
0 ≤ R ( A ) ≤ min ( m , n ) 0 \le R(A) \le \min(m, n) 0 ≤ R ( A ) ≤ min ( m , n )
若 R ( A ) = min ( m , n ) R(A) = \min(m, n) R ( A ) = min ( m , n ) ,称 A A A 为满秩矩阵 。
若 A A A 是 n n n 阶方阵且 R ( A ) = n R(A)=n R ( A ) = n ,则 A A A 可逆(非奇异)。
初等变换不变性 :
初等变换不改变矩阵的秩。即若 A ∼ B A \sim B A ∼ B ,则 R ( A ) = R ( B ) R(A) = R(B) R ( A ) = R ( B ) 。
这也是为什么我们可以通过将矩阵化为行阶梯形来求秩:行阶梯形矩阵中非零行的行数即为该矩阵的秩 。
运算性质 :
R ( A T ) = R ( A ) R(A^T) = R(A) R ( A T ) = R ( A ) (转置不改变秩)。
R ( k A ) = R ( A ) R(kA) = R(A) R ( k A ) = R ( A ) (k ≠ 0 k \neq 0 k = 0 )。
R ( A + B ) ≤ R ( A ) + R ( B ) R(A + B) \le R(A) + R(B) R ( A + B ) ≤ R ( A ) + R ( B ) 。
R ( A B ) ≤ min ( R ( A ) , R ( B ) ) R(AB) \le \min(R(A), R(B)) R ( A B ) ≤ min ( R ( A ) , R ( B )) 。
若 P , Q P, Q P , Q 为可逆矩阵,则 R ( P A Q ) = R ( A ) R(PAQ) = R(A) R ( P A Q ) = R ( A ) 。
与行列式的关系 (针对 n n n 阶方阵 A A A ):
R ( A ) = n ⟺ ∣ A ∣ ≠ 0 R(A) = n \iff |A| \neq 0 R ( A ) = n ⟺ ∣ A ∣ = 0 (满秩,可逆)。
R ( A ) < n ⟺ ∣ A ∣ = 0 R(A) < n \iff |A| = 0 R ( A ) < n ⟺ ∣ A ∣ = 0 (降秩,不可逆)。
分块矩阵性质 :
R ( A 0 0 B ) = R ( A ) + R ( B ) R\begin{pmatrix} A & 0 \\ 0 & B \end{pmatrix} = R(A) + R(B) R ( A 0 0 B ) = R ( A ) + R ( B ) 。
前置知识:两个核心直觉
秩的直观定义 :
把矩阵通过初等行变换 化成行阶梯形 (像楼梯一样),非零行的行数 就是矩阵的秩。
为什么? 因为每一行非零行都代表一个独立的方程(或独立的信息),全零行代表“0=0”的废话,没有信息量。
初等变换的本质 :
交换两行 → \to → 只是换个顺序说话,信息没变。
某行乘非零数 → \to → 只是换了个单位说话(比如“1米”变成“100厘米”),信息没变。
一行加到另一行 → \to → 只是把两个信息混合了一下,并没有创造新信息,也没丢掉旧信息(因为这个过程是可逆的)。
结论 :初等变换不改变矩阵的秩。
性质 1:转置不改变秩 R ( A ) = R ( A T ) R(A) = R(A^T) R ( A ) = R ( A T )
通俗解释 :
矩阵的秩既等于“行向量组”中独立向量的个数(行秩),也等于“列向量组”中独立向量的个数(列秩)。
A A A 的行,就是 A T A^T A T 的列。
A A A 的列,就是 A T A^T A T 的行。
“证明”逻辑 :
我们在解方程组时习惯用“行变换”求秩,算出来的是“行秩”。
但在数学深层理论中有一个伟大的定理:任何矩阵的行秩都严格等于列秩 。
既然 R ( A ) R(A) R ( A ) 是 A A A 的行秩,而 A A A 的行就是 A T A^T A T 的列,那么 R ( A ) R(A) R ( A ) 就等于 A T A^T A T 的列秩。
又因为 A T A^T A T 的列秩 = A T A^T A T 的行秩(即 R ( A T ) R(A^T) R ( A T ) )。
所以,R ( A ) = R ( A T ) R(A) = R(A^T) R ( A ) = R ( A T ) 。
一句话总结 :横着数有多少条独立信息,竖着数也是多少条,转置只是把横竖互换,总数不变。
性质 2:数乘不改变秩 (k ≠ 0 k \neq 0 k = 0 时,R ( k A ) = R ( A ) R(kA) = R(A) R ( k A ) = R ( A ) )
通俗解释 :
如果你把一份文件里的所有数字都扩大 100 倍,这份文件包含的“有效信息条数”变了吗?没有。
只要 k ≠ 0 k \neq 0 k = 0 ,原本是非零的行,乘以 k k k 后还是非零;原本是零的行,乘以 k k k 后还是零。
“证明”逻辑 :
对 A A A 做初等行变换化为阶梯形 U U U ,非零行数为 r r r ,则 R ( A ) = r R(A)=r R ( A ) = r 。
对 k A kA k A 做同样的变换(除了倍乘那一步系数变了,其他逻辑一样),得到的阶梯形其实就是 k U kU k U 。
因为 k ≠ 0 k \neq 0 k = 0 ,所以 U U U 中的非零行在 k U kU k U 中依然是非零行(不可能因为乘个非零数就变成0)。
所以非零行数依然是 r r r 。
故 R ( k A ) = R ( A ) R(kA) = R(A) R ( k A ) = R ( A ) 。
性质 3:和的秩不超过秩的和 R ( A + B ) ≤ R ( A ) + R ( B ) R(A+B) \le R(A) + R(B) R ( A + B ) ≤ R ( A ) + R ( B )
通俗解释 :
假设 A A A 代表了 r A r_A r A 条独立信息,B B B 代表了 r B r_B r B 条独立信息。
当你把 A A A 和 B B B 加起来得到 A + B A+B A + B 时,新的矩阵里的每一行,本质上都是 A A A 的行和 B B B 的行的“混合体”。
A + B A+B A + B 能产生的最大独立信息量,绝对不可能超过 A A A 和 B B B 各自独立信息量的总和。
甚至可能更少!因为 A A A 里的某条信息和 B B B 里的某条信息可能刚好抵消 了(比如 1 1 1 和 − 1 -1 − 1 相加变 0 0 0 ),导致信息丢失。
“证明”逻辑 :
设 A A A 的行向量组的极大无关组有 r A r_A r A 个向量,B B B 的有 r B r_B r B 个。
A + B A+B A + B 的每一行都可以写成:(A A A 的某行) + (B B B 的某行)。
这意味着,A + B A+B A + B 的所有行向量,都可以由“A A A 的极大无关组”加上“B B B 的极大无关组”这总共 r A + r B r_A + r_B r A + r B 个向量线性表示出来。
根据线性代数基本定理:如果一个向量组能被 m m m 个向量线性表示,那么这个向量组的秩(独立个数)一定 ≤ m \le m ≤ m 。
这里 m = r A + r B m = r_A + r_B m = r A + r B ,所以 R ( A + B ) ≤ R ( A ) + R ( B ) R(A+B) \le R(A) + R(B) R ( A + B ) ≤ R ( A ) + R ( B ) 。
性质 4:乘积的秩不超过因子的秩 R ( A B ) ≤ min ( R ( A ) , R ( B ) ) R(AB) \le \min(R(A), R(B)) R ( A B ) ≤ min ( R ( A ) , R ( B ))
这是最难理解但也最重要的性质之一。我们要分两部分看:R ( A B ) ≤ R ( A ) R(AB) \le R(A) R ( A B ) ≤ R ( A ) 和 R ( A B ) ≤ R ( B ) R(AB) \le R(B) R ( A B ) ≤ R ( B ) 。
第一部分:R ( A B ) ≤ R ( B ) R(AB) \le R(B) R ( A B ) ≤ R ( B )
通俗解释 :
把 B B B 看作是一组原材料(列向量),A A A 看作是一个加工机器(线性变换)。
A B AB A B 的结果,就是把 B B B 的每一列都扔进机器 A A A 里加工了一下。
如果 B B B 只有 3 种独立的原材料(R ( B ) = 3 R(B)=3 R ( B ) = 3 ),那么不管机器 A A A 多厉害,加工出来的产品最多也只有 3 种独立类型。机器不能无中生有创造出新的独立性。
甚至,如果机器 A A A 是个“粉碎机”(比如全是0),那产品可能连 3 种都没有了。
“证明”逻辑 :
证明 r ( A B ) ≤ r ( B ) r(AB) \le r(B) r ( A B ) ≤ r ( B )
设 B B B 的列向量组为 β 1 , β 2 , … , β p \beta_1, \beta_2, \ldots, \beta_p β 1 , β 2 , … , β p ,则
A B = A ( β 1 , β 2 , … , β p ) = ( A β 1 , A β 2 , … , A β p ) AB = A(\beta_1, \beta_2, \ldots, \beta_p) = (A\beta_1, A\beta_2, \ldots, A\beta_p) A B = A ( β 1 , β 2 , … , β p ) = ( A β 1 , A β 2 , … , A β p )
所以 A B AB A B 的列向量是 A β 1 , … , A β p A\beta_1, \ldots, A\beta_p A β 1 , … , A β p 。
若 β i 1 , … , β i r \beta_{i_1}, \ldots, \beta_{i_r} β i 1 , … , β i r 是 B B B 的列向量组的极大无关组,则任一 β j \beta_j β j 可由它们线性表示。设
β j = ∑ k = 1 r c j k β i k \beta_j = \sum_{k=1}^r c_{jk} \beta_{i_k} β j = k = 1 ∑ r c jk β i k
左乘 A A A 得
A β j = ∑ k = 1 r c j k ( A β i k ) A\beta_j = \sum_{k=1}^r c_{jk} (A\beta_{i_k}) A β j = k = 1 ∑ r c jk ( A β i k )
因此 A B AB A B 的任一列可由 { A β i 1 , … , A β i r } \{A\beta_{i_1}, \ldots, A\beta_{i_r}\} { A β i 1 , … , A β i r } 线性表示。故 r ( A B ) ≤ r = r ( B ) r(AB) \le r = r(B) r ( A B ) ≤ r = r ( B ) 。
证明 r ( A B ) ≤ r ( A ) r(AB) \le r(A) r ( A B ) ≤ r ( A )
利用转置:
r ( A B ) = r ( ( A B ) T ) = r ( B T A T ) ≤ r ( B T ) (由上面已证) r(AB) = r((AB)^T) = r(B^T A^T) \le r(B^T) \quad \text{(由上面已证)} r ( A B ) = r (( A B ) T ) = r ( B T A T ) ≤ r ( B T ) ( 由上面已证 )
而 r ( B T ) = r ( B ) r(B^T) = r(B) r ( B T ) = r ( B ) ,这个方向不能直接得到 r ( A ) r(A) r ( A ) 的上界。
换一种思路:考虑 A B AB A B 的行向量。A B AB A B 的行向量是 A A A 的行向量的线性组合(系数来自 B B B )。具体地,若 A A A 的行向量为 α 1 , … , α m \alpha_1, \ldots, \alpha_m α 1 , … , α m ,则 A B AB A B 的第 i i i 行是 α i B \alpha_i B α i B 。
设 α i 1 , … , α i s \alpha_{i_1}, \ldots, \alpha_{i_s} α i 1 , … , α i s 是 A A A 的行向量组的极大无关组(s = r ( A ) s = r(A) s = r ( A ) ),则任一 α i \alpha_i α i 可由它们线性表示,从而 α i B \alpha_i B α i B 也可由 α i 1 B , … , α i s B \alpha_{i_1}B, \ldots, \alpha_{i_s}B α i 1 B , … , α i s B 线性表示。所以 A B AB A B 的行秩 ≤ s = r ( A ) \le s = r(A) ≤ s = r ( A ) 。
因此 r ( A B ) ≤ r ( A ) r(AB) \le r(A) r ( A B ) ≤ r ( A ) 且 r ( A B ) ≤ r ( B ) r(AB) \le r(B) r ( A B ) ≤ r ( B ) ,即 r ( A B ) ≤ min { r ( A ) , r ( B ) } r(AB) \le \min\{r(A), r(B)\} r ( A B ) ≤ min { r ( A ) , r ( B )} 。
结论 :
既然 R ( A B ) R(AB) R ( A B ) 既小于等于 R ( A ) R(A) R ( A ) ,又小于等于 R ( B ) R(B) R ( B ) ,那它自然小于等于两者中较小的那个:
R ( A B ) ≤ min ( R ( A ) , R ( B ) ) R(AB) \le \min(R(A), R(B)) R ( A B ) ≤ min ( R ( A ) , R ( B ))
一句话总结 :乘法就像过筛子。A A A 和 B B B 谁的信息量少(秩小),谁就是瓶颈,最终结果的信息量绝不可能超过这个瓶颈。
四、秩的求法与示例
求秩方法 :通过初等行变换化为行阶梯形,非零行的行数即为秩。
例:
A = ( 1 2 3 2 4 6 3 5 7 ) A = \begin{pmatrix}
1 & 2 & 3 \\
2 & 4 & 6 \\
3 & 5 & 7
\end{pmatrix} A = 1 2 3 2 4 5 3 6 7
行变换:
r 2 ← r 2 − 2 r 1 , r 3 ← r 3 − 3 r 1 r_2 \leftarrow r_2 - 2r_1,\quad r_3 \leftarrow r_3 - 3r_1 r 2 ← r 2 − 2 r 1 , r 3 ← r 3 − 3 r 1
→ ( 1 2 3 0 0 0 0 − 1 − 2 ) \to \begin{pmatrix}
1 & 2 & 3 \\
0 & 0 & 0 \\
0 & -1 & -2
\end{pmatrix} → 1 0 0 2 0 − 1 3 0 − 2
交换第2、3行:
( 1 2 3 0 − 1 − 2 0 0 0 ) \begin{pmatrix}
1 & 2 & 3 \\
0 & -1 & -2 \\
0 & 0 & 0
\end{pmatrix} 1 0 0 2 − 1 0 3 − 2 0
有两个非零行,故 r a n k ( A ) = 2 \mathrm{rank}(A) = 2 rank ( A ) = 2 。
五、总结
概念 说明 初等行变换 三种基本操作,对应左乘初等矩阵,保持方程组同解 初等列变换 类似,对应右乘初等矩阵,不影响秩 行阶梯形 通过行变换得到,用于判断秩和解的情况 矩阵的秩 行秩=列秩,等于非零子式最高阶数,初等变换不变 秩与方程 秩决定解的存在性、唯一性,以及自由变量个数
矩阵初等变换、秩和线性方程组的解之间构成了一个完整的理论体系:通过初等变换求秩,通过秩判定解的结构,通过行最简形直接写出通解 。
六、参考文献
本文参考AI回答,豆包,Deepseek,千问