第二章矩阵-2.矩阵的运算

9 阅读5分钟

1. 矩阵加法

1.1 定义

A=(aij)m×nA = (a_{ij})_{m \times n}B=(bij)m×nB = (b_{ij})_{m \times n} 是两个同型矩阵(行数和列数分别相等),则它们的和 C=A+BC = A + B 定义为:

cij=aij+bij,i=1,,m;  j=1,,nc_{ij} = a_{ij} + b_{ij}, \quad i=1,\dots,m;\; j=1,\dots,n

即对应位置的元素相加。

1.2 示例

(1234)+(5678)=(1+52+63+74+8)=(681012)\begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} + \begin{pmatrix} 5 & 6 \\ 7 & 8 \end{pmatrix} = \begin{pmatrix} 1+5 & 2+6 \\ 3+7 & 4+8 \end{pmatrix} = \begin{pmatrix} 6 & 8 \\ 10 & 12 \end{pmatrix}

1.3 运算性质

  • 交换律A+B=B+AA + B = B + A
  • 结合律(A+B)+C=A+(B+C)(A + B) + C = A + (B + C)
  • 零矩阵:存在零矩阵 OO(所有元素为0),使得 A+O=AA + O = A
  • 负矩阵:对任意 AA,存在 A=(aij)-A = (-a_{ij}),使得 A+(A)=OA + (-A) = O

1.4 注意事项

加法只对同型矩阵有定义,不同形状的矩阵不能相加。


2.数与矩阵相乘(数乘)

2.1 定义

kk 是一个数(标量),A=(aij)m×nA = (a_{ij})_{m \times n},则数乘 kAkA 定义为:

(kA)ij=kaij(kA)_{ij} = k \cdot a_{ij}

即用数 kk 乘以矩阵的每一个元素。

2.2 示例

2×(1234)=(2×12×22×32×4)=(2468)2 \times \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} = \begin{pmatrix} 2 \times 1 & 2 \times 2 \\ 2 \times 3 & 2 \times 4 \end{pmatrix} = \begin{pmatrix} 2 & 4 \\ 6 & 8 \end{pmatrix}

2.3 运算性质

  • 结合律k(lA)=(kl)Ak(lA) = (kl)A
  • 分配律
    • (k+l)A=kA+lA(k+l)A = kA + lA
    • k(A+B)=kA+kBk(A+B) = kA + kB
  • 单位元1A=A1 \cdot A = A

2.4 几何意义

数乘相当于对矩阵所表示的线性变换进行缩放。如果 k>1k>1 则放大,0<k<10<k<1 则缩小,k<0k<0 则包含反向。

3.矩阵与矩阵相乘

3.1 定义

A=(aij)m×nA = (a_{ij})_{m \times n}B=(bij)n×pB = (b_{ij})_{n \times p},则它们的乘积 C=ABC = AB 是一个 m×pm \times p 矩阵,其元素为:

cij=k=1naikbkj,i=1,,m;  j=1,,pc_{ij} = \sum_{k=1}^{n} a_{ik} b_{kj}, \quad i=1,\dots,m;\; j=1,\dots,p

CC 的第 ii 行第 jj 列元素等于 AA 的第 ii 行与 BB 的第 jj 列对应元素乘积之和(行乘列)。

3.2 可乘条件

AA列数必须等于 BB行数。若 AAm×nm \times nBBn×pn \times p,则乘积 ABAB 有意义且为 m×pm \times p 矩阵。

3.3 示例

A=(1234)2×2,B=(5678)2×2A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}_{2 \times 2}, \quad B = \begin{pmatrix} 5 & 6 \\ 7 & 8 \end{pmatrix}_{2 \times 2}
AB=(1×5+2×71×6+2×83×5+4×73×6+4×8)=(5+146+1615+2818+32)=(19224350)AB = \begin{pmatrix} 1\times5+2\times7 & 1\times6+2\times8 \\ 3\times5+4\times7 & 3\times6+4\times8 \end{pmatrix} = \begin{pmatrix} 5+14 & 6+16 \\ 15+28 & 18+32 \end{pmatrix} = \begin{pmatrix} 19 & 22 \\ 43 & 50 \end{pmatrix}

3.4 运算性质

  • 结合律(AB)C=A(BC)(AB)C = A(BC)(前提是各乘积有意义)
  • 分配律
    • A(B+C)=AB+ACA(B+C) = AB + AC
    • (A+B)C=AC+BC(A+B)C = AC + BC
  • 数乘结合k(AB)=(kA)B=A(kB)k(AB) = (kA)B = A(kB)
  • 不满足交换律:一般 ABBAAB \neq BA,甚至可能 BABA 无定义
  • 消去律不成立:由 AB=ACAB = AC 不能推出 B=CB = C(除非 AA 可逆)

3.5 几何意义

3.5.1. 与线性变换的联系(关键)

1) 任何线性变换(在有限维向量空间中)都可以用一个矩阵来表示。
这是因为: 一旦我们确定了一组基(如坐标系的 î, ĵ),那么变换矩阵的列,就是基向量变换后的坐标

例子(二维)
假设在标准坐标系中,
线性变换 TTi^=[10]\hat{i} = \begin{bmatrix}1\\0\end{bmatrix} 变成 [ac]\begin{bmatrix}a\\c\end{bmatrix}
j^=[01]\hat{j} = \begin{bmatrix}0\\1\end{bmatrix} 变成 [bd]\begin{bmatrix}b\\d\end{bmatrix}

  • 原理:线性变换有两个关键性质:
    1. 加法性T(u+v)=T(u)+T(v)T(\vec{u} + \vec{v}) = T(\vec{u}) + T(\vec{v})
    2. 齐次性(数乘)T(cv)=cT(v)T(c\vec{v}) = cT(\vec{v})
  • 推导:任意向量 x=[x1x2]\vec{x} = \begin{bmatrix}x_1\\x_2\end{bmatrix} 都可以写成基向量的线性组合: x=x1i^+x2j^\vec{x} = x_1\hat{i} + x_2\hat{j} 当我们对 x\vec{x} 进行变换 TT 时:
    T(x)=T(x1i^+x2j^)=x1T(i^)+x2T(j^)(利用线性性质)\begin{aligned} T(\vec{x}) &= T(x_1\hat{i} + x_2\hat{j}) \\ &= x_1 T(\hat{i}) + x_2 T(\hat{j}) \quad \text{(利用线性性质)} \end{aligned}
    既然 T(i^)T(\hat{i}) 变成了 [ac]\begin{bmatrix}a\\c\end{bmatrix}T(j^)T(\hat{j}) 变成了 [bd]\begin{bmatrix}b\\d\end{bmatrix},那么:
    T(x)=x1[ac]+x2[bd]=[ax1+bx2cx1+dx2]T(\vec{x}) = x_1 \begin{bmatrix}a\\c\end{bmatrix} + x_2 \begin{bmatrix}b\\d\end{bmatrix} = \begin{bmatrix} ax_1 + bx_2 \\ cx_1 + dx_2 \end{bmatrix}
    这正好就是矩阵乘法 AxA\vec{x} 的定义结果,所以说矩阵乘法就是计算线性变换作用于向量的结果,由此引入表达式说明矩阵和线性变换几何关系。

考虑表达式 y=Ax\mathbf{y} = A\mathbf{x}(线性方程组),这不仅是代数运算,更是一个几何过程

  • 向量 x\mathbf{x} 是输入;
  • 矩阵 AA 是变换规则;
  • 向量 y\mathbf{y} 是输出(即变换后的结果)。

🔍 从“列空间”的角度看:
AxA\mathbf{x} 实际上是矩阵 AA 的列向量以 x\mathbf{x} 的分量为系数进行线性组合的结果。
所以,矩阵乘法的本质是将输入向量“重新组合”到由矩阵列向量张成的新空间中 。

也即:矩阵乘法 AxAx 可以看作是矩阵 AA列向量的线性组合x1[a11a21]+x2[a12a22]++xn[a1namn]=[b1b2] x_1 \begin{bmatrix} a_{11} \\ a_{21} \\ \vdots \end{bmatrix} + x_2 \begin{bmatrix} a_{12} \\ a_{22} \\ \vdots \end{bmatrix} + \dots + x_n \begin{bmatrix} a_{1n} \\ a_{mn} \\ \vdots \end{bmatrix} = \begin{bmatrix} b_1 \\ b_2 \\ \vdots \end{bmatrix}

3.5.2 复合变换与矩阵乘法的联系

1) 核心公式

当多个线性变换连续发生(复合变换)时,比如先做变换 BB,再做变换 AA,整体效果记作 ABA \circ B

  • 先执行变换 BB(对应矩阵 BB
  • 后执行变换 AA(对应矩阵 AA

整体效果=AB    矩阵=AB\text{整体效果} = A \circ B \iff \text{矩阵} = AB

  • 运算顺序:向量 x\vec{x} 先被 BB 作用,变成 BxB\vec{x};然后结果再被 AA 作用,变成 A(Bx)A(B\vec{x})
  • 结合律:根据矩阵乘法结合律,A(Bx)=(AB)xA(B\vec{x}) = (AB)\vec{x}
    • 矩阵乘法满足结合律(AB)C=A(BC)(AB)C = A(BC),可以从几何角度证明,如果我们用变换相继作用的思想去考虑矩阵乘积,无论你先计算前两个矩阵的乘积 AB,再用结果乘以 C;还是先计算后两个矩阵的乘积BC,再用 A乘以这个结果,根据矩阵乘法的顺序,先右后左,在几何意义上,乘法结合性的左右两边都是将同样的三个变换用同样的顺序依次作用而已

⚠️ 注意顺序:先作用的变换写在右边:

(AB)(x)=A(B(x))=A(Bx)=(AB)x(A \circ B)(\mathbf{x}) = A(B(\mathbf{x})) = A(B\mathbf{x}) = (AB)\mathbf{x}
2) 为什么矩阵乘法不满足交换律? (ABBAAB \neq BA)

矩阵乘法中 AB ≠ BA 的核心原因在于 非交换性,这源于矩阵乘法的定义、维度约束及线性变换的复合特性。以下从运算规则、几何意义、特殊情况展开分析:

1. 运算规则:维度匹配与计算本质

  • 维度约束:矩阵乘法要求左侧矩阵的列数等于右侧矩阵的行数。例如:
    • AAm×nm \times n 矩阵,BBn×pn \times p 矩阵,则 ABABm×pm \times p 矩阵(维度为 m×pm \times p)。
    • BABA 仅在 BB 的列数等于 AA 的行数(即 p=mp = m)时有定义,否则无意义。例如:
      • A(2×3)A(2 \times 3)B(3×2)B(3 \times 2) 可计算 AB(2×2)AB(2 \times 2),但 BA(3×3)BA(3 \times 3) 需额外条件(如 p=mp = m)。
  • 计算本质矩阵乘法的结果是行向量与列向量的点积组合。例如,ABAB 的第 ii 行第 jj 列元素为 AA 的第 ii 行与 BB 的第 jj 列对应元素乘积之和。这种计算方式导致顺序颠倒后,元素分布可能完全不同

2. 几何意义:线性变换的复合顺序

  • 变换顺序的物理意义:矩阵乘法对应线性变换的复合,顺序不同对应不同的变换路径。例如:
    • ABAB 表示先对空间进行 BB 的变换(如旋转),再应用 AA 的变换(如平移)。
    • BABA 则先进行 AA 的变换,再应用 BB 的变换。两者结果可能截然不同(如先旋转再平移 vs. 先平移再旋转)。

3. 特殊情况:可交换的矩阵类型 尽管绝大多数矩阵不满足交换律,但以下情况例外:

  • 单位矩阵与零矩阵:单位矩阵 II 满足 IA=AI=AIA = AI = A;零矩阵 OO 满足 OA=AO=OOA = AO = O
  • 对角矩阵:同阶对角矩阵相乘可交换,结果仍为对角矩阵(元素为对应位置元素的乘积)。
  • 可逆矩阵与自身逆矩阵:若 AA 可逆,则 AA1=A1A=IAA^{-1} = A^{-1}A = I
  • 数量矩阵(主对角线元素均相同的对角矩阵):与任意同阶方阵可交换。
3) 矩阵乘法的本质
  • 右侧矩阵 BB 首先作用于空间:

    • 它把标准基向量 i^=[10]\hat{i} = \begin{bmatrix}1\\0\end{bmatrix} 映射到它的第一列
    • j^=[01]\hat{j} = \begin{bmatrix}0\\1\end{bmatrix} 映射到它的第二列
  • 然后左侧矩阵 AA 作用于这个已经被 BB 变换过的新空间:

    • 所以 i^\hat{i} 经过整个复合变换 ABA \circ B 后的位置是:
      A(B 的第一列)=A[b11b21]A \cdot (\text{B 的第一列}) = A \begin{bmatrix}b_{11}\\b_{21}\end{bmatrix}
      这就构成了乘积矩阵 ABAB第一列
    • 类似地,j^\hat{j} 的最终位置是:
      A(B 的第二列)=A[b12b22]A \cdot (\text{B 的第二列}) = A \begin{bmatrix}b_{12}\\b_{22}\end{bmatrix}
      构成 ABAB第二列

矩阵乘法 ABAB 的本质,就是用矩阵 AA 去变换矩阵 BB 的每一列

  • BB 的列向量 b1,b2\mathbf{b}_1, \mathbf{b}_2 代表了“基向量经过 BB 变换后的新位置”。
  • AA 的作用是将这些“中间位置”再次搬运。
  • 所以,ABAB 的第 jj 列 = A×(A \times ( BB 的第 jj))AB=[Ab1Ab2]AB = \begin{bmatrix} | & | \\ A\mathbf{b}_1 & A\mathbf{b}_2 \\ | & | \end{bmatrix}

假设: A=[a11a12a21a22],b1=[b11b21]A = \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix}, \quad \mathbf{b}_1 = \begin{bmatrix} b_{11} \\ b_{21} \end{bmatrix}, b2=[b12b22]\quad \mathbf{b}_2 = \begin{bmatrix} b_{12} \\ b_{22} \end{bmatrix}

计算 Ab1A\mathbf{b}_1 的结果是一个新的向量(也就是 ABAB 的第一列):

Ab1=[a11a12a21a22][b11b21]=[a11b11+a12b21a21b11+a22b21]A\mathbf{b}_1 = \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix} \begin{bmatrix} b_{11} \\ b_{21} \end{bmatrix} = \begin{bmatrix} a_{11}b_{11} + a_{12}b_{21} \\ a_{21}b_{11} + a_{22}b_{21} \end{bmatrix}

计算 Ab2A\mathbf{b}_2 的结果是一个新的向量(也就是 ABAB 的第二列):

Ab2=[a11a12a21a22][b12b22]=[a11b12+a12b22a21b12+a22b22]A\mathbf{b}_2 = \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix} \begin{bmatrix} b_{12} \\ b_{22} \end{bmatrix} = \begin{bmatrix} a_{11}b_{12} + a_{12}b_{22} \\ a_{21}b_{12} + a_{22}b_{22} \end{bmatrix}

这直接证明了:复合矩阵的列,就是原始基向量经过层层变换后的最终坐标。

4) 行列式的几何意义(面积的连乘)

对于复合变换,面积(或体积)的缩放比例也是相乘的: det(AB)=det(A)det(B)\det(AB) = \det(A) \cdot \det(B)

  • 几何解释
    • BB 先把空间面积扩大了 det(B)\det(B) 倍。
    • AA 接着在这个基础上,又把面积扩大了 det(A)\det(A) 倍。
    • 总的扩大倍数自然是两者的乘积。 这也验证了复合变换的连贯性。

4.矩阵的转置

4.1 定义

A=(aij)m×nA = (a_{ij})_{m \times n},则 AA 的转置 ATA^T 是一个 n×mn \times m 矩阵,其元素为:

(AT)ij=aji(A^T)_{ij} = a_{ji}

即把矩阵的行与列互换。

4.2 示例

A=(123456)2×3,AT=(142536)3×2A = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix}_{2 \times 3}, \quad A^T = \begin{pmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{pmatrix}_{3 \times 2}

4.3 运算性质

  • 双重转置(AT)T=A(A^T)^T = A
  • 加法(A+B)T=AT+BT(A+B)^T = A^T + B^T
  • 数乘(kA)T=kAT(kA)^T = kA^T
  • 乘法(AB)T=BTAT(AB)^T = B^T A^T(注意顺序反转)
  • 可逆性:若 AA 可逆,则 (AT)1=(A1)T(A^T)^{-1} = (A^{-1})^T

4.4 特殊矩阵类型

  • 对称矩阵AT=AA^T = A(必须是方阵)
  • 反对称矩阵AT=AA^T = -A

5.方阵的行列式

5.1 定义

行列式是一个将 nn 阶方阵映射到一个标量的函数,记作 det(A)\det(A)A|A|。它反映了矩阵所代表的线性变换的体积缩放因子

5.2 低阶计算公式

  • 一阶det(a)=a\det(a) = a
  • 二阶det(abcd)=adbc\det\begin{pmatrix} a & b \\ c & d \end{pmatrix} = ad - bc
  • 三阶(对角线法则):
    det(a11a12a13a21a22a23a31a32a33)=a11a22a33+a12a23a31+a13a21a32a13a22a31a11a23a32a12a21a33\det\begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{pmatrix} = a_{11}a_{22}a_{33} + a_{12}a_{23}a_{31} + a_{13}a_{21}a_{32} - a_{13}a_{22}a_{31} - a_{11}a_{23}a_{32} - a_{12}a_{21}a_{33}

5.3 一般定义(递归)

按第一行展开(拉普拉斯展开):

det(A)=j=1n(1)1+ja1jM1j\det(A) = \sum_{j=1}^{n} (-1)^{1+j} a_{1j} M_{1j}

其中 MijM_{ij}AA 去掉第 ii 行第 jj 列后得到的子式。

5.4 运算性质

  • 单位矩阵det(In)=1\det(I_n) = 1
  • 转置det(AT)=det(A)\det(A^T) = \det(A)
  • 数乘det(kA)=kndet(A)\det(kA) = k^n \det(A)
  • 乘法det(AB)=det(A)det(B)\det(AB) = \det(A) \det(B)(重要性质)
  • 可逆条件AA 可逆     \iff det(A)0\det(A) \neq 0
  • 行(列)交换:交换两行(或两列),行列式变号
  • 行(列)线性:若某行(列)是两向量之和,行列式可拆分;某行(列)乘 kk,行列式乘 kk

5.5 几何意义

  • 二阶行列式的绝对值等于以列向量为边的平行四边形的面积
  • 三阶行列式的绝对值等于以列向量为棱的平行六面体的体积
  • 符号表示定向(右手系为正)

6.伴随矩阵

6.1 定义

A=(aij)n×nA = (a_{ij})_{n \times n},首先定义:

  • 余子式 MijM_{ij}:删除 AA 的第 ii 行和第 jj 列后得到的 (n1)(n-1) 阶子式的行列式
  • 代数余子式 Aij=(1)i+jMijA_{ij} = (-1)^{i+j} M_{ij}

AA伴随矩阵(又称伴随阵、伴随)adj(A)\operatorname{adj}(A) 定义为:

adj(A)=(Aji)n×n=(A11A21An1A12A22An2A1nA2nAnn)\operatorname{adj}(A) = (A_{ji})_{n \times n} = \begin{pmatrix} A_{11} & A_{21} & \cdots & A_{n1} \\ A_{12} & A_{22} & \cdots & A_{n2} \\ \vdots & \vdots & & \vdots \\ A_{1n} & A_{2n} & \cdots & A_{nn} \end{pmatrix}

注意:伴随矩阵是代数余子式矩阵的转置

6.2 示例(二阶)

A=(abcd)A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}
  • 代数余子式:A11=dA_{11} = dA12=cA_{12} = -cA21=bA_{21} = -bA22=aA_{22} = a
  • 代数余子式矩阵:(dcba)\begin{pmatrix} d & -c \\ -b & a \end{pmatrix}
  • 伴随矩阵(转置):adj(A)=(dbca)\operatorname{adj}(A) = \begin{pmatrix} d & -b \\ -c & a \end{pmatrix}

6.3 核心性质:逆矩阵公式

Aadj(A)=adj(A)A=det(A)InA \cdot \operatorname{adj}(A) = \operatorname{adj}(A) \cdot A = \det(A) \cdot I_n

det(A)0\det(A) \neq 0 时,

A1=1det(A)adj(A)A^{-1} = \frac{1}{\det(A)} \operatorname{adj}(A)

验证:

对于二阶矩阵:

Aadj(A)=(abcd)(dbca)=(adbc00adbc)=det(A)I2A \cdot \operatorname{adj}(A) = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \begin{pmatrix} d & -b \\ -c & a \end{pmatrix} = \begin{pmatrix} ad - bc & 0 \\ 0 & ad - bc \end{pmatrix} = \det(A) I_2

因此

A1=1adbc(dbca)A^{-1} = \frac{1}{ad-bc} \begin{pmatrix} d & -b \\ -c & a \end{pmatrix}

这与熟悉的二阶求逆公式一致。

6.4 核心公式:为什么 AA=AEAA^* = |A|E

我们直接算 矩阵乘法 AAAA^*

AA=C=(cij)AA^* = C = (c_{ij})

按矩阵乘法定义:

cij=k=1naikAkjc_{ij} = \sum_{k=1}^n a_{ik}A^*_{kj}

AA^* 是转置过的,所以:

Akj=AjkA^*_{kj}=A_{jk}

于是:

cij=k=1naikAjkc_{ij} = \sum_{k=1}^n a_{ik}A_{jk}

分两种情况:

① 当 i=ji = j

cii=k=1naikAikc_{ii} = \sum_{k=1}^n a_{ik}A_{ik}

这就是 行列式按第 ii 行展开

k=1naikAik=A\sum_{k=1}^n a_{ik}A_{ik}=|A|

所以:

cii=Ac_{ii}=|A|

② 当 iji \neq j

cij=k=1naikAjkc_{ij} = \sum_{k=1}^n a_{ik}A_{jk}

这等于: 把第 ii 行的数,按第 jj 行展开 👉 行列式有两行相同,值为 0:

cij=0c_{ij}=0

合起来看 AAAA^*

AA=(A000A000A)=AEAA^* = \begin{pmatrix} |A| & 0 & \dots & 0 \\ 0 & |A| & \dots & 0 \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \dots & |A| \end{pmatrix} = |A|E

同理:AA=AEA^*A = |A|E

把刚才的逻辑按列展开,一模一样:

  • 对角线上:行列式按列展开 = A|A|
  • 非对角线:不同列混合展开 = 0

所以:

AA=AEA^*A = |A|E

6.5 用途与局限

  • 理论用途:给出逆矩阵的显式表达式,用于证明定理
  • 数值计算局限:计算 nn 阶伴随矩阵需要计算 n2n^2(n1)(n-1) 阶行列式,复杂度高达 O(n!n2)O(n! \cdot n^2),实际中不用于数值求逆(改用高斯消元或分解方法)
  • 特殊情形:当 det(A)0\det(A) \neq 0 时,adj(A)=det(A)A1\operatorname{adj}(A) = \det(A) A^{-1};当 det(A)=0\det(A) = 0 时,伴随矩阵仍有定义,但不对应逆矩阵

7.总结对照表

运算定义要点核心性质应用场景
加法对应元素相加交换、结合、零元、负元矩阵组合、误差叠加
数乘每个元素乘标量分配、结合缩放变换、线性组合
乘法行乘列求和结合、分配、不交换线性变换复合、方程组
转置行列互换(AB)T=BTAT(AB)^T = B^T A^T对称性、内积表达
行列式体积缩放因子det(AB)=det(A)det(B)\det(AB)=\det(A)\det(B)可逆判断、特征值积
伴随代数余子式转置Aadj(A)=det(A)IA\operatorname{adj}(A)=\det(A)I理论求逆、克莱姆法则

8.对角矩阵和单位矩阵

8.1 对角矩阵(Diagonal Matrix)

8.1.1.定义

对角矩阵(Diagonal Matrix)是一个方阵,其非对角线上的元素全为 0,即:

D=(d1000d2000dn)D = \begin{pmatrix} d_1 & 0 & \cdots & 0 \\ 0 & d_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & d_n \end{pmatrix}

记作 D=diag(d1,d2,,dn)D = \operatorname{diag}(d_1, d_2, \dots, d_n)

  • 必须是方阵(行数=列数)
  • 非对角线元素 全为 0
  • 对角线上可以是 0、正数、负数、小数

8.1.2 简单记

只有对角线有数字,其他全是空的

特殊:

  • 数量矩阵:所有对角线元素相等,即 D=λED = \lambda E,其中 λ\lambda 为常数

  • 零矩阵:所有对角线元素为 0

8.1.3 运算性质

对角矩阵的运算非常简洁:

加法

diag(a1,,an)+diag(b1,,bn)=diag(a1+b1,,an+bn)\operatorname{diag}(a_1,\dots,a_n) + \operatorname{diag}(b_1,\dots,b_n) = \operatorname{diag}(a_1+b_1,\dots,a_n+b_n)

数乘

kdiag(a1,,an)=diag(ka1,,kan)k \cdot \operatorname{diag}(a_1,\dots,a_n) = \operatorname{diag}(ka_1,\dots,ka_n)

乘法

diag(a1,,an)diag(b1,,bn)=diag(a1b1,,anbn)\operatorname{diag}(a_1,\dots,a_n) \cdot \operatorname{diag}(b_1,\dots,b_n) = \operatorname{diag}(a_1b_1,\dots,a_nb_n)

两个对角矩阵相乘时,交换律成立D1D2=D2D1D_1 D_2 = D_2 D_1

幂运算

[diag(d1,,dn)]k=diag(d1k,,dnk)[\operatorname{diag}(d_1,\dots,d_n)]^k = \operatorname{diag}(d_1^k,\dots,d_n^k)

可逆性: 当所有 di0d_i \neq 0 时,

[diag(d1,,dn)]1=diag(d11,,dn1)[\operatorname{diag}(d_1,\dots,d_n)]^{-1} = \operatorname{diag}(d_1^{-1},\dots,d_n^{-1})

8.1.4 几何意义

对角矩阵 D=diag(λ1,,λn)D = \operatorname{diag}(\lambda_1, \dots, \lambda_n) 左乘一个向量 x=(x1,,xn)T\mathbf{x} = (x_1,\dots,x_n)^T

Dx=(λ1x1λ2x2λnxn)D\mathbf{x} = \begin{pmatrix} \lambda_1 x_1 \\ \lambda_2 x_2 \\ \vdots \\ \lambda_n x_n \end{pmatrix}

沿各坐标轴方向独立缩放:第 ii 个坐标被缩放 λi\lambda_i 倍。

8.2 单位矩阵(Identity Matrix)

8.2.1 定义

对角线上全是 1,其余全是 0 的对角矩阵,记作 EEII

比如 2 阶、3 阶单位矩阵:

E2=(1001),E3=(100010001)E_2= \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix},\quad E_3= \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}

8.2.2 一句话记

单位矩阵 = 特殊的对角矩阵,对角线上全是 1

8.2.3 核心性质

乘法单位元:对任意矩阵 AA

  • AAm×nm \times n 矩阵,则 ImA=AI_m A = AAIn=AA I_n = A

幂等性Ik=II^k = I

可逆性I1=II^{-1} = I

转置IT=II^T = I

行列式det(I)=1\det(I) = 1

8.2.4 几何意义

单位矩阵对应恒等变换Ix=xI\mathbf{x} = \mathbf{x},保持向量不变。

8.3 单位矩阵有什么用?(超级重要)

8.3.1 矩阵里的“1”

数字里:1a=a1 \cdot a = a 矩阵里:

AE=A,EA=AAE=A,\quad EA=A

乘单位矩阵,矩阵不变

8.3.2 求逆矩阵的核心

A1A=AA1=EA^{-1}A = AA^{-1} = E

逆矩阵就是“乘完变单位矩阵”。

8.3.3 伴随矩阵公式里必须出现

AA=AA=AEAA^* = A^*A = |A|E

右边一定是 A|A| 乘单位矩阵

8.3.4 解矩阵方程

比如:

AX=BX=A1BAX=B \Rightarrow X=A^{-1}B

本质就是利用 A1A=EA^{-1}A=E


8.4 对角矩阵有什么用?(计算神器)

8.4.1 乘法特别简单

两个同阶对角矩阵相乘: 只需要对角线上元素相乘

(a00b)(c00d)=(ac00bd)\begin{pmatrix} a & 0 \\ 0 & b \end{pmatrix} \begin{pmatrix} c & 0 \\ 0 & d \end{pmatrix} = \begin{pmatrix} ac & 0 \\ 0 & bd \end{pmatrix}

8.4.2 幂运算超级简单

(λ00μ)n=(λn00μn)\begin{pmatrix} \lambda & 0 \\ 0 & \mu \end{pmatrix}^n = \begin{pmatrix} \lambda^n & 0 \\ 0 & \mu^n \end{pmatrix}

对角线上直接 n 次方

8.4.3 行列式超好算

对角矩阵的行列式 = 对角线元素乘积

a000b000c=abc\begin{vmatrix} a & 0 & 0 \\ 0 & b & 0 \\ 0 & 0 & c \end{vmatrix} = abc

8.4.4 线性代数的“标准型”

矩阵相似对角化后:

  • 好算幂
  • 好算行列式
  • 好判断是否可逆
  • 好分析特征值

所有矩阵都想变成对角矩阵,因为它最简单。

8.5 一句话总结(必背)

  • 单位矩阵:对角全 1,其余 0,是矩阵里的 1
  • 对角矩阵:只有对角线有数字,其余 0,是最简单、最好算的矩阵。
  • 关系:单位矩阵 是特殊的对角矩阵
  • 用途
    • 单位矩阵:求逆、公式、解方程都离不开
    • 对角矩阵:算乘法、幂、行列式飞快,是线性代数的“最简形态”

9.参考文献

本文参考AI回答,豆包,Deepseek,千问