1. 矩阵加法
1.1 定义
设 A=(aij)m×n 和 B=(bij)m×n 是两个同型矩阵(行数和列数分别相等),则它们的和 C=A+B 定义为:
cij=aij+bij,i=1,…,m;j=1,…,n
即对应位置的元素相加。
1.2 示例
(1324)+(5768)=(1+53+72+64+8)=(610812)
1.3 运算性质
- 交换律:A+B=B+A
- 结合律:(A+B)+C=A+(B+C)
- 零矩阵:存在零矩阵 O(所有元素为0),使得 A+O=A
- 负矩阵:对任意 A,存在 −A=(−aij),使得 A+(−A)=O
1.4 注意事项
加法只对同型矩阵有定义,不同形状的矩阵不能相加。
2.数与矩阵相乘(数乘)
2.1 定义
设 k 是一个数(标量),A=(aij)m×n,则数乘 kA 定义为:
(kA)ij=k⋅aij
即用数 k 乘以矩阵的每一个元素。
2.2 示例
2×(1324)=(2×12×32×22×4)=(2648)
2.3 运算性质
- 结合律:k(lA)=(kl)A
- 分配律:
- (k+l)A=kA+lA
- k(A+B)=kA+kB
- 单位元:1⋅A=A
2.4 几何意义
数乘相当于对矩阵所表示的线性变换进行缩放。如果 k>1 则放大,0<k<1 则缩小,k<0 则包含反向。
3.矩阵与矩阵相乘
3.1 定义
设 A=(aij)m×n,B=(bij)n×p,则它们的乘积 C=AB 是一个 m×p 矩阵,其元素为:
cij=k=1∑naikbkj,i=1,…,m;j=1,…,p
即 C 的第 i 行第 j 列元素等于 A 的第 i 行与 B 的第 j 列对应元素乘积之和(行乘列)。
3.2 可乘条件
A 的列数必须等于 B 的行数。若 A 是 m×n,B 是 n×p,则乘积 AB 有意义且为 m×p 矩阵。
3.3 示例
A=(1324)2×2,B=(5768)2×2
AB=(1×5+2×73×5+4×71×6+2×83×6+4×8)=(5+1415+286+1618+32)=(19432250)
3.4 运算性质
- 结合律:(AB)C=A(BC)(前提是各乘积有意义)
- 分配律:
- A(B+C)=AB+AC
- (A+B)C=AC+BC
- 数乘结合:k(AB)=(kA)B=A(kB)
- 不满足交换律:一般 AB=BA,甚至可能 BA 无定义
- 消去律不成立:由 AB=AC 不能推出 B=C(除非 A 可逆)
3.5 几何意义
3.5.1. 与线性变换的联系(关键)
1) 任何线性变换(在有限维向量空间中)都可以用一个矩阵来表示。
这是因为: 一旦我们确定了一组基(如坐标系的 î, ĵ),那么变换矩阵的列,就是基向量变换后的坐标。
例子(二维):
假设在标准坐标系中,
线性变换 T 将
i^=[10]
变成 [ac],
将
j^=[01]
变成 [bd]。
- 原理:线性变换有两个关键性质:
- 加法性:T(u+v)=T(u)+T(v)
- 齐次性(数乘):T(cv)=cT(v)
- 推导:任意向量 x=[x1x2] 都可以写成基向量的线性组合:
x=x1i^+x2j^
当我们对 x 进行变换 T 时:
T(x)=T(x1i^+x2j^)=x1T(i^)+x2T(j^)(利用线性性质)
既然 T(i^) 变成了 [ac],T(j^) 变成了 [bd],那么:
T(x)=x1[ac]+x2[bd]=[ax1+bx2cx1+dx2]
这正好就是矩阵乘法 Ax 的定义结果,所以说矩阵乘法就是计算线性变换作用于向量的结果,由此引入表达式说明矩阵和线性变换几何关系。
考虑表达式 y=Ax(线性方程组),这不仅是代数运算,更是一个几何过程:
- 向量 x 是输入;
- 矩阵 A 是变换规则;
- 向量 y 是输出(即变换后的结果)。
🔍 从“列空间”的角度看:
Ax 实际上是矩阵 A 的列向量以 x 的分量为系数进行线性组合的结果。
所以,矩阵乘法的本质是将输入向量“重新组合”到由矩阵列向量张成的新空间中 。
也即:矩阵乘法 Ax 可以看作是矩阵 A 的列向量的线性组合。
x1a11a21⋮+x2a12a22⋮+⋯+xna1namn⋮=b1b2⋮
3.5.2 复合变换与矩阵乘法的联系
1) 核心公式
当多个线性变换连续发生(复合变换)时,比如先做变换 B,再做变换 A,整体效果记作 A∘B。
- 先执行变换 B(对应矩阵 B)
- 后执行变换 A(对应矩阵 A)
整体效果=A∘B⟺矩阵=AB
- 运算顺序:向量 x 先被 B 作用,变成 Bx;然后结果再被 A 作用,变成 A(Bx)。
- 结合律:根据矩阵乘法结合律,A(Bx)=(AB)x。
- 矩阵乘法满足结合律(AB)C=A(BC),可以从几何角度证明,如果我们用变换相继作用的思想去考虑矩阵乘积,无论你先计算前两个矩阵的乘积 AB,再用结果乘以 C;还是先计算后两个矩阵的乘积BC,再用 A乘以这个结果,根据矩阵乘法的顺序,先右后左,在几何意义上,乘法结合性的左右两边都是将
同样的三个变换用同样的顺序依次作用而已
⚠️ 注意顺序:先作用的变换写在右边:
(A∘B)(x)=A(B(x))=A(Bx)=(AB)x
2) 为什么矩阵乘法不满足交换律? (AB=BA)
矩阵乘法中 AB ≠ BA 的核心原因在于 非交换性,这源于矩阵乘法的定义、维度约束及线性变换的复合特性。以下从运算规则、几何意义、特殊情况展开分析:
1. 运算规则:维度匹配与计算本质
- 维度约束:矩阵乘法要求左侧矩阵的列数等于右侧矩阵的行数。例如:
- 若 A 为 m×n 矩阵,B 为 n×p 矩阵,则 AB 为 m×p 矩阵(维度为 m×p)。
- 但 BA 仅在 B 的列数等于 A 的行数(即 p=m)时有定义,否则无意义。例如:
- A(2×3) 与 B(3×2) 可计算 AB(2×2),但 BA(3×3) 需额外条件(如 p=m)。
- 计算本质:
矩阵乘法的结果是行向量与列向量的点积组合。例如,AB 的第 i 行第 j 列元素为 A 的第 i 行与 B 的第 j 列对应元素乘积之和。这种计算方式导致顺序颠倒后,元素分布可能完全不同。
2. 几何意义:线性变换的复合顺序
- 变换顺序的物理意义:矩阵乘法对应线性变换的复合,顺序不同对应不同的变换路径。例如:
- AB 表示先对空间进行 B 的变换(如旋转),再应用 A 的变换(如平移)。
- BA 则先进行 A 的变换,再应用 B 的变换。两者结果可能截然不同(如先旋转再平移 vs. 先平移再旋转)。
3. 特殊情况:可交换的矩阵类型
尽管绝大多数矩阵不满足交换律,但以下情况例外:
- 单位矩阵与零矩阵:单位矩阵 I 满足 IA=AI=A;零矩阵 O 满足 OA=AO=O。
- 对角矩阵:同阶对角矩阵相乘可交换,结果仍为对角矩阵(元素为对应位置元素的乘积)。
- 可逆矩阵与自身逆矩阵:若 A 可逆,则 AA−1=A−1A=I。
- 数量矩阵(主对角线元素均相同的对角矩阵):与任意同阶方阵可交换。
3) 矩阵乘法的本质
矩阵乘法 AB 的本质,就是用矩阵 A 去变换矩阵 B 的每一列。
- B 的列向量 b1,b2 代表了“基向量经过 B 变换后的新位置”。
- A 的作用是将这些“中间位置”再次搬运。
- 所以,AB 的第 j 列 = A×( B 的第 j 列 )。
AB=∣Ab1∣∣Ab2∣
假设:
A=[a11a21a12a22],b1=[b11b21], b2=[b12b22]
计算 Ab1 的结果是一个新的向量(也就是 AB 的第一列):
Ab1=[a11a21a12a22][b11b21]=[a11b11+a12b21a21b11+a22b21]
计算 Ab2 的结果是一个新的向量(也就是 AB 的第二列):
Ab2=[a11a21a12a22][b12b22]=[a11b12+a12b22a21b12+a22b22]
这直接证明了:复合矩阵的列,就是原始基向量经过层层变换后的最终坐标。
4) 行列式的几何意义(面积的连乘)
对于复合变换,面积(或体积)的缩放比例也是相乘的:
det(AB)=det(A)⋅det(B)
- 几何解释:
- B 先把空间面积扩大了 det(B) 倍。
- A 接着在这个基础上,又把面积扩大了 det(A) 倍。
- 总的扩大倍数自然是两者的乘积。
这也验证了复合变换的连贯性。
4.矩阵的转置
4.1 定义
设 A=(aij)m×n,则 A 的转置 AT 是一个 n×m 矩阵,其元素为:
(AT)ij=aji
即把矩阵的行与列互换。
4.2 示例
A=(142536)2×3,AT=1234563×2
4.3 运算性质
- 双重转置:(AT)T=A
- 加法:(A+B)T=AT+BT
- 数乘:(kA)T=kAT
- 乘法:(AB)T=BTAT(注意顺序反转)
- 可逆性:若 A 可逆,则 (AT)−1=(A−1)T
4.4 特殊矩阵类型
- 对称矩阵:AT=A(必须是方阵)
- 反对称矩阵:AT=−A
5.方阵的行列式
5.1 定义
行列式是一个将 n 阶方阵映射到一个标量的函数,记作 det(A) 或 ∣A∣。它反映了矩阵所代表的线性变换的体积缩放因子。
5.2 低阶计算公式
- 一阶:det(a)=a
- 二阶:det(acbd)=ad−bc
- 三阶(对角线法则):
deta11a21a31a12a22a32a13a23a33=a11a22a33+a12a23a31+a13a21a32−a13a22a31−a11a23a32−a12a21a33
5.3 一般定义(递归)
按第一行展开(拉普拉斯展开):
det(A)=j=1∑n(−1)1+ja1jM1j
其中 Mij 是 A 去掉第 i 行第 j 列后得到的子式。
5.4 运算性质
- 单位矩阵:det(In)=1
- 转置:det(AT)=det(A)
- 数乘:det(kA)=kndet(A)
- 乘法:det(AB)=det(A)det(B)(重要性质)
- 可逆条件:A 可逆 ⟺ det(A)=0
- 行(列)交换:交换两行(或两列),行列式变号
- 行(列)线性:若某行(列)是两向量之和,行列式可拆分;某行(列)乘 k,行列式乘 k
5.5 几何意义
- 二阶行列式的绝对值等于以列向量为边的平行四边形的面积
- 三阶行列式的绝对值等于以列向量为棱的平行六面体的体积
- 符号表示定向(右手系为正)
6.伴随矩阵
6.1 定义
设 A=(aij)n×n,首先定义:
- 余子式 Mij:删除 A 的第 i 行和第 j 列后得到的 (n−1) 阶子式的行列式
- 代数余子式 Aij=(−1)i+jMij
则 A 的伴随矩阵(又称伴随阵、伴随)adj(A) 定义为:
adj(A)=(Aji)n×n=A11A12⋮A1nA21A22⋮A2n⋯⋯⋯An1An2⋮Ann
注意:伴随矩阵是代数余子式矩阵的转置。
6.2 示例(二阶)
A=(acbd)
- 代数余子式:A11=d,A12=−c,A21=−b,A22=a
- 代数余子式矩阵:(d−b−ca)
- 伴随矩阵(转置):adj(A)=(d−c−ba)
6.3 核心性质:逆矩阵公式
A⋅adj(A)=adj(A)⋅A=det(A)⋅In
当 det(A)=0 时,
A−1=det(A)1adj(A)
验证:
对于二阶矩阵:
A⋅adj(A)=(acbd)(d−c−ba)=(ad−bc00ad−bc)=det(A)I2
因此
A−1=ad−bc1(d−c−ba)
这与熟悉的二阶求逆公式一致。
6.4 核心公式:为什么 AA∗=∣A∣E
我们直接算 矩阵乘法 AA∗。
设
AA∗=C=(cij)
按矩阵乘法定义:
cij=k=1∑naikAkj∗
而 A∗ 是转置过的,所以:
Akj∗=Ajk
于是:
cij=k=1∑naikAjk
分两种情况:
① 当 i=j
cii=k=1∑naikAik
这就是 行列式按第 i 行展开:
k=1∑naikAik=∣A∣
所以:
cii=∣A∣
② 当 i=j
cij=k=1∑naikAjk
这等于:
把第 i 行的数,按第 j 行展开
👉 行列式有两行相同,值为 0:
合起来看 AA∗
AA∗=∣A∣0⋮00∣A∣⋮0………00⋮∣A∣=∣A∣E
同理:A∗A=∣A∣E
把刚才的逻辑按列展开,一模一样:
- 对角线上:行列式按列展开 = ∣A∣
- 非对角线:不同列混合展开 = 0
所以:
A∗A=∣A∣E
6.5 用途与局限
- 理论用途:给出逆矩阵的显式表达式,用于证明定理
- 数值计算局限:计算 n 阶伴随矩阵需要计算 n2 个 (n−1) 阶行列式,复杂度高达 O(n!⋅n2),实际中不用于数值求逆(改用高斯消元或分解方法)
- 特殊情形:当 det(A)=0 时,adj(A)=det(A)A−1;当 det(A)=0 时,伴随矩阵仍有定义,但不对应逆矩阵
7.总结对照表
| 运算 | 定义要点 | 核心性质 | 应用场景 |
|---|
| 加法 | 对应元素相加 | 交换、结合、零元、负元 | 矩阵组合、误差叠加 |
| 数乘 | 每个元素乘标量 | 分配、结合 | 缩放变换、线性组合 |
| 乘法 | 行乘列求和 | 结合、分配、不交换 | 线性变换复合、方程组 |
| 转置 | 行列互换 | (AB)T=BTAT | 对称性、内积表达 |
| 行列式 | 体积缩放因子 | det(AB)=det(A)det(B) | 可逆判断、特征值积 |
| 伴随 | 代数余子式转置 | Aadj(A)=det(A)I | 理论求逆、克莱姆法则 |
8.对角矩阵和单位矩阵
8.1 对角矩阵(Diagonal Matrix)
8.1.1.定义
对角矩阵(Diagonal Matrix)是一个方阵,其非对角线上的元素全为 0,即:
D=d10⋮00d2⋮0⋯⋯⋱⋯00⋮dn
记作 D=diag(d1,d2,…,dn)。
- 必须是方阵(行数=列数)
- 非对角线元素 全为 0
- 对角线上可以是 0、正数、负数、小数
8.1.2 简单记
只有对角线有数字,其他全是空的。
特殊:
8.1.3 运算性质
对角矩阵的运算非常简洁:
加法:
diag(a1,…,an)+diag(b1,…,bn)=diag(a1+b1,…,an+bn)
数乘:
k⋅diag(a1,…,an)=diag(ka1,…,kan)
乘法:
diag(a1,…,an)⋅diag(b1,…,bn)=diag(a1b1,…,anbn)
两个对角矩阵相乘时,交换律成立:D1D2=D2D1
幂运算:
[diag(d1,…,dn)]k=diag(d1k,…,dnk)
可逆性:
当所有 di=0 时,
[diag(d1,…,dn)]−1=diag(d1−1,…,dn−1)
8.1.4 几何意义
对角矩阵 D=diag(λ1,…,λn) 左乘一个向量 x=(x1,…,xn)T:
Dx=λ1x1λ2x2⋮λnxn
即沿各坐标轴方向独立缩放:第 i 个坐标被缩放 λi 倍。
8.2 单位矩阵(Identity Matrix)
8.2.1 定义
对角线上全是 1,其余全是 0 的对角矩阵,记作 E 或 I。
比如 2 阶、3 阶单位矩阵:
E2=(1001),E3=100010001
8.2.2 一句话记
单位矩阵 = 特殊的对角矩阵,对角线上全是 1。
8.2.3 核心性质
乘法单位元:对任意矩阵 A,
- 若 A 是 m×n 矩阵,则 ImA=A,AIn=A
幂等性:Ik=I
可逆性:I−1=I
转置:IT=I
行列式:det(I)=1
8.2.4 几何意义
单位矩阵对应恒等变换:Ix=x,保持向量不变。
8.3 单位矩阵有什么用?(超级重要)
8.3.1 矩阵里的“1”
数字里:1⋅a=a
矩阵里:
AE=A,EA=A
乘单位矩阵,矩阵不变。
8.3.2 求逆矩阵的核心
A−1A=AA−1=E
逆矩阵就是“乘完变单位矩阵”。
8.3.3 伴随矩阵公式里必须出现
AA∗=A∗A=∣A∣E
右边一定是 ∣A∣ 乘单位矩阵。
8.3.4 解矩阵方程
比如:
AX=B⇒X=A−1B
本质就是利用 A−1A=E。
8.4 对角矩阵有什么用?(计算神器)
8.4.1 乘法特别简单
两个同阶对角矩阵相乘:
只需要对角线上元素相乘。
(a00b)(c00d)=(ac00bd)
8.4.2 幂运算超级简单
(λ00μ)n=(λn00μn)
对角线上直接 n 次方。
8.4.3 行列式超好算
对角矩阵的行列式 = 对角线元素乘积
a000b000c=abc
8.4.4 线性代数的“标准型”
矩阵相似对角化后:
所有矩阵都想变成对角矩阵,因为它最简单。
8.5 一句话总结(必背)
- 单位矩阵:对角全 1,其余 0,是矩阵里的 1。
- 对角矩阵:只有对角线有数字,其余 0,是最简单、最好算的矩阵。
- 关系:单位矩阵 是特殊的对角矩阵。
- 用途:
- 单位矩阵:求逆、公式、解方程都离不开
- 对角矩阵:算乘法、幂、行列式飞快,是线性代数的“最简形态”
9.参考文献
本文参考AI回答,豆包,Deepseek,千问