专题一:线性代数基础--矩阵(二)

3,005 阅读2分钟

一、矩阵乘法的定义与计算规则

1.1 矩阵乘法的计算规则(附详细推导)

设矩阵 ​​A​​ 是 m×n 矩阵,矩阵 ​​B​​ 是 n×p 矩阵,则乘积 ​​C = AB​​ 是 m×p 矩阵。其元素计算规则为:

cij=k=1naikbkj(1im,1jp)c_{ij} = \sum_{k=1}^{n} a_{ik}b_{kj} \quad (1 \leq i \leq m, 1 \leq j \leq p)

​推导过程​​:
矩阵乘法本质是行与列的点积。以计算 c11c_{11} 为例:

c11=a11b11+a12b21++a1nbn1c_{11} = a_{11}b_{11} + a_{12}b_{21} + \cdots + a_{1n}b_{n1}

​示例​​:

A=[1234], B=[5678]A = \begin{bmatrix} \color{red}{1} & \color{blue}{2} \\ 3 & 4 \end{bmatrix},\ B = \begin{bmatrix} \color{red}{5} & 6 \\ \color{blue}{7} & 8 \end{bmatrix}

计算 ABAB 的第一行第一列元素:

c11=1×5+2×7=5+14=19c_{11} = \color{red}{1×5} + \color{blue}{2×7} = 5 + 14 = 19

完整结果:

AB=[19224350]AB = \begin{bmatrix} 19 & 22 \\ 43 & 50 \end{bmatrix}

二、矩阵作为线性变换的几何意义

2.1 线性变换的严格定义

一个变换 T:RnRmT: \mathbb{R}^n \to \mathbb{R}^m 是线性的,当且仅当满足:

  1. ​可加性​​:T(u+v)=T(u)+T(v)T(\mathbf{u} + \mathbf{v}) = T(\mathbf{u}) + T(\mathbf{v})
  2. ​齐次性​​:T(ku)=kT(u)T(k\mathbf{u}) = kT(\mathbf{u})

​几何解释​​:

  • 直线变换后仍为直线
  • 原点保持固定(T(0)=0T(\mathbf{0}) = \mathbf{0}
  • 平行四边形网格保持平行

2.2 基向量的追踪法(可视化核心)

任何 2×2 矩阵 [abcd]\begin{bmatrix} a & b \\ c & d \end{bmatrix} 可视为:

  • 第一列 [ac]\begin{bmatrix} a \\ c \end{bmatrix} 是原基向量 i=(1,0)\mathbf{i} = (1,0) 变换后的位置
  • 第二列 [bd]\begin{bmatrix} b \\ d \end{bmatrix} 是原基向量 j=(0,1)\mathbf{j} = (0,1) 变换后的位置

​动态示例​​:
矩阵 M=[1112]M = \begin{bmatrix} 1 & 1 \\ -1 & 2 \end{bmatrix} 的变换效果:

  • i\mathbf{i} 从 (1,0) 移动到 (1,-1)
  • j\mathbf{j} 从 (0,1) 移动到 (1,2)
  • 坐标网格被拉伸并旋转

三、典型线性变换的矩阵表示

3.1 旋转变换(推导过程)

旋转角度 θ\theta 的变换矩阵:

R(θ)=[cosθsinθsinθcosθ]R(\theta) = \begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix}

​推导​​:
设原基向量 i=(1,0)\mathbf{i}=(1,0) 旋转后为 (cosθ,sinθ)(\cos\theta, \sin\theta)j=(0,1)\mathbf{j}=(0,1) 旋转后为 (sinθ,cosθ)(-\sin\theta, \cos\theta)

​示例​​:
旋转 9090^\circ 的矩阵:

R(90)=[0110]R(90^\circ) = \begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}

(2,3)(2,3) 变换后坐标计算:

[0110][23]=[32]\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix} \begin{bmatrix} 2 \\ 3 \end{bmatrix} = \begin{bmatrix} -3 \\ 2 \end{bmatrix}

3.2 缩放变换(几何意义与计算)

缩放系数 kx,kyk_x, k_y 的变换矩阵:

S(kx,ky)=[kx00ky]S(k_x, k_y) = \begin{bmatrix} k_x & 0 \\ 0 & k_y \end{bmatrix}

​几何解释​​:

  • 沿x轴缩放 kxk_x 倍,沿y轴缩放 kyk_y
  • kx=kyk_x = k_y 时为均匀缩放

​示例​​:
放大2倍x轴,缩小0.5倍y轴:

S(2,0.5)=[2000.5]S(2, 0.5) = \begin{bmatrix} 2 & 0 \\ 0 & 0.5 \end{bmatrix}

(1,4)(1,4) 变换后:

[2000.5][14]=[22]\begin{bmatrix} 2 & 0 \\ 0 & 0.5 \end{bmatrix} \begin{bmatrix} 1 \\ 4 \end{bmatrix} = \begin{bmatrix} 2 \\ 2 \end{bmatrix}

3.3 剪切变换(数学推导与可视化)

沿x轴剪切角度 ϕ\phi 的变换矩阵:

H(ϕ)=[1tanϕ01]H(\phi) = \begin{bmatrix} 1 & \tan\phi \\ 0 & 1 \end{bmatrix}

​推导​​:
剪切变换保持y坐标不变,x坐标按y值的比例偏移。设原点为(x,y)(x,y),剪切后坐标为:

{x=x+ytanϕy=y\begin{cases} x' = x + y \tan\phi \\ y' = y \end{cases}

​几何解释​​:

  • 垂直方向无压缩
  • 水平方向偏移量由y坐标决定

​示例​​:
剪切角 4545^\circtan45=1\tan45^\circ=1):

H(45)=[1101]H(45^\circ) = \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix}

(0,1)(0,1) 变换为:

[1101][01]=[11]\begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix} \begin{bmatrix} 0 \\ 1 \end{bmatrix} = \begin{bmatrix} 1 \\ 1 \end{bmatrix}

四、复合变换与矩阵乘法顺序

4.1 复合变换的数学本质

连续应用变换 ​​A​​ 和 ​​B​​ 时,复合变换为 T=BAT = BA(从右向左执行)

​推导​​:
对任意向量 v\mathbf{v}

T(v)=B(Av)=(BA)vT(\mathbf{v}) = B(A\mathbf{v}) = (BA)\mathbf{v}

​分步计算示例​​:
先旋转 9090^\circ 后剪切:

H(45)R(90)=[1101][0110]H(45^\circ)R(90^\circ) = \begin{bmatrix}1 &1\\0 &1\end{bmatrix}\begin{bmatrix}0 &-1\\1 &0\end{bmatrix}
第一行第一列:(1×0)+(1×1)=1第一行第二列:(1×1)+(1×0)=1第二行第一列:(0×0)+(1×1)=1第二行第二列:(0×1)+(1×0)=0\begin{aligned} \text{第一行第一列} &: (1 \times 0) + (1 \times 1) = 1 \\ \text{第一行第二列} &: (1 \times -1) + (1 \times 0) = -1 \\ \text{第二行第一列} &: (0 \times 0) + (1 \times 1) = 1 \\ \text{第二行第二列} &: (0 \times -1) + (1 \times 0) = 0 \\ \end{aligned}
[1110]\Rightarrow \begin{bmatrix}1 &-1\\1 &0\end{bmatrix}

4.2 非交换性的直观展示

​对比两种顺序的复合变换​​:

  • ​先旋转后剪切​​:
[1110]\begin{bmatrix}1 &-1\\1 &0\end{bmatrix}
  • ​先剪切后旋转​​:
[0110][1101]=[(0×1)+(1×0)(0×1)+(1×1)(1×1)+(0×0)(1×1)+(0×1)]=[0111]\begin{aligned} \begin{bmatrix}0 &-1\\1 &0\end{bmatrix}\begin{bmatrix}1 &1\\0 &1\end{bmatrix} &= \begin{bmatrix} (0 \times 1) + (-1 \times 0) & (0 \times 1) + (-1 \times 1) \\ (1 \times 1) + (0 \times 0) & (1 \times 1) + (0 \times 1) \end{bmatrix} \\ &= \begin{bmatrix}0 &-1\\1 &1\end{bmatrix} \end{aligned}

​几何解释​​:

  • 先旋转后剪切:坐标系先旋转90度,再向右上方拉伸
  • 先剪切后旋转:坐标系先产生斜向拉伸,再整体旋转

五、重要几何性质

5.1 行列式的几何意义

矩阵的行列式 det(M)\det(M) 表示:

  • ​面积缩放因子​​:若 det(M)=2\det(M)=2,则区域面积扩大2倍
  • ​方向性​​:负行列式表示包含镜像翻转

​计算示例​​:
剪切矩阵 H(45)H(45^\circ) 的行列式:

det[1101]=(1×1)(0×1)=1\det\begin{bmatrix}1 &1\\0 &1\end{bmatrix} = (1 \times 1) - (0 \times 1) = 1
说明剪切变换不改变面积大小\text{说明剪切变换不改变面积大小}

5.2 矩阵的秩与空间维度

  • ​满秩矩阵(秩=2)​​:保持二维平面结构(如旋转矩阵)
  • ​秩1矩阵​​(如[1100]\begin{bmatrix}1 &1\\0 &0\end{bmatrix}):将平面压缩到直线
  • ​秩0矩阵​​(全零矩阵):将所有点映射到原点

​秩的几何验证​​:
对矩阵 [2412]\begin{bmatrix}2 &4\\1 &2\end{bmatrix}

  1. 计算行列式:
det=(2×2)(1×4)=0\det = (2 \times 2) - (1 \times 4) = 0
  1. 说明秩为1
  2. 几何效果:
将平面压缩到直线 y=0.5x\text{将平面压缩到直线 } y=0.5x