第四章相似矩阵-2.特征值与特征向量

4 阅读1分钟

一、直观理解:什么是特征值、特征向量?

AA 是一个 nn方阵

对向量 x\boldsymbol{x} 做线性变换 AxA\boldsymbol{x},一般情况下:

  • 向量会旋转
  • 向量会伸缩
  • 方向一般会变

但有一些特殊向量,被 AA 作用后只伸缩、不旋转,方向保持不变(或反向)。 这些特殊向量就是特征向量,伸缩的倍数就是特征值


二、严格数学定义

AAnn 阶方阵,如果存在λ\lambda非零向量 x\boldsymbol{x},使得:

Ax=λxA\boldsymbol{x}=\lambda \boldsymbol{x}

就称:

  • λ\lambda 为矩阵 AA特征值
  • x\boldsymbol{x} 为矩阵 AA 对应于特征值 λ\lambda特征向量

注意:

  1. x\boldsymbol{x} 必须非零
  2. 只有方阵才有特征值/特征向量

三、特征方程与特征多项式(求特征值的核心)

把定义式移项:

Axλx=0A\boldsymbol{x}-\lambda \boldsymbol{x}=\boldsymbol{0}
(AλI)x=0(A-\lambda I)\boldsymbol{x}=\boldsymbol{0}

这是一个齐次线性方程组。 它要有非零解的充要条件是:

det(AλI)=0\det(A-\lambda I)=0
  • I是单位矩阵

这个方程就叫:

  • 特征方程 左边的多项式 λIA|\lambda I - A| 叫:
  • 特征多项式

步骤总结(求特征值)

  1. 构造矩阵 AλIA-\lambda I
  2. 求行列式 det(AλI)=0\det(A-\lambda I)=0
  3. 解这个关于 λ\lambda 的方程,得到所有特征值

四、求特征向量

对每个特征值 λi\lambda_i,解齐次方程组:

(AλiI)x=0(A-\lambda_i I)\boldsymbol{x}=\boldsymbol{0}

它的非零解就是对应 λi\lambda_i全部特征向量

基础解系的线性组合(不全为0)就是所有特征向量。


五、几何意义(非常关键)

  • AA 代表一个线性变换(旋转、拉伸、剪切)
  • 特征向量 x\boldsymbol{x}:变换下方向不变的向量
  • 特征值 λ\lambda:对该方向的伸缩因子
    • λ>1\lambda>1:拉长
    • 0<λ<10<\lambda<1:缩短
    • λ<0\lambda<0:反向拉伸
    • λ=0\lambda=0:压缩到零向量(该方向被压扁)

六、一个完整小例子(2阶方阵)

A=(2112)A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} 的特征值与特征向量

解:

  1. 特征方程:
2λ112λ=(2λ)21=λ24λ+3=0\begin{vmatrix} 2-\lambda & 1 \\ 1 & 2-\lambda \end{vmatrix} = (2-\lambda)^2 - 1 = \lambda^2 - 4\lambda + 3 = 0

λ1=3,λ2=1\lambda_1 = 3, \lambda_2 = 1

  1. λ1=3\lambda_1 = 3 的特征向量:
(A3E)α=(1111)(x1x2)=0(A - 3E)\alpha = \begin{pmatrix} -1 & 1 \\ 1 & -1 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} = 0

x1=x2x_1 = x_2,基础解系 (11)\begin{pmatrix} 1 \\ 1 \end{pmatrix},特征向量为 k(11),k0k\begin{pmatrix} 1 \\ 1 \end{pmatrix}, k \neq 0

  1. λ2=1\lambda_2 = 1 的特征向量:
(AE)α=(1111)(x1x2)=0(A - E)\alpha = \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} = 0

x1=x2x_1 = -x_2,基础解系 (11)\begin{pmatrix} 1 \\ -1 \end{pmatrix},特征向量为 k(11),k0k\begin{pmatrix} 1 \\ -1 \end{pmatrix}, k \neq 0

七、重要性质(考试/应用必背)

AAnn 阶方阵,特征值 λ1,,λn\lambda_1,\dots,\lambda_n

7.1 基本性质

  1. 迹与行列式
  • 迹是方阵主对角线元素之和
    • tr(A)=λ1+λ2++λn\text{tr}(A) = \lambda_1 + \lambda_2 + \cdots + \lambda_n(迹=特征值之和)
    • det(A)=λ1λ2λn\det(A) = \lambda_1 \lambda_2 \cdots \lambda_n(积=行列式)
  1. 转置AAATA^T 有相同的特征值

  2. 逆矩阵:若 AA 可逆,λ0\lambda \neq 0,则 A1A^{-1} 的特征值为 1/λ1/\lambda,特征向量相同

  3. 幂运算AkA^k 的特征值为 λk\lambda^k,特征向量相同

  4. 多项式f(A)f(A) 的特征值为 f(λ)f(\lambda),特征向量相同

7.2 不同特征值对应的特征向量

定理:属于不同特征值的特征向量线性无关

推论:若 nn 阶方阵有 nn 个互异特征值,则必有 nn 个线性无关的特征向量

7.3 代数重数与几何重数

  • 代数重数:特征值作为特征多项式根的重数
  • 几何重数:对应特征值 λ\lambda 的特征子空间的维数,即 (AλE)x=0(A-\lambda E)x=0 的基础解系中向量个数

关系1几何重数代数重数1 \leq \text{几何重数} \leq \text{代数重数}

八、特殊方阵的特征值

8.1 实对称矩阵

  • 特征值都是实数
  • 不同特征值对应的特征向量正交
  • 必可正交对角化

8.2 正交矩阵 QT=Q1Q^T = Q^{-1}

  • 特征值的模长为 1(即 λ=1|\lambda|=1
  • 实特征值只能是 1 或 -1

8.3 幂等矩阵 A2=AA^2 = A

  • 特征值只能是 0 或 1

8.4 幂零矩阵 Ak=0A^k = 0

  • 所有特征值均为 0

8.5 上/下三角矩阵

  • 特征值即对角线元素

九、应用

9.1 矩阵对角化

AAnn 个线性无关的特征向量,则存在可逆矩阵 PP 使:

P1AP=Λ=diag(λ1,λ2,,λn)P^{-1}AP = \Lambda = \text{diag}(\lambda_1, \lambda_2, \dots, \lambda_n)

9.2 微分方程组

dxdt=Ax\frac{d\mathbf{x}}{dt} = A\mathbf{x} 时,特征值决定系统稳定性


十、一句话总结

  • 特征向量:变换中方向不变的向量
  • 特征值:该方向上的伸缩倍数
  • 求法:行列式=0 求 λ\lambda → 解齐次方程求 x\boldsymbol{x}