一、直观理解:什么是特征值、特征向量?
设 A 是一个 n 阶方阵。
对向量 x 做线性变换 Ax,一般情况下:
但有一些特殊向量,被 A 作用后只伸缩、不旋转,方向保持不变(或反向)。
这些特殊向量就是特征向量,伸缩的倍数就是特征值。
二、严格数学定义
设 A 是 n 阶方阵,如果存在数 λ 和 非零向量 x,使得:
Ax=λx
就称:
- λ 为矩阵 A 的特征值
- x 为矩阵 A 对应于特征值 λ 的特征向量
注意:
- x 必须非零
- 只有方阵才有特征值/特征向量
三、特征方程与特征多项式(求特征值的核心)
把定义式移项:
Ax−λx=0
(A−λI)x=0
这是一个齐次线性方程组。
它要有非零解的充要条件是:
det(A−λI)=0
这个方程就叫:
- 特征方程
左边的多项式 ∣λI−A∣ 叫:
- 特征多项式
步骤总结(求特征值)
- 构造矩阵 A−λI
- 求行列式 det(A−λI)=0
- 解这个关于 λ 的方程,得到所有特征值
四、求特征向量
对每个特征值 λi,解齐次方程组:
(A−λiI)x=0
它的非零解就是对应 λi 的全部特征向量。
基础解系的线性组合(不全为0)就是所有特征向量。
五、几何意义(非常关键)
- A 代表一个线性变换(旋转、拉伸、剪切)
- 特征向量 x:变换下方向不变的向量
- 特征值 λ:对该方向的伸缩因子
- λ>1:拉长
- 0<λ<1:缩短
- λ<0:反向拉伸
- λ=0:压缩到零向量(该方向被压扁)
六、一个完整小例子(2阶方阵)
求 A=(2112) 的特征值与特征向量
解:
- 特征方程:
2−λ112−λ=(2−λ)2−1=λ2−4λ+3=0
得 λ1=3,λ2=1
- 求 λ1=3 的特征向量:
(A−3E)α=(−111−1)(x1x2)=0
得 x1=x2,基础解系 (11),特征向量为 k(11),k=0
- 求 λ2=1 的特征向量:
(A−E)α=(1111)(x1x2)=0
得 x1=−x2,基础解系 (1−1),特征向量为 k(1−1),k=0
七、重要性质(考试/应用必背)
设 A 为 n 阶方阵,特征值 λ1,…,λn
7.1 基本性质
- 迹与行列式:
- 迹是方阵主对角线元素之和。
- tr(A)=λ1+λ2+⋯+λn(迹=特征值之和)
- det(A)=λ1λ2⋯λn(积=行列式)
-
转置:A 与 AT 有相同的特征值
-
逆矩阵:若 A 可逆,λ=0,则 A−1 的特征值为 1/λ,特征向量相同
-
幂运算:Ak 的特征值为 λk,特征向量相同
-
多项式:f(A) 的特征值为 f(λ),特征向量相同
7.2 不同特征值对应的特征向量
定理:属于不同特征值的特征向量线性无关
推论:若 n 阶方阵有 n 个互异特征值,则必有 n 个线性无关的特征向量
7.3 代数重数与几何重数
- 代数重数:特征值作为特征多项式根的重数
- 几何重数:对应特征值 λ 的特征子空间的维数,即 (A−λE)x=0 的基础解系中向量个数
关系:1≤几何重数≤代数重数
八、特殊方阵的特征值
8.1 实对称矩阵
- 特征值都是实数
- 不同特征值对应的特征向量正交
- 必可正交对角化
8.2 正交矩阵 QT=Q−1
- 特征值的模长为 1(即 ∣λ∣=1)
- 实特征值只能是 1 或 -1
8.3 幂等矩阵 A2=A
8.4 幂零矩阵 Ak=0
8.5 上/下三角矩阵
九、应用
9.1 矩阵对角化
若 A 有 n 个线性无关的特征向量,则存在可逆矩阵 P 使:
P−1AP=Λ=diag(λ1,λ2,…,λn)
9.2 微分方程组
解 dtdx=Ax 时,特征值决定系统稳定性
十、一句话总结
- 特征向量:变换中方向不变的向量
- 特征值:该方向上的伸缩倍数
- 求法:行列式=0 求 λ → 解齐次方程求 x