3 相似标准型

410 阅读8分钟

相似标准型

特征值与特征向量

Aη=ληA\eta = \lambda \eta(λIA)η=θ(\lambda I - A)\eta=\theta 有非0解。因此λIA=0|\lambda I - A| = 0

线性变换的特征向量就是他的矩阵的特征向量。

定理:相似矩阵的特征多项式相同。

B=P1APλIA=λIBB = P^{-1}AP \Rightarrow |\lambda I-A| = |\lambda I - B|

证明:λIB=P1(λI)PP1AP=P1(λIA)P=PP1λIA|\lambda I - B| = |P^{-1}(\lambda I)P - P^{-1}AP| = |P^{-1}(\lambda I - A)P|=|P||P^{-1}||\lambda I - A|

有这个定理,就不用担心线性变换因为基不同导致矩阵不同,进而导致特征多项式不同。一定都是一样的。

相似对角化的基本方法

求特征值和特征向量,把特征向量排起来构成PP,然后Λ=P1AP\Lambda=P^{-1}APΛ\Lambda是特征值排列的对角阵,排列顺序和P对应。

可以看出,可对角化的前提是PP是可逆的,即各种特征向量的相关性需要保证。

特征多项式的计算

子式:对矩阵任取k行k列形成行列式

计算秩

顺序主子式:左上角的子式

判断正定性

主子式:行任选,列和行标号一致

特征多项式的系数恰好是bj=(1)j(Aj阶主子式)b_j = (-1)^j\sum (A的j阶主子式) λIA=λn+b1λn1+...+bn|\lambda I - A| = \lambda^n + b_1 \lambda^{n-1} + ... + b_n

此计算方法的一个应用,A=αβHA=\alpha \beta^H,则AA的特征多项式为λn1(λα,β)\lambda^{n-1}(\lambda - \langle \alpha, \beta\rangle)
注意 tr(A)=βHαtr(A)=\beta^H\alpha

特别的:b1=tr(A)b_1 = tr(A)

特征值的性质 重要

tr(A)tr(A)是特征值之和。A|A|是特征值之积

推论:相似矩阵的tr相同、行列式相同

另一种计算方法:化0多项式

f(x)f(x)是多项式。若f(A)=Of(A)=O,则AA的特征值都是f(x)=0f(x)=0的根。

如果很容易的找到A的特征多项式,并且多项式比较好计算根,那立刻就得到了一些可能的特征值。并且A的特征值不会超过这些根的范围。

化0多项式一定存在(Hamilton-Cayley定理) 至少,特征多项式是一个化0多项式。

这个证明是很复杂的,并不是直接带进去算,因为你的特征多项式的输出是一个O矩阵,但行列式输出的是一个数字,所以肯定不能直接带。

Schur引理:对ACn×n\forall A \in C^{n \times n},存在酉矩阵,使得UHAUU^HAU是上三角矩阵。

eg A=[3435]A = \begin{bmatrix} -3 & 4 \\ -3 & 5\end{bmatrix},求A1000A^{1000} 传统方法,相似对角化,消除中间的矩阵。
高级解法:先找特征多项式C(λ)=λIA=(λ3)(λ+1)C(\lambda)=|\lambda I - A| = (\lambda-3)(\lambda+1)
接下来考虑λ1000=C(λ)q(λ)+aλ+b\lambda^{1000} = C(\lambda)q(\lambda) + a\lambda + b
这就是多项式除法,除数是C(λ)C(\lambda)余数是次数比C(λ)C(\lambda)次数低的多项式。
由HC定理,特征多项式是矩阵的化0多项式,所以前面的项就是0,关键是后面的余式的a,ba,b
a,ba,b的方法是把特征值的值3和-1带入,因为C(λ)C(\lambda)在取特征值的时候为0,所以前面也消掉了,就可以求出a,ba, b
然后把原式中λ\lambda替换成AA即可。
Q1:有重根怎么办?方程数量比待定系数的数量少,解不出所有系数?
A1:对两边求导,然后带入重根,因为重根是高次的,求导后C(λ)C'(\lambda)还是0,依然不需要管q(λ)q(\lambda),就又得到了一个方程。
Q2:为什么可以把特征值的式子直接换成矩阵?
A2:从全局看,整个大等式如果移向也是一个矩阵A的化O多项式,那么A的特征值是这个多项式的跟(HC定理),所以矩阵AA的特征值带入成立。
Q3:C(λ)C(\lambda)似乎只需要保证化0就可以了,那么他的次数越低,未知数的数量就越少,就越好解?
A3:是的,所以我们尝试找到次数最低且最高次项系数为1的化0多项式,称为最小多项式。

最小多项式

定义:最高次项系数为1且次数最小的化0多项式。

性质:

  • 最小多项式整除所有化0多项式
  • 最小多项式的根和特征多项式根相同。
  • 最小多项式唯一
  • 相似矩阵拥有相同的最小多项式

计算:
求出特征多项式,从里面挑因子,验证能否化0

可对角化判别方法

特征子空间

定义:Vλ0={ηVf(η)=λ0η}V_{\lambda_0}=\{\eta \in V|f(\eta)=\lambda_0\eta\},其中λ0\lambda_0是特征值。

显然是子空间因为他是Ker(fλ0I)Ker(f-\lambda_0 I),核空间是子空间。

看起来就是λ\lambda的特征向量集合?不对,也包含了0向量

性质:dimVλ0=dimV_{\lambda_0}= 属于该特征值的无关特征向量个数。

判定定理

  • n阶矩阵相似于对角阵\Leftrightarrow AA有n个线性无关的特征向量
  • 属于不同特征值的特征向量线性无关。
  • 每个特征值的线性无关的特征向量合在一起还是线性无关的。
  • 每个特征值的线性无关的特征向量=特征值的重数=dimVλidimV_{\lambda_i}
  • VV是所有特征子空间的直和
  • n阶矩阵相似于对角阵\Leftrightarrow AA的最小多项式无重根。就是Π(λλi)\Pi (\lambda-\lambda_i)

Jordan标准型

如何应对不可对角化的情况?

Jordan块

定义:主对角线元素相等,上方此对角线全是1,其他元素为0

1阶矩阵也看作Jordan块。

有Jordan块组成的分块对角阵为Jordan矩阵。

如果矩阵A和J矩阵相似,则J是A的jordan标准型。

J标准型的存在性和唯一性

存在性:一定存在

唯一性:平凡的不唯一,只要调整Jordan块的排列就能得到新的,这种不考虑的化,那就是唯一的。

重要定理

λ0\lambda_0为A的特征值,则AA的Jordan块中以λ0\lambda_0为主对角元素的k阶Jordan块块数为r(Bk1)2r(Bk)+r(Bk+1)r(B^{k-1})-2r(B^k)+r(B^{k+1}),其中B=Aλ0IB=A-\lambda_0I

重要性质

如果A相似于JJ,则r((A2I)k)=r((J2I)k)r((A-2I)^k)=r((J-2I)^k)

次对角线的便利:高次很容易判断rank

求解方法

首先求出特征多项式的根,按照重数写在对角线上(几重就写几个),之后通过上面的定理,确定每个块的阶数,在此对角线上填相应的1即可。

分块对角阵的最小多项式

两个子块最小多项式的最小公倍式

性质:A的最小多项式中(xλi)(x-\lambda_i)的次数=Jordan标准型λi\lambda_i块的最高阶数

eg 已知矩阵A的特征多项式和最小多项式都是x4x^4,求AAA2A^2的jordan标准型。
解:AA只有1个特征值0,是4重的。所以AA矩阵的Jordan标准型应该是[0?0000?0000?0000]\begin{bmatrix}0 & ? & 0 & 0 \\ 0 & 0 & ? & 0 \\ 0 & 0 & 0 & ? \\ 0 & 0 & 0 & 0 \end{bmatrix}
进一步发现最小多项式0特征值的因子次数为4,所以1特征值的jordan块最高阶就是4,所以整个矩阵相似于一个jordan块,因此
J=[0100001000010000]J=\begin{bmatrix}0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \end{bmatrix}
A2J2=[0010000100000000]A^2 \sim J^2=\begin{bmatrix}0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} 但是要注意,这不是一个jordan标准型,所以要找一下。 对于J2J^2这个矩阵,因为J^2的最小多项式是x2x^2,所以他的特征值还是0。Jordan块最高阶数为2,所以有两个可能性:
J1=[0100000000010000],J2=[0000000000010000]J_1=\begin{bmatrix}0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \end{bmatrix}, J_2=\begin{bmatrix}0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \end{bmatrix} 因为A2A^2我们已经确定他的矩阵了,所以正确答案只有1个,进一步利用r(AλI)k=r(JλI)kr(A-\lambda I)^k=r(J-\lambda I)^k,发现k取1的时候,矩阵的秩为2,所以正确答案是J1J_1

特征值的分布

谱:特征值的集合

模:特征值的绝对值

谱半径:ρ(A)\rho(A) 特征值的最大模

估计方法:两个上界ρ1=max1in{j=1naij},ρ2=max1jn{i=1naij}\rho_1 = \max_{1\le i \le n}\{\sum_{j=1}^n|a_{ij}|\}, \rho_2 = \max_{1\le j \le n}\{\sum_{i=1}^n|a_{ij}|\} 不会超过每一行/列绝对值求和的最大值

盖尔园CiC_i:A的对角线每个元素都有一个盖尔园,圆心为对角线元素在复平面的位置,半径为对角线元素绝对值求和(不包含圆心元素)。

盖尔园系GG:对角线元素的盖尔园求并

性质定理:特征值一定在GG

K-区:n个盖尔园中,有k个相连,但其余n-k个不相交

性质定理:k-区有且仅有k个特征值 推论:盖尔园都不想交,则有n个不相同的特征值

综合题

1. 设n阶方阵A,满足Ak=OA^k=O,证明:A=0,tr(A)=0,A+I=1|A|=0, tr(A)=0, |A+I|=1AOA\ne O,则A不相似于对角阵

Ak=OA^k=O说明xkx^k是A的一个化0不等式。那他的特征值全是0。 tr(A)是特征值之和,所以=0,|A|是特征值之积,所以=0。

第3个略复杂,特征多项式是λn\lambda^n,那么λIA=λn|\lambda I-A|=\lambda^n,所以λI(I+A)=(λ1)IA=(λ1)n|\lambda I - (I+A)|=|(\lambda - 1) I - A|=(\lambda - 1)^n,所以(I+A)(I+A)的特征多项式就求出来了,发现他的特征值全是1,所以行列式为1。

最后一个反证法,假设可以对角,因为特征值全0,那只能是O矩阵,矛盾。

2. 设内积空间的线性变换f(α)=α2α,ωω,ω=1f(\alpha)=\alpha - 2\langle \alpha, \omega \rangle \omega, ||\omega||=1,求f的特征多项式、特征值和特征子空间。

因为ω=1||\omega||=1,所以可以基于次扩充一组标准正交基w1=ω1,w2,w3,...,wnw_1=\omega_1, w_2, w_3, ..., w_n。 找到这一组基下f的矩阵,因为正交,后面内积都是0,所以矩阵A=[10...001...000100001]A=\begin{bmatrix}-1 & 0 &... & 0 \\ 0 & 1 & ... & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1\end{bmatrix}。 所以特征多项式(λ+1)(λ1)n1(\lambda+1)(\lambda-1)^{n-1}。 特征值1、-1,特征子空间就是两组特征向量分别生成的子空间(因为是正交基,肯定线性无关)

3 设矩阵[1234234134121123]\begin{bmatrix}1 & 2 & 3 & 4 \\ 2 & 3 & 4 & 1 \\ 3 & 4 & 1 & 2 \\ 1 & 1 & 2 & 3\end{bmatrix},证明ρ(A)=10\rho(A)=10

首先按照行和、列和的上界,确定了ρ(A)10\rho(A)\le 10,进一步验证10是否是特征值,那只要带入特征多项式=0即可,很简单。

但下面第4题就不那么容易了。

4 设矩阵[1234234134124123]\begin{bmatrix}1 & 2 & 3 & 4 \\ 2 & 3 & 4 & 1 \\ 3 & 4 & 1 & 2 \\ 4 & 1 & 2 & 3\end{bmatrix},证明ρ(A)<10\rho(A)<10

同样还是可以根据上界,确定ρ(A)10\rho(A)\le 10,那只要证明10不是特征值就可以了?不可以!!因为整个取值空间是复平面,不能只判断1个实数,所以老老实实画盖尔园,几何画图发现确实只有10这一个点是半径内和盖尔园有交集的点,再验证10不是特征值。

给定矩阵[221111122]\begin{bmatrix}2 & 2 & -1 \\ -1 & -1 & 1 \\ -1 & -2 & 2\end{bmatrix},求JJPP,使得J=P1APJ=P^{-1}AP

  • step1 求特征值和特征向量 特征值λ=1\lambda=1,特征向量两个α1=(2,1,0)T,α2=(1,0,1)T\alpha_1=(-2,1,0)^T, \alpha_2 = (1,0,1)^T

  • step2 确定Jordan标准型 特征值全1,确定对角线,因为基础解系有两个向量,所以r(AλI)=1r(A-\lambda I)=1,所以Jordan块的形状为 [100011001]\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1\end{bmatrix}

  • step3 找P。把P看作列向量P=(p1,p2,p3)P = (p_1, p_2, p_3)。然后AP=PJAP=PJ,即A(p1,p2,p3)=(p1,p2,p3)[100011001]A(p_1, p_2, p_3)=(p_1, p_2, p_3)\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1\end{bmatrix}
    可以得到3个等式:
    Ap1=p1Ap_1=p_1 \
    Ap2=p2Ap_2=p_2 \
    Ap3=p2+p3Ap_3=p_2+p_3
    前两个就是特征向量没啥太大用处,关键是最后一个,他可以看成(AλI)p3=p2(A-\lambda I)p_3=p_2,因为左边的矩阵式特征矩阵,所以他乘出来的结果p2p_2应该能够由α1,α2\alpha_1, \alpha_2两个特征向量线性表示。所以可得 \
    (AλI)p3=p2=k1α1=k2α2(A-\lambda I)p_3=p_2 = k_1\alpha_1 = k_2 \alpha_2

    如何求解k1,k2k_1, k_2?发现整个等式是非齐次线性方程组,为保证有解,需要满足r(AλI)=r([AλI,p2])r(A-\lambda I)=r([A-\lambda I, p_2]),因此可以确定一组系数,确定系数后p2p_2就得到了,带入(AλI)p3=p2(A-\lambda I)p_3=p_2 p3p_3也得到了。

    最后p1p_1没有约束条件,只要满足是特征向量即可,因此从两个α\alpha中任取一个。最后p1,p2,p3p_1, p_2, p_3合并起来就是PP