【机器学习|数学基础】Mathematics for Machine Learning系列之线性代数(17):相似矩阵

989 阅读2分钟

小知识,大挑战!本文正在参与“程序员必备小知识”创作活动。

前言

Hello!小伙伴!

非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~

 

自我介绍 ଘ(੭ˊᵕˋ)੭

昵称:海轰

标签:程序猿|C++选手|学生

简介:因C语言结识编程,随后转入计算机专业,有幸拿过一些国奖、省奖...已保研。目前正在学习C++/Linux/Python

学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!

 

机器学习小白阶段

文章仅作为自己的学习笔记 用于知识体系建立以及复习

知其然 知其所以然!

5.3 相似矩阵

定义7:相似矩阵

A,BA,B都是nn阶矩阵,若有可逆矩阵PP,使得

P1AP=BP^{-1}AP=B

则称BBAA的相似矩阵 (或称AABB相似)

AA进行的运算P1APP^{-1}AP称为对AA进行相似变换 可逆矩阵PP称为把AA变成BB的相似变换矩阵

定理3

nn阶矩阵AABB相似,则AABB的特征多项式相同,从而AABB的特征值也相同

证明:

因为AA与B相似,即存在可逆矩阵PP,使得

P1AP=BP^{-1}AP=B

那么

BλE=P1APP1(λE)P=P1(AλE)P=P1AλEP=P1PAλE=AλE|B-\lambda E|=|P^{-1}AP-P^{-1}(\lambda E)P|=|P^{-1}(A-\lambda E)P|=|P^{-1}||A-\lambda E||P|=|P^{-1}||P||A-\lambda E|=|A-\lambda E|

Note:

  • AB=AB|AB|=|A||B|
  • AA可逆的情况下AA1=E=1|A||A^{-1}|=|E|=1

BλE=AλE|B-\lambda E|=|A-\lambda E|

所以AABB的特征多项式相同,从而AABB的特征值也相同

备注:为什么BλE=P1APP1(λE)P?|B-\lambda E|=|P^{-1}AP-P^{-1}(\lambda E)P|?

首先

B=P1APB=P^{-1}AP

BλE=P1APλE|B-\lambda E|=|P^{-1}AP-\lambda E|

其次

P1(λE)P=λP1EP=λP1P=λEP^{-1}(\lambda E)P=\lambda P^{-1}EP=\lambda P^{-1}P=\lambda E

P1P=EP^{-1}P=E

P1(λE)P=λEP^{-1}(\lambda E)P=\lambda E

所以才有

BλE=P1APP1(λE)P|B-\lambda E|=|P^{-1}AP-P^{-1}(\lambda E)P|

推论

nn阶矩阵AA与对角阵

Λ=[λ1λ2...λn]\Lambda=\begin{bmatrix} \lambda_1 & & & & \\ & \lambda_2 & & & \\ & & . & & & \\ & & & . & & \\ & & & & .& \\ & & & & & \lambda_n \\ \end{bmatrix}

相似,则λ1,λ2,...,λn\lambda_1,\lambda_2,...,\lambda_nAAnn个特征值

定理4

nn阶矩阵AA与对角阵相似(即AA可以对角化)的充分必要条件是AAnn个线性无关的特征向量

推论

如果nn阶矩阵AAnn个特征值互不相等,则AA与对角阵相似

举例

例11

A=[00111x100]A=\begin{bmatrix} 0 & 0 & 1\\ 1 & 1 & x\\ 1 & 0 & 0 \end{bmatrix},问xx为何值时,矩阵AA能对角化?

解答:

由定理4可得

矩阵A可以对角化,则说明AAnn线性无关特征向量

注意是特征向量

方程(AλE)x=0(A-\lambda E)x=0 有非零解说明AλE=0|A-\lambda E|=0

AλE=λ0111λx10λ=(λ1)2(λ+1)=0|A-\lambda E|=\begin{vmatrix} -\lambda & 0 & 1\\ 1 & 1- \lambda & x\\ 1 & 0 & -\lambda \end{vmatrix}=-(\lambda-1)^2(\lambda+1)=0

解得

λ1=1,λ2=λ3=1\lambda_1=-1,\lambda_2=\lambda_3=1

λ1=1\lambda_1=-1

AλE=[10112x101][10101x12000]A-\lambda E=\begin{bmatrix} -1 & 0 & 1\\ 1 & 2 & x\\ 1 & 0 & 1 \end{bmatrix} \sim \begin{bmatrix} 1 & 0 & 1\\ 0& 1& \frac{x-1}{2}\\ 0 & 0 & 0 \end{bmatrix}

得到通解为

x=c[1x120]x=c\begin{bmatrix} 1\\ \frac{x-1}{2}\\ 0 \end{bmatrix}

有一个基础解系,即线性无关的特征向量就只有1个

注意是 线性无关的 特征向量只有一个

因为若AA可以对角化,说明AAn=3n=3个线性无关的特征向量

λ1=1\lambda_1=-1时有一个线性无关的特征向量

那么当λ2=λ3=1\lambda_2=\lambda_3=1时,就需要有3-1=2个线性无关的特征向量

即方程(AE)x=0(A-E)x=0解空间S的维数为2(有两个线性无关的特征向量)R(S)=2R(S)=2

那么

R(AE)=nR(S)=n2=32=1R(A-E)=n-R(S)=n-2=3-2=1

AE=[10110x101][10100x+1000]A-E=\begin{bmatrix} -1 & 0 & 1\\ 1 & 0 & x\\ 1 & 0 &1 \end{bmatrix} \sim \begin{bmatrix} 1& 0 & -1\\ 0 & 0 & x+1\\ 0 & 0 &0 \end{bmatrix}

因为

R(AE)=1R(A-E)=1

所以

x+1=0x+1=0

x=1x=-1

综上,x=1x=-1时,矩阵AA能对角化

结语

说明:

  • 参考于 课本《线性代数》第五版 同济大学数学系编
  • 配合书中概念讲解 结合了自己的一些理解及思考

文章仅作为学习笔记,记录从0到1的一个过程

希望对您有所帮助,如有错误欢迎小伙伴指正~

我是 海轰ଘ(੭ˊᵕˋ)੭

如果您觉得写得可以的话,请点个赞吧

谢谢支持 ❤️

在这里插入图片描述