【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(13):Hamliton-Cayley定理、最小多项式

369 阅读5分钟

「这是我参与2022首次更文挑战的第15天,活动详情查看:2022首次更文挑战」。

@TOC

在这里插入图片描述

前言

Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~   自我介绍 ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|C++选手|学生 简介:因C语言结识编程,随后转入计算机专业,有幸拿过一些国奖、省奖...已保研。目前正在学习C++/Linux/Python 学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!   机器学习小白阶段 文章仅作为自己的学习笔记 用于知识体系建立以及复习 知其然 知其所以然!

往期文章

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(1):集合与映射

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(2):线性空间定义及其性质

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(3):线性空间的基与坐标

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(4):基变换与坐标变换

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(5):线性子空间

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(6):子空间的交与和

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(7):欧氏空间

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(8):标准正交基与Gram-Schmidt过程

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(9):正交补与投影定理

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(10):线性变换定义

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(11):线性变换的矩阵表示

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(12):相似形理论

3.4 Hamliton-Cayley定理、最小多项式

定义3.19

AAnn阶方阵,若存在多项式f(λ)f(\lambda),使得f(A)=0f(A)=\boldsymbol0

f(A)f(A)是零矩阵,称f(λ)f(\lambda)是矩阵AA的零化多项式


(1)对任何nn阶方阵AA,都存在零化多项式

线性空间Kn×nK^{n×n}n2n^2维的 所以E,A,A2,A3,...,An2E,A,A^2,A^3,...,A^{n^2}一定是线性相关的(最多n2维向量线性无关,n2+1维向量则必定是线性相关的最多n^2维向量线性无关,n^2+1维向量则必定是线性相关的) 故,存在不全为0的数k0,k1,k2,k3,...,kn2k_0,k_1,k_2,k_3,...,k_{n^2},使得 k0E+k1A+k2A2+k3A3+....+kn2An2=0k_0E + k_1A + k_2A^2 + k_3A^3 + .... + k_{n^2}A^{n^2}=\boldsymbol0 即存在一个多项式f(λ)f(\lambda),使得 f(λ)=k0+k1λ+k2λ2+k3λ3+...+kn2λn2f(\lambda)=k_0+k_1\lambda+k_2\lambda^2+k_3\lambda^3+...+k_{n^2}\lambda^{n^2} 易得f(λ)f(\lambda)AA的零化多项式

(2)任何矩阵的零化多项式不惟一

f(λ)f(\lambda)AA的零化多项式,则f(λ)g(λ)f(\lambda)g(\lambda)也是AA的零化多项式,其中g(λ)g(\lambda)为任意非零多项式

Hamliton-Cayley定理

f(λ)=λEA=λn+a1λn1+...+an1λ+anf(\lambda)=|\lambda E - A|=\lambda^{n}+a_1\lambda^{n-1}+...+a_{n-1}\lambda+a_n

f(A)=An+a1An1+...+an1A+anE=0f(A)=A^n+a_1A^{n-1}+...+a_{n-1}A+a_nE=\boldsymbol0


依据Hamliton-Cayley定理,对于nn阶方阵AA

knk\geq n时,计算AkA^{k}可以用小于nnAA的方幂来表示,简化矩阵运算

比如,设

-1 & 1 & 0\\ -4 & 3 & 0\\ 1 & 0 & 2\\ \end{bmatrix}$$ 试计算$g(A)=A^7 - A^5-19A^4+28A^3+6A-4E$ **解答** 由题易得 $$f(\lambda)=|\lambda E - A|=\lambda^3 - 4\lambda^2+5\lambda-2$$ 令 $$g(\lambda)=\lambda^7-\lambda^5-19\lambda^4+28^3+6\lambda-4$$ 利用多项式的除法可得 $$\frac{g(\lambda)}{f(\lambda)}=(\lambda^4 + 4\lambda^3 + 10 \lambda^2 + 3\lambda-2)【商】....(-3\lambda^2+22\lambda-8)【余数】$$ 即 $$g(\lambda)=f(\lambda)(\lambda^4 + 4\lambda^3 + 10 \lambda^2 + 3\lambda-2)+(-3\lambda^2+22\lambda-8)$$ 由Hamliton-Cayley定理可知$f(A)=0$,得 $$g(A)=-3A^2+22A-8E\\ \quad\\ \quad=\begin{bmatrix} -19 & 16 & 0\\ -64 & 43 & 0\\ 19 & 3 & 24\\ \end{bmatrix}

定义3.20

nn阶方阵AA的所有零化多项式中,次数最低的首一多项式,称为AA的最小多项式,记为m(λ)m(\lambda)

由Hamliton-Cayley定理定理可知,任意nn阶方阵AA的最小多项式是存在的,且次数不超过nn

定理3.4.1

nn阶方阵AA的任意零化多项式都可以被AA的最小多项式整除

证明

m(λ)m(\lambda)AA的最小多项式,g(λ)g(\lambda)AA的任意一个零化多项式,则有

g(λ)=m(λ)q(λ)+r(λ)g(\lambda)=m(\lambda)q(\lambda)+r(\lambda)

其中r(λ)=0r(\lambda)=0r<m\partial r < \partial m

rm\partial r、\partial m表示多项式r(λ)m(λ)r(\lambda)、m(\lambda)的次数(最高项的次数)

依据上式,有

g(A)=m(A)q(A)+r(A)g(A)=m(A)q(A)+r(A)

因为g(A)=0m(A)=0g(A)=0、m(A)=0,得到

r(A)=0r(A)=\boldsymbol0

r(λ)=0r(\lambda)=0时,r(A)=0r(A)=\boldsymbol0,说明m(λ)m(\lambda)可以被g(λ)g(\lambda)整除

r(λ)=0r(\lambda)=0这里的0是数字零 r(A)=0r(A)=\boldsymbol0这里的0是矩阵零 r(A)=0r(A)=\boldsymbol0时,r(λ)r(\lambda)是一个关于λ\lambda的多项式,不一定是0,这里需要讨论

r(λ)0r(\lambda)\neq 0时,若r(A)=0r(A)=\boldsymbol0

因为 r<m\partial r < \partial m

所以得到一个次数比m(λ)m(\lambda)还低的零化多项式,产生矛盾

所以,r(λ)r(\lambda)一定等于0

综上,nn阶方阵AA的任意零化多项式都可以被AA的最小多项式整除,记作 m(λ)g(λ)m(\lambda)|g(\lambda)

定理3.4.2

AA的最小多项式是惟一的

证明

一般证明惟一性时,可以先假设同时存在两个满足条件的事例,然后证明二者相等即可

依据题意,假设m1(λ),m2(λ)m_1(\lambda),m_2(\lambda)都是AA的最小多项式

由定理3.4.1 可知

m1(λ)m2(λ)m2(λ)m1(λ)m_1(\lambda)|m_2(\lambda)、m_2(\lambda)|m_1(\lambda)

m1(λ)m2(λ)m_1(\lambda)、m_2(\lambda)都可以相互被整除

m_1(\lambda)=m_2(\lambda)q(\lambda) \quad 【将m_2(\lambda)看成最小多项式,m_1(\lambda)视为一般零化式】\\ m_2(\lambda)=m_1(\lambda)p(\lambda)\quad 【将m_1(\lambda)看成最小多项式,m_2(\lambda)视为一般零化式】\\ \end{cases}$$ 将上述第二个式子代入第一个式子得到 $$m_1(\lambda)=m_1(\lambda)p(\lambda)q(\lambda)$$ 第一个式子代入第二个式子同样得到 $$m_2(\lambda)=m_2(\lambda)q(\lambda)p(\lambda)$$ 结合 $m_1(\lambda)、m_2(\lambda)$都可以相互被整除且都为首一多项式,可以得到 $$m_1(\lambda)=m_2(\lambda)$$ 综上,$A$的最小多项式是惟一的 ## 定理3.4.3 $A$的最小多项式的根是$A$的特征根 反之,$A$的特征根必是$A$的最小多项式的根 --- **证:$A$的最小多项式的根是$A$的特征根** 设$m(\lambda)$是$A$的最小多项式,$f(\lambda)$是$A$的特征多项式,其中$f(\lambda)=|\lambda E - A|$ 若$m_0$是$m(\lambda)$的根,则 $$m(\lambda_0)=0$$ 由定理3.4.1,有 $$f(\lambda)=m(\lambda)q(\lambda)$$ 因为$m(\lambda_0)=0$,所以有 $$f(\lambda_0)=m(\lambda_0)q(\lambda_0)=0$$ 说明$\lambda_0$也是$A$的特征根 **证:$A$的特征根必是$A$的最小多项式的根** 设$\lambda_0$是$A$的特征根,$\alpha$是其对应的特征向量,则有 $$A\alpha = \lambda_0\alpha$$ 进而可得 $$A^k\alpha=\lambda_0^k\alpha$$ > $A^2\alpha=A(A\alpha)=A(\lambda_0\alpha)=\lambda_0(A\alpha)=\lambda_0\cdot\lambda_0\alpha=\lambda^2\alpha$ > .... > $\Rightarrow A^k\alpha=\lambda_0^k\alpha$ 推出 $$m(A)\alpha=m(\lambda_0)\alpha=\boldsymbol0$$ 又$\alpha\neq \boldsymbol0$,所以 $$m(\lambda_0)=0$$ 说明$\lambda_0$是$m(\lambda)$的根 --- **推论** 若 $$f(\lambda)=|\lambda E - A|=(\lambda-\lambda_1)^{l_1}(\lambda-\lambda_2)^{l_2}...(\lambda-\lambda_s)^{l_s}$$ 则 $$m(\lambda)=(\lambda-\lambda_1)^{t_1}(\lambda-\lambda_2)^{t_2}...(\lambda-\lambda_s)^{t_s}$$ 其中 $$1 \leq t_i \leq l_i \quad(i=1,2,3...,s)$$ --- **例题** 分别求矩阵 $$A=\begin{bmatrix} 7 & 4 & -1\\ 4 & 7 & -1\\ -4 & -4 & 4 \end{bmatrix},B=\begin{bmatrix} 3 & 1 & 0 & 0\\ -4 & -1 & 0 & 0\\ 7 & 1 & 2 & 1\\ -7 & -6 & -1 & 0 \end{bmatrix}

的最小多项式

解答

1)求AA的最小多项式

\lambda-7 & -4 & 1\\ -4 & \lambda-7 & 1\\ 4 & 4 & \lambda-4\\ \end{vmatrix}=(\lambda-3)^2(\lambda-12)$$ 由推论可知 $m(\lambda)$可能是$(\lambda-3)(\lambda-12)$或者$(\lambda-3)^2(\lambda-12)$ 因为$(A-3E)(A-12E)=0$ 所以$m(\lambda)=(\lambda-3)(\lambda-12)$ *2)求$B$的最小多项式* $$f(\lambda)=|\lambda E - B|=(\lambda-1)^4$$ 依据推论 $m(\lambda)$可能是$(\lambda-1)^4、(\lambda-1)^3、(\lambda-1)^2、(\lambda-1)$这四种情况 因为$(A-E)^3\neq0,(A-E)^4=0$ 所以$B$的最小多项式$(\lambda-1)^4$ ## 定理3.4.4 <font color="red">$n$阶方阵$A$的最小多项式$m(\lambda)=d_n(\lambda)$</font> ## 求$A$的第n个不变因子$d_n(\lambda)$的几种方法 ### 方法一 将$(\lambda E - A)$用初等变换化为Smith标准形,最后一个不变因子就是$d_n(\lambda)$ **例题** 求矩阵 $$A=\begin{bmatrix} 2 & 1 & 0\\ -4 & -2 & 0\\ 2 & 1 & 0\\ \end{bmatrix}

的最小多项式

解答

AA的特征矩阵化为Smith标准形

\lambda -2 & -1 & 0\\ 4 & \lambda+2 & 0\\ -2 & -1 & \lambda \end{bmatrix}\rightarrow\begin{bmatrix} 1 & & \\ & \lambda & \\ & & \lambda^2\\ \end{bmatrix}$$ 所以$A$的最小多项式$m(\lambda)=\lambda^2$ ### 方法二 将$(\lambda E - A)$用初等变换适当变形,使其好求行列式因子$D_i(\lambda)$,则 $$d_n(\lambda)=\frac{D_n{\lambda}}{D_{n-1}(\lambda)}$$ **例题** 求矩阵 ![在这里插入图片描述](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/1533672a5ba540a2a48a57f97836596e~tplv-k3u1fbpfcp-zoom-1.image) 的最小多项式 **解答** $f(\lambda)=|\lambda E - A|=(\lambda - a)^n=D_n(\lambda)$ 又因为$D_{n-1}(\lambda)=1$ 得到$d_n(\lambda)=\frac{D_n(\lambda)}{D_{n-1}(\lambda)}=(\lambda - a)^n$ 所以$m(\lambda)=(\lambda - a)^n$ ### 方法三 若$(\lambda E - A)$容易变为对角阵,先求初等因子,则所有互异初等因子指数最高者之积就是$d_n(\lambda)$ ## 定理3.4.5 $n$阶复方阵$A$相似于对角阵的充分必要条件是$A$的最小多项式$m(\lambda)$无重根 # 结语 说明: - 参考于 课本《矩阵理论》 - 配合书中概念讲解 结合了自己的一些理解及思考 文章仅作为学习笔记,记录从0到1的一个过程 希望对您有一点点帮助,如有错误欢迎小伙伴指正 ![在这里插入图片描述](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/40ac93f8a5094cf88acf66db1550477e~tplv-k3u1fbpfcp-zoom-1.image)