若尔当标准形
我们继续使用上一节的记号:F F F 是一个域,F [ x ] F\left\lbrack x\right\rbrack F [ x ] 是系数在 x x x 中的多项式环,F , V F,V F , V 是 F F F 上的有限维向量空间,其维度为 n , T n,T n , T ;V V V 是一个固定的线性变换,通过它我们将 V V V 变为 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模,A A A 是一个系数在 F F F 中的 n × n n \times n n × n 矩阵。回忆一下,一旦 V V V 的基被确定,任何线性变换 T T T 都定义了一个矩阵 A A A ,反之亦然,任何矩阵 A A A 都定义了一个线性变换 T T T 。
在上一节中,我们使用了关于主理想整环 F [ x ] F\left\lbrack x\right\rbrack F [ x ] 上有限生成模的基本定理的不变量因子形式,来获得此类线性变换 T T T 的有理标准形,以及此类 n × n n \times n n × n 矩阵 A A A 的有理标准形。在本节中,我们使用基本定理的初等因子形式来获得若尔当标准形。我们将看到,这种标准形中的矩阵尽可能地接近对角矩阵,因此这些矩阵比有理标准形中的矩阵更简单(但我们失去了一些“有理性”的结果)。
模的初等因子是其不变量因子的素数幂因子(这是推论10)。对于 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模 V V V ,不变量因子是首一多项式 a 1 ( x ) , a 2 ( x ) , … , a m ( x ) {a}_{1}\left( x\right) ,{a}_{2}\left( x\right) ,\ldots ,{a}_{m}\left( x\right) a 1 ( x ) , a 2 ( x ) , … , a m ( x ) (其次数至少为1,且 a 1 ( x ) ∣ a 2 ( x ) ∣ {a}_{1}\left( x\right) \mid {a}_{2}\left( x\right) \mid a 1 ( x ) ∣ a 2 ( x ) ∣ ⋯ ∣ a m ( x ) \cdots \mid {a}_{m}\left( x\right) ⋯ ∣ a m ( x ) ),因此,相关的初等因子是这些多项式的不可约因子幂。这些多项式只能通过乘以一个单位来定义,正如不变量因子的情况一样,我们可以通过要求它们是首一来唯一指定它们。
为了得到尽可能简单的初等因子,我们假设多项式 a 1 ( x ) , a 2 ( x ) , … , a m ( x ) {a}_{1}\left( x\right) ,{a}_{2}\left( x\right) ,\ldots ,{a}_{m}\left( x\right) a 1 ( x ) , a 2 ( x ) , … , a m ( x ) 完全分解为线性因子,即 V V V 的初等因子是线性多项式的幂 ( x − λ ) k {\left( x - \lambda \right) }^{k} ( x − λ ) k 。由于初等因子的乘积是特征多项式,这等价于假设域 F F F 包含线性变换 T T T (等价地,表示该线性变换的矩阵 A A A )的所有特征值。
在对 F F F 的这一假设下,根据定理6直接得出 V V V 是有限多个循环 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模的直接和,形式为 F [ x ] / ( x − λ ) k F\left\lbrack x\right\rbrack /{\left( x - \lambda \right) }^{k} F [ x ] / ( x − λ ) k ,其中 λ ∈ F \lambda \in F λ ∈ F 是 T T T 的一个特征值,对应于 V V V 的初等因子。
我们现在为每个对应于 V V V 的初等因子的直和项选择一个向量空间基,使得对应的 T T T 的矩阵特别简单。回顾根据 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模结构的定义,线性变换 T T T 作用于 V V V 是元素 x x x 在每个直和项 F [ x ] / ( x − λ ) k F\left\lbrack x\right\rbrack /{\left( x - \lambda \right) }^{k} F [ x ] / ( x − λ ) k 上进行乘法运算。
考虑以下元素
( x ˉ − λ ) k − 1 , ( x ˉ − λ ) k − 2 , … , x ˉ − λ , 1 , {\left( \bar{x} - \lambda \right) }^{k - 1},{\left( \bar{x} - \lambda \right) }^{k - 2},\ldots ,\bar{x} - \lambda ,1, ( x ˉ − λ ) k − 1 , ( x ˉ − λ ) k − 2 , … , x ˉ − λ , 1 ,
在商 F [ x ] / ( x − λ ) k F\left\lbrack x\right\rbrack /{\left( x - \lambda \right) }^{k} F [ x ] / ( x − λ ) k 中。将这些多项式各自在 x ˉ \bar{x} x ˉ 中展开,我们看到将这些元素与 F F F -基 x ˉ k − 1 , x ˉ k − 2 , … , x ˉ , 1 {\bar{x}}^{k - 1},{\bar{x}}^{k - 2},\ldots ,\bar{x},1 x ˉ k − 1 , x ˉ k − 2 , … , x ˉ , 1 的 F [ x ] / ( x − λ ) k F\left\lbrack x\right\rbrack /{\left( x - \lambda \right) }^{k} F [ x ] / ( x − λ ) k 关联的矩阵是上三角矩阵,对角线上都是 1。由于这是一个可逆矩阵(行列式为 1),因此上述元素构成 F F F -基 F [ x ] / ( x − λ ) k F\left\lbrack x\right\rbrack /{\left( x - \lambda \right) }^{k} F [ x ] / ( x − λ ) k 。关于这个基,线性变换乘以 x x x 的作用方式特别简单(注意在商中 x = λ + ( x − λ ) x = \lambda + \left( {x - \lambda }\right) x = λ + ( x − λ ) 和 ( x ˉ − λ ) k = 0 {\left( \bar{x} - \lambda \right) }^{k} = 0 ( x ˉ − λ ) k = 0 ):
( x ˉ − λ ) k − 1 ↦ λ ⋅ ( x ˉ − λ ) k − 1 + ( x ˉ − λ ) k = λ ⋅ ( x ˉ − λ ) k − 1 {\left( \bar{x} - \lambda \right) }^{k - 1}\; \mapsto \;\lambda \cdot {\left( \bar{x} - \lambda \right) }^{k - 1} + {\left( \bar{x} - \lambda \right) }^{k} = \lambda \cdot {\left( \bar{x} - \lambda \right) }^{k - 1} ( x ˉ − λ ) k − 1 ↦ λ ⋅ ( x ˉ − λ ) k − 1 + ( x ˉ − λ ) k = λ ⋅ ( x ˉ − λ ) k − 1
( x ˉ − λ ) k − 2 ↦ λ ⋅ ( x ˉ − λ ) k − 2 + ( x ˉ − λ ) k − 1 {\left( \bar{x} - \lambda \right) }^{k - 2}\; \mapsto \;\lambda \cdot {\left( \bar{x} - \lambda \right) }^{k - 2} + {\left( \bar{x} - \lambda \right) }^{k - 1} ( x ˉ − λ ) k − 2 ↦ λ ⋅ ( x ˉ − λ ) k − 2 + ( x ˉ − λ ) k − 1
x x x :
x x x :
x ˉ − λ ↦ λ ⋅ ( x ˉ − λ ) + ( x ˉ − λ ) 2 \bar{x} - \lambda \; \mapsto \;\lambda \cdot \left( {\bar{x} - \lambda }\right) + {\left( \bar{x} - \lambda \right) }^{2} x ˉ − λ ↦ λ ⋅ ( x ˉ − λ ) + ( x ˉ − λ ) 2
1 ↦ λ ⋅ 1 + ( x ˉ − λ ) . 1\; \mapsto \;\lambda \cdot 1 + \left( {\bar{x} - \lambda }\right) . 1 ↦ λ ⋅ 1 + ( x ˉ − λ ) .
关于这个基,乘以 x x x 的矩阵因此是
( λ 1 λ ⋱ ⋱ 1 λ 1 λ ) \left( \begin{matrix} \lambda & 1 & & & \\ & \lambda & \ddots & & \\ & & \ddots & 1 & \\ & & & \lambda & 1 \\ & & & & \lambda \end{matrix}\right) λ 1 λ ⋱ ⋱ 1 λ 1 λ
其中空白项都是零。这样的矩阵有一个名称:
定义。上述主对角线上有 k × k k \times k k × k ,第一超对角线上有 1 的 k × k k \times k\; k × k 矩阵称为具有特征值 λ \lambda λ 的 k × k k \times k\; k × k 初等乔丹矩阵,或具有特征值 λ \lambda λ 的 k k k 大小的乔丹块。
将其应用于 V V V 的每个循环因子在它的初等因子分解中,我们得到一个关于 V V V 的向量空间基,对于这个基,线性变换 T T T 的矩阵是乔丹块的直接和,对应于 V V V 的初等因子,即沿对角线为块对角矩阵:
( J 1 J 2 ⋱ J t ) . \left( \begin{array}{llll} {J}_{1} & & & \\ & {J}_{2} & & \\ & & \ddots & \\ & & & {J}_{t} \end{array}\right) . J 1 J 2 ⋱ J t .
注意这个矩阵由 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模 V V V 的初等因子唯一确定,直到对角线上的块置换,反之亦然,根据定理 9,初等因子的列表唯一确定模 V V V 直到 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模同构。
定义
(1) 如果一个矩阵是对角块矩阵,并且对角线上的块是若尔当块,则称该矩阵为若尔当标准形。
(2) 对于一个线性变换 T T T 的若尔当标准形是一个表示 T T T 的矩阵,且该矩阵为若尔当标准形。
我们已经证明了任何线性变换 T T T 都有一个若尔当标准形。与有理标准形的情况类似,由基本除子的唯一性可知,若尔当标准形在沿对角线上的若尔当块进行排列上是唯一的(因此被称为 T T T 的若尔当标准形)。我们在以下定理中总结这一点。
定理 22(线性变换的若尔当标准形)
设 V V V 是域 F F F 上的有限维向量空间,T T T 是 V V V 的一个线性变换。假设 F F F 包含 T T T 的所有特征值。
(1) 存在 V V V 的一个基,对于该基,T T T 的矩阵是若尔当标准形,即是一个对角块矩阵,其对角块是 V V V 的基本除子的若尔当块。
(2) T T T 的若尔当标准形在沿对角线上的若尔当块进行排列上是唯一的。
与有理标准形一样,以下定理给出了 n × n n \times n n × n 矩阵在 F F F 上的相应陈述。
定理 23(矩阵的若尔当标准形)
设 A A A 是域 F F F 上的一个 n × n n \times n n × n 矩阵,并假设 F F F 包含 A A A 的所有特征值。
(1) 矩阵 A A A 与约当标准形的矩阵相似,即存在一个可逆的 n × n n \times n n × n 矩阵 P P P 在 F F F 上,使得 P − 1 A P {P}^{-1}{AP} P − 1 A P 是一个块对角矩阵,其对角块是 A \mathbf{A} A 的基本除子的约当块。
(2) 对于 A A A 的约当标准形在约当块沿对角线的排列上是唯一的。
约当标准形与对角矩阵的区别仅在于第一超对角线上可能存在的某些 1(且仅当存在大于一阶的约当块时),因此非常接近于对角矩阵。以下结果特别表明,对于矩阵 A A A 的约当标准形尽可能接近于对角矩阵。
推论 24
(1) 如果矩阵 A A A 与对角矩阵 D D D 相似,那么 D D D 是 A A A 的约当标准形。
(2) 两个对角矩阵相似当且仅当它们的对角条目经过排列后相同。
证明:第一个断言直接来自约当标准形的唯一性,因为对角矩阵本身就是约当形(具有一阶的约当块)。约当标准形的唯一性给出了 (2)。
下一个推论给出了一个判定矩阵 A A A 是否可以对角化的准则。
推论 25
如果 A A A 是一个由 F F F 中的元素组成的 n × n n \times n n × n 矩阵,并且 F F F 包含 A A A 的所有特征值,那么当且仅当 A A A 的最小多项式没有重根时,A A A 与 F F F 上的对角矩阵相似。
证明:假设 A A A 与对角矩阵相似。对角矩阵的最小多项式没有重根(其根恰好是对角线上的不同元素)。由于相似矩阵具有相同的最小多项式,因此可以得出 A A A 的最小多项式没有重根。
反之,假设 A A A 的最小多项式没有重根,并设 B B B 为 A A A 的约当标准形。矩阵 B B B 是一个块对角矩阵,对角线上是基本的约当矩阵。根据上一节末尾的练习,B B B 的最小多项式是约当块的最小多项式的最小公倍数。可以直接看出,大小为 k k k 的约当块,其特征值为 λ \lambda λ 的最小多项式为 ( x − λ ) k {\left( x - \lambda \right) }^{k} ( x − λ ) k (请注意,这是由每个基本约当矩阵对一个循环 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -子模的作用直接得出的,其湮灭子是 ( x − λ ) k {\left( x - \lambda \right) }^{k} ( x − λ ) k )。由于 A A A 和 B B B 具有相同的最小多项式,因此 ( x − λ ) k {\left( x - \lambda \right) }^{k} ( x − λ ) k 的最小公倍数不能有重根。因此可以得出 k k k 必须为 1,即每个约当块必须是一阶的,且 B B B 是对角矩阵。
从一个标准形转换为另一个标准形
我们继续假设域 F F F 包含 T T T (或 A A A )的所有特征值,因此有理标准形和约当标准形都存在于 F F F 上。从一种形式转换到另一种形式的过程与第5.2节中描述的有限阿贝尔群(其中基本除数由不变因子的列表确定,反之亦然)的算法完全相同。
简而言之,回顾一下,基本除数是不变因子的素数次幂除数。它们通过将每个不变因子写成不同线性因子的乘积的幂次来获得;得到的线性多项式的幂次集合即为基本除数集合。例如,如果 T T T 的不变因子是
( x − 1 ) ( x − 3 ) 3 , ( x − 1 ) ( x − 2 ) ( x − 3 ) 3 , ( x − 1 ) ( x − 2 ) 2 ( x − 3 ) 3 \left( {x - 1}\right) {\left( x - 3\right) }^{3},\;\left( {x - 1}\right) \left( {x - 2}\right) {\left( x - 3\right) }^{3},\;\left( {x - 1}\right) {\left( x - 2\right) }^{2}{\left( x - 3\right) }^{3} ( x − 1 ) ( x − 3 ) 3 , ( x − 1 ) ( x − 2 ) ( x − 3 ) 3 , ( x − 1 ) ( x − 2 ) 2 ( x − 3 ) 3
那么基本除数是
( x − 1 ) , ( x − 3 ) 3 , ( x − 1 ) , ( x − 2 ) , ( x − 3 ) 3 , ( x − 1 ) , ( x − 2 ) 2 , ( x − 3 ) 3 . \left( {x - 1}\right) ,\;{\left( x - 3\right) }^{3},\;\left( {x - 1}\right) ,\;\left( {x - 2}\right) ,\;{\left( x - 3\right) }^{3},\;\left( {x - 1}\right) ,\;{\left( x - 2\right) }^{2},\;{\left( x - 3\right) }^{3}. ( x − 1 ) , ( x − 3 ) 3 , ( x − 1 ) , ( x − 2 ) , ( x − 3 ) 3 , ( x − 1 ) , ( x − 2 ) 2 , ( x − 3 ) 3 .
最大的不变因子是基本除数中最大的不同素数次幂的乘积,次大的不变因子是剩余基本除数中最大的不同素数次幂的乘积,依此类推。给定一个基本除数列表,我们可以通过首先将基本除数排列成 n n n 个单独的列表,每个特征值一个列表,来找到不变因子的列表。在这些 n n n 个列表中,按照多项式的次数递增(即非递减)排列多项式。然后通过添加适当数量的常数多项式 1 来使所有 n n n 个列表长度相同。现在通过取这些列表中每个多项式的乘积来形成 i th {i}^{\text{th }} i th 不变因子。例如,如果 T T T 的基本除数是
( x − 1 ) 3 , ( x + 4 ) , ( x + 4 ) 2 , ( x − 5 ) 2 , ( x − 1 ) 5 , ( x − 1 ) 3 , ( x − 5 ) 3 , ( x − 1 ) 4 , ( x + 4 ) 3 {\left( x - 1\right) }^{3},\;\left( {x + 4}\right) ,\;{\left( x + 4\right) }^{2},\;{\left( x - 5\right) }^{2},\;{\left( x - 1\right) }^{5},\;{\left( x - 1\right) }^{3},\;{\left( x - 5\right) }^{3},\;{\left( x - 1\right) }^{4},\;{\left( x + 4\right) }^{3} ( x − 1 ) 3 , ( x + 4 ) , ( x + 4 ) 2 , ( x − 5 ) 2 , ( x − 1 ) 5 , ( x − 1 ) 3 , ( x − 5 ) 3 , ( x − 1 ) 4 , ( x + 4 ) 3
那么中间列表是
( 1 ) ( x − 1 ) 3 , ( x − 1 ) 3 , ( x − 1 ) 4 , ( x − 1 ) 5 \left( 1\right) \;{\left( x - 1\right) }^{3},\;{\left( x - 1\right) }^{3},\;{\left( x - 1\right) }^{4},\;{\left( x - 1\right) }^{5} ( 1 ) ( x − 1 ) 3 , ( x − 1 ) 3 , ( x − 1 ) 4 , ( x − 1 ) 5
( 2 ) 1 , x + 4 , ( x + 4 ) 2 , ( x + 4 ) 3 \left( 2\right) \;1,\;x + 4,\;{\left( x + 4\right) }^{2},\;{\left( x + 4\right) }^{3} ( 2 ) 1 , x + 4 , ( x + 4 ) 2 , ( x + 4 ) 3
( 3 ) 1 , ( x − 5 ) 2 , ( x − 5 ) 3 \left( 3\right) \;1,\;{\left( x - 5\right) }^{2},\;{\left( x - 5\right) }^{3} ( 3 ) 1 , ( x − 5 ) 2 , ( x − 5 ) 3
因此不变因子的列表是
( x − 1 ) 3 , ( x − 1 ) 3 ( x + 4 ) , ( x − 1 ) 4 ( x + 4 ) 2 ( x − 5 ) 2 , ( x − 1 ) 5 ( x + 4 ) 3 ( x − 5 ) 3 . {\left( x - 1\right) }^{3},\;{\left( x - 1\right) }^{3}\left( {x + 4}\right) ,\;{\left( x - 1\right) }^{4}{\left( x + 4\right) }^{2}{\left( x - 5\right) }^{2},\;{\left( x - 1\right) }^{5}{\left( x + 4\right) }^{3}{\left( x - 5\right) }^{3}. ( x − 1 ) 3 , ( x − 1 ) 3 ( x + 4 ) , ( x − 1 ) 4 ( x + 4 ) 2 ( x − 5 ) 2 , ( x − 1 ) 5 ( x + 4 ) 3 ( x − 5 ) 3 .
基本除数分解算法:转换为若尔当标准形
定理 21 指出了一种计算过程,用于确定任意给定矩阵 A A A 的不变因子。对这些不变因子的因式分解产生了 A A A 的基本除数,从而确定了上述的 A A A 的若尔当标准形。
不变量分解算法遵循定理21,从 e 1 , … , e n {e}_{1},\ldots ,{e}_{n} e 1 , … , e n 的基 V V V 开始,并产生一个 f 1 , … , f m {f}_{1},\ldots ,{f}_{m} f 1 , … , f m 元素集合,这些元素是 V V V 的 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模生成元,用于不变量分解中对应循环因子的 V V V (分别具有消灭子 ( a 1 ( x ) ) , … , ( a m ( x ) ) \left( {{a}_{1}\left( x\right) }\right) ,\ldots ,\left( {{a}_{m}\left( x\right) }\right) ( a 1 ( x ) ) , … , ( a m ( x ) ) )。由于初等除数分解是通过将中国剩余定理应用于循环模块 F [ x ] / ( a i ( x ) ) F\left\lbrack x\right\rbrack /\left( {{a}_{i}\left( x\right) }\right) F [ x ] / ( a i ( x ) ) 而从不变量分解中获得的,这给出了一组 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模生成元,用于 V V V 的初等除数分解中的循环因子。这些元素然后给出了一个显式的向量空间基,对于该基,对应于 A A A 的线性变换是乔丹标准形(等价地,一个显式的矩阵 P P P ,使得 P − 1 A P {P}^{-1}{AP} P − 1 A P 是乔丹标准形)。至于不变量分解算法,我们首先在分解向量空间的一般背景下陈述结果,然后描述算法,将给定的 n × n n \times n n × n 矩阵 A A A 转换为乔丹标准形。
该算法的具体数值示例将在后面的示例2和3中给出。
初等除数分解算法
(1)至(3):算法的前三个步骤是遵循定理21的不变量分解算法的步骤。
(4)对于为 A A A 计算的每个不变量因子 a ( x ) a\left( x\right) a ( x ) ,写下
a ( x ) = ( x − λ 1 ) α 1 ( x − λ 2 ) α 2 … ( x − λ s ) α s a\left( x\right) = {\left( x - {\lambda }_{1}\right) }^{{\alpha }_{1}}{\left( x - {\lambda }_{2}\right) }^{{\alpha }_{2}}\ldots {\left( x - {\lambda }_{s}\right) }^{{\alpha }_{s}} a ( x ) = ( x − λ 1 ) α 1 ( x − λ 2 ) α 2 … ( x − λ s ) α s
其中 λ 1 , … , λ s ∈ F {\lambda }_{1},\ldots ,{\lambda }_{s} \in F λ 1 , … , λ s ∈ F 是不同的。令 f ∈ V f \in V f ∈ V 是对应于在(3)中计算的不变量因子 a ( x ) a\left( x\right) a ( x ) 的循环因子的 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模生成元。那么,元素
a ( x ) ( x − λ 1 ) α 1 f , a ( x ) ( x − λ 2 ) α 2 f , … , a ( x ) ( x − λ s ) α s f \frac{a\left( x\right) }{{\left( x - {\lambda }_{1}\right) }^{{\alpha }_{1}}}f,\;\frac{a\left( x\right) }{{\left( x - {\lambda }_{2}\right) }^{{\alpha }_{2}}}f,\;\ldots ,\;\frac{a\left( x\right) }{{\left( x - {\lambda }_{s}\right) }^{{\alpha }_{s}}}f ( x − λ 1 ) α 1 a ( x ) f , ( x − λ 2 ) α 2 a ( x ) f , … , ( x − λ s ) α s a ( x ) f
(注意 a ( x ) ( x − λ i ) α i ∈ F [ x ] \frac{a\left( x\right) }{{\left( x - {\lambda }_{i}\right) }^{{\alpha }_{i}}} \in F\left\lbrack x\right\rbrack ( x − λ i ) α i a ( x ) ∈ F [ x ] 是多项式)是 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模生成元,对应于 V V V 的初等除数
( x − λ 1 ) α 1 , ( x − λ 2 ) α 2 , … , ( x − λ s ) α s , {\left( x - {\lambda }_{1}\right) }^{{\alpha }_{1}},\;{\left( x - {\lambda }_{2}\right) }^{{\alpha }_{2}},\;\ldots ,\;{\left( x - {\lambda }_{s}\right) }^{{\alpha }_{s}}, ( x − λ 1 ) α 1 , ( x − λ 2 ) α 2 , … , ( x − λ s ) α s ,
分别对应。
(5) 如果 g i = a ( x ) ( x − λ i ) α i f {g}_{i} = \frac{a\left( x\right) }{{\left( x - {\lambda }_{i}\right) }^{{\alpha }_{i}}}f g i = ( x − λ i ) α i a ( x ) f 是对应于初等除数 ( x − λ i ) α i {\left( x - {\lambda }_{i}\right) }^{{\alpha }_{i}} ( x − λ i ) α i 的 V V V 循环因子的 F [ x ] F\left\lbrack x\right\rbrack F [ x ] -模生成元,那么这个 V V V 循环因子的对应向量空间基由以下元素给出
( T − λ i ) α i − 1 g i , ( T − λ i ) α i − 2 g i , … , ( T − λ i ) g i , g i . {\left( T - {\lambda }_{i}\right) }^{{\alpha }_{i} - 1}{g}_{i},\;{\left( T - {\lambda }_{i}\right) }^{{\alpha }_{i} - 2}{g}_{i},\;\ldots ,\;\left( {T - {\lambda }_{i}}\right) {g}_{i},\;{g}_{i}. ( T − λ i ) α i − 1 g i , ( T − λ i ) α i − 2 g i , … , ( T − λ i ) g i , g i .
(6) 用原始向量空间基 [ e 1 , e 2 , … , e n ] \left\lbrack {{e}_{1},{e}_{2},\ldots ,{e}_{n}}\right\rbrack [ e 1 , e 2 , … , e n ] 对于 V V V 中的 k th {k}^{\text{th }} k th 元素写出在 (5) 中计算的向量空间基,并使用 k th {k}^{\text{th }} k th 列的 n × n n \times n n × n 矩阵 P P P 的坐标。那么 P − 1 A P {P}^{-1}{AP} P − 1 A P 就是约当标准形(其中约当块出现的顺序与 (5) 中 V V V 的循环因子使用的顺序相同)。
将 n × n n \times n n × n 矩阵转换为约当标准形
(1) 到 (2):前两个步骤是遵循定理 21 的将 n × n n \times n n × n 矩阵转换为有理标准形的算法中的步骤。
(3) 当 x I − A {xI} - A x I − A 已经对角化为定理 21 中的形式时,矩阵 P ′ {P}^{\prime } P ′ 的前 n − m n - m n − m 列为 0(为计算提供了一个有用的数值校验),而 P ′ {P}^{\prime } P ′ 的剩余 m m m 列不为零。对于每个后续的 i = 1 , 2 , … , m i = 1,2,\ldots ,m i = 1 , 2 , … , m :
(a) 对 i th {i}^{\text{th }} i th 非常数对角元素(其次数为 d i {d}_{i} d i )进行因式分解:
a ( x ) = ( x − λ 1 ) α 1 ( x − λ 2 ) α 2 … ( x − λ s ) α s a\left( x\right) = {\left( x - {\lambda }_{1}\right) }^{{\alpha }_{1}}{\left( x - {\lambda }_{2}\right) }^{{\alpha }_{2}}\ldots {\left( x - {\lambda }_{s}\right) }^{{\alpha }_{s}} a ( x ) = ( x − λ 1 ) α 1 ( x − λ 2 ) α 2 … ( x − λ s ) α s
其中 λ 1 , … , λ s ∈ F {\lambda }_{1},\ldots ,{\lambda }_{s} \in F λ 1 , … , λ s ∈ F 是不同的(这里 a ( x ) = a i ( x ) a\left( x\right) = {a}_{i}\left( x\right) a ( x ) = a i ( x ) 是 i th {i}^{\text{th }} i th 的非常数对角元素,而 s s s 取决于 i i i )。
(b) 将 P ′ {P}^{\prime } P ′ 的 i th {i}^{\text{th }} i th 非零列依次乘以 d i {d}_{i} d i 矩阵:
( A − λ 1 I ) α 1 − 1 ( A − λ 2 I ) α 2 … ( A − λ s I ) α s {\left( A - {\lambda }_{1}I\right) }^{{\alpha }_{1} - 1}{\left( A - {\lambda }_{2}I\right) }^{{\alpha }_{2}}\;\ldots {\left( A - {\lambda }_{s}I\right) }^{{\alpha }_{s}} ( A − λ 1 I ) α 1 − 1 ( A − λ 2 I ) α 2 … ( A − λ s I ) α s
( A − λ 1 I ) α 1 − 2 ( A − λ 2 I ) α 2 … ( A − λ s I ) α s {\left( A - {\lambda }_{1}I\right) }^{{\alpha }_{1} - 2}{\left( A - {\lambda }_{2}I\right) }^{{\alpha }_{2}}\;\ldots {\left( A - {\lambda }_{s}I\right) }^{{\alpha }_{s}} ( A − λ 1 I ) α 1 − 2 ( A − λ 2 I ) α 2 … ( A − λ s I ) α s
( A − λ 1 I ) 0 ( A − λ 2 I ) α 2 … ( A − λ s I ) α s {\left( A - {\lambda }_{1}I\right) }^{0}\;{\left( A - {\lambda }_{2}I\right) }^{{\alpha }_{2}}\;\ldots {\left( A - {\lambda }_{s}I\right) }^{{\alpha }_{s}} ( A − λ 1 I ) 0 ( A − λ 2 I ) α 2 … ( A − λ s I ) α s
( A − λ 1 I ) α 1 ( A − λ 2 I ) α 2 − 1 … ( A − λ s I ) α s {\left( A - {\lambda }_{1}I\right) }^{{\alpha }_{1}}\;{\left( A - {\lambda }_{2}I\right) }^{{\alpha }_{2} - 1}\ldots {\left( A - {\lambda }_{s}I\right) }^{{\alpha }_{s}} ( A − λ 1 I ) α 1 ( A − λ 2 I ) α 2 − 1 … ( A − λ s I ) α s
( A − λ 1 I ) α 1 ( A − λ 2 I ) α 2 − 2 … ( A − λ s I ) α s {\left( A - {\lambda }_{1}I\right) }^{{\alpha }_{1}}\;{\left( A - {\lambda }_{2}I\right) }^{{\alpha }_{2} - 2}\ldots {\left( A - {\lambda }_{s}I\right) }^{{\alpha }_{s}} ( A − λ 1 I ) α 1 ( A − λ 2 I ) α 2 − 2 … ( A − λ s I ) α s
( A − λ 1 I ) α 1 ( A − λ 2 I ) 0 … ( A − λ s I ) α s {\left( A - {\lambda }_{1}I\right) }^{{\alpha }_{1}}\;{\left( A - {\lambda }_{2}I\right) }^{0}\;\ldots {\left( A - {\lambda }_{s}I\right) }^{{\alpha }_{s}} ( A − λ 1 I ) α 1 ( A − λ 2 I ) 0 … ( A − λ s I ) α s
( A − λ 1 I ) α 1 ( A − λ 2 I ) α 2 … ( A − λ s I ) α s − 1 {\left( A - {\lambda }_{1}I\right) }^{{\alpha }_{1}}{\left( A - {\lambda }_{2}I\right) }^{{\alpha }_{2}}\ldots {\left( A - {\lambda }_{s}I\right) }^{{\alpha }_{s} - 1} ( A − λ 1 I ) α 1 ( A − λ 2 I ) α 2 … ( A − λ s I ) α s − 1
( A − λ 1 I ) α 1 ( A − λ 2 I ) α 2 … ( A − λ s I ) α s − 2 {\left( A - {\lambda }_{1}I\right) }^{{\alpha }_{1}}{\left( A - {\lambda }_{2}I\right) }^{{\alpha }_{2}}\ldots {\left( A - {\lambda }_{s}I\right) }^{{\alpha }_{s} - 2} ( A − λ 1 I ) α 1 ( A − λ 2 I ) α 2 … ( A − λ s I ) α s − 2
( A − λ 1 I ) α 1 ( A − λ 2 I ) α 2 … ( A − λ s I ) 0 . {\left( A - {\lambda }_{1}I\right) }^{{\alpha }_{1}}{\left( A - {\lambda }_{2}I\right) }^{{\alpha }_{2}}\ldots {\left( A - {\lambda }_{s}I\right) }^{0}. ( A − λ 1 I ) α 1 ( A − λ 2 I ) α 2 … ( A − λ s I ) 0 .
(c) 使用 (b) 中得到的列向量(按该顺序)作为下一个 d i {d}_{i} d i 的 n × n n \times n n × n 矩阵 P P P 的列。
然后 P − 1 A P {P}^{-1}{AP} P − 1 A P 是若尔当标准形(其若尔当块与 (a) 中因子的顺序相对应)。
示例
我们可以使用若尔当标准形来对矩阵进行分析,就像我们使用有理标准形的例子一样。在某些情况下,当扩展字段时,相似类的数量会增加(根据推论 18(2),当我们通过扩展字段时,相似类的数量永远不会减少)。
(1) 设 A , B A,B A , B 和 C C C 是上一节示例 1 中的矩阵,并且设 F = Q F = \mathbb{Q} F = Q 。注意到 Q \mathbb{Q} Q 包含了这些矩阵的所有特征值。因为我们已经确定了这些矩阵的不变因子,所以我们可以直接得到它们的基本除数。A A A 的基本除数是 x − 2 , x − 2 x - 2,x - 2 x − 2 , x − 2 和 x − 3 x - 3 x − 3 ,而 B B B 和 C C C 的基本除数是 ( x − 2 ) 2 {\left( x - 2\right) }^{2} ( x − 2 ) 2 和 x − 3 x - 3 x − 3 ,因此它们各自的若尔当标准形是:
( 2 0 0 0 2 0 0 0 3 ) ( 2 1 0 0 2 0 0 0 3 ) ( 2 1 0 0 2 0 0 0 3 ) . \left( \begin{array}{lll} 2 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{array}\right) \;\left( \begin{array}{lll} 2 & 1 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{array}\right) \;\left( \begin{array}{lll} 2 & 1 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{array}\right) . 2 0 0 0 2 0 0 0 3 2 0 0 1 2 0 0 0 3 2 0 0 1 2 0 0 0 3 .
注意到 A A A 与对角矩阵相似,但是根据推论 25,B B B 和 C C C 不是。
(2) 对于矩阵 A A A ,我们在上一节的例2中确定 f 1 = {f}_{1} = f 1 = − 7 e 1 + 7 e 2 + e 3 - 7{e}_{1} + 7{e}_{2} + {e}_{3} − 7 e 1 + 7 e 2 + e 3 和 f 2 = − e 1 + e 2 {f}_{2} = - {e}_{1} + {e}_{2} f 2 = − e 1 + e 2 是 Q [ x ] \mathbb{Q}\left\lbrack x\right\rbrack Q [ x ] -模生成元,对应于 V V V 在其不变因子分解中的两个循环因子,分别对应于不变因子 x − 2 x - 2 x − 2 和 ( x − 2 ) ( x − 3 ) \left( {x - 2}\right) \left( {x - 3}\right) ( x − 2 ) ( x − 3 ) 。使用上面描述的第一个算法,元素 f 1 , ( x − 3 ) f 2 {f}_{1},\left( {x - 3}\right) {f}_{2} f 1 , ( x − 3 ) f 2 和 ( x − 2 ) f 2 \left( {x - 2}\right) {f}_{2} ( x − 2 ) f 2 因此是 V V V 在其初等因子分解中的三个循环因子的 Q [ x ] \mathbb{Q}\left\lbrack x\right\rbrack Q [ x ] -模生成元,分别对应于初等因子 x − 2 , x − 2 x - 2,x - 2 x − 2 , x − 2 和 x − 3 x - 3 x − 3 。一个简单的计算表明,这些分别是元素 − 7 e 1 + 7 e 2 + e 3 , − e 1 - 7{e}_{1} + 7{e}_{2} + {e}_{3}, - {e}_{1} − 7 e 1 + 7 e 2 + e 3 , − e 1 和 − 2 e 1 + e 2 - 2{e}_{1} + {e}_{2} − 2 e 1 + e 2 。然后这个矩阵
P = ( − 7 − 1 − 2 7 0 1 1 0 0 ) P = \left( \begin{array}{rrr} - 7 & - 1 & - 2 \\ 7 & 0 & 1 \\ 1 & 0 & 0 \end{array}\right) P = − 7 7 1 − 1 0 0 − 2 1 0
将 A A A 共轭为其乔丹标准形:
P − 1 A P = ( 2 0 0 0 2 0 0 0 3 ) {P}^{-1}{AP} = \left( \begin{array}{lll} 2 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{array}\right) P − 1 A P = 2 0 0 0 2 0 0 0 3
如同容易验证的那样。
这个矩阵的列也可以通过使用上一节例2中计算的矩阵 P ′ {P}^{\prime } P ′ 的非零列,按照上述第二个算法得到:
上一节:
( A − 2 I ) 0 ( − 7 7 1 ) = ( − 7 7 1 ) {\left( A - 2I\right) }^{0}\left( \begin{array}{r} - 7 \\ 7 \\ 1 \end{array}\right) = \left( \begin{array}{r} - 7 \\ 7 \\ 1 \end{array}\right) ( A − 2 I ) 0 − 7 7 1 = − 7 7 1
以及
( A − 2 I ) 0 ( A − 3 I ) 1 ( − 1 1 0 ) = ( − 1 0 0 ) , ( A − 2 I ) 1 ( A − 3 I ) 0 ( − 1 1 0 ) = ( − 2 1 0 ) , {\left( A - 2I\right) }^{0}{\left( A - 3I\right) }^{1}\left( \begin{array}{r} - 1 \\ 1 \\ 0 \end{array}\right) = \left( \begin{array}{r} - 1 \\ 0 \\ 0 \end{array}\right) ,\;{\left( A - 2I\right) }^{1}{\left( A - 3I\right) }^{0}\left( \begin{array}{r} - 1 \\ 1 \\ 0 \end{array}\right) = \left( \begin{array}{r} - 2 \\ 1 \\ 0 \end{array}\right) , ( A − 2 I ) 0 ( A − 3 I ) 1 − 1 1 0 = − 1 0 0 , ( A − 2 I ) 1 ( A − 3 I ) 0 − 1 1 0 = − 2 1 0 ,
分别,这再次给出了矩阵 P P P 。
(3) 对于上一节例3中的 4 × 4 4 \times 4 4 × 4 矩阵 D D D ,不变因子是 ( x − 1 ) 2 , ( x − 1 ) 2 {\left( x - 1\right) }^{2},{\left( x - 1\right) }^{2} ( x − 1 ) 2 , ( x − 1 ) 2 ,对应的 Q [ x ] \mathbb{Q}\left\lbrack x\right\rbrack Q [ x ] -模生成元分别是 f 1 = e 1 {f}_{1} = {e}_{1} f 1 = e 1 和 f 2 = e 2 {f}_{2} = {e}_{2} f 2 = e 2 。这些也是该矩阵的初等因子。这两个因子的对应向量空间基由 ( T − 1 ) f 1 , f 1 \left( {T - 1}\right) {f}_{1},{f}_{1} ( T − 1 ) f 1 , f 1 和 ( T − 1 ) f 2 , f 2 \left( {T - 1}\right) {f}_{2},{f}_{2} ( T − 1 ) f 2 , f 2 给出。一个简单的计算表明这些分别是元素 2 e 2 + e 3 , e 1 2{e}_{2} + {e}_{3},{e}_{1} 2 e 2 + e 3 , e 1 和 2 e 1 − e 2 + e 4 , e 2 2{e}_{1} - {e}_{2} + {e}_{4},{e}_{2} 2 e 1 − e 2 + e 4 , e 2 。然后这个矩阵
P = ( 0 1 2 0 2 0 − 2 1 1 0 0 0 0 0 1 0 ) P = \left( \begin{array}{rrrr} 0 & 1 & 2 & 0 \\ 2 & 0 & - 2 & 1 \\ 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 \end{array}\right) P = 0 2 1 0 1 0 0 0 2 − 2 0 1 0 1 0 0
将 D D D 共轭为其乔丹标准形:
P − 1 D P = ( 1 1 0 0 0 1 0 0 0 0 1 1 0 0 0 1 ) {P}^{-1}{DP} = \left( \begin{array}{llll} 1 & 1 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 1 \\ 0 & 0 & 0 & 1 \end{array}\right) P − 1 D P = 1 0 0 0 1 1 0 0 0 0 1 0 0 0 1 1
如同容易验证的那样。
这个矩阵的列也可以通过上述第二个算法获得,使用上一节例3中计算出的矩阵 P ′ {P}^{\prime } P ′ 的非零列:
( D − I ) 1 ( 1 0 0 0 ) = ( 0 2 1 0 ) , ( D − I ) 0 ( 1 0 0 0 ) = ( 1 0 0 0 ) , {\left( D - I\right) }^{1}\left( \begin{array}{l} 1 \\ 0 \\ 0 \\ 0 \end{array}\right) = \left( \begin{array}{l} 0 \\ 2 \\ 1 \\ 0 \end{array}\right) ,\;{\left( D - I\right) }^{0}\left( \begin{array}{l} 1 \\ 0 \\ 0 \\ 0 \end{array}\right) = \left( \begin{array}{l} 1 \\ 0 \\ 0 \\ 0 \end{array}\right) , ( D − I ) 1 1 0 0 0 = 0 2 1 0 , ( D − I ) 0 1 0 0 0 = 1 0 0 0 ,
和
( D − I ) 1 ( 0 1 0 0 ) = ( 2 − 2 0 1 ) , ( D − I ) 0 ( 0 1 0 0 ) = ( 0 1 0 0 ) , {\left( D - I\right) }^{1}\left( \begin{array}{l} 0 \\ 1 \\ 0 \\ 0 \end{array}\right) = \left( \begin{array}{r} 2 \\ - 2 \\ 0 \\ 1 \end{array}\right) ,\;{\left( D - I\right) }^{0}\left( \begin{array}{l} 0 \\ 1 \\ 0 \\ 0 \end{array}\right) = \left( \begin{array}{l} 0 \\ 1 \\ 0 \\ 0 \end{array}\right) , ( D − I ) 1 0 1 0 0 = 2 − 2 0 1 , ( D − I ) 0 0 1 0 0 = 0 1 0 0 ,
分别,这再次给出了矩阵 P P P 。
(4) 由 6 × 6 6 \times 6 6 × 6 矩阵的相似类,其元素来自 C \mathbb{C} C 且特征多项式为 ( x 4 − 1 ) ( x 2 − 1 ) \left( {{x}^{4} - 1}\right) \left( {{x}^{2} - 1}\right) ( x 4 − 1 ) ( x 2 − 1 ) ,由前述示例集合中的有理标准形表示的4个类(在 C \mathbb{C} C 上没有额外的不变因子列表)。然而,它们的乔丹标准形不能都写成 Q \mathbb{Q} Q 上的。例如,如果不变因子是
( x − 1 ) ( x + 1 ) and ( x − 1 ) ( x + 1 ) ( x 2 + 1 ) \left( {x - 1}\right) \left( {x + 1}\right) \text{ and }\left( {x - 1}\right) \left( {x + 1}\right) \left( {{x}^{2} + 1}\right) ( x − 1 ) ( x + 1 ) and ( x − 1 ) ( x + 1 ) ( x 2 + 1 )
那么,初等因子是
x − 1 , x + 1 , x − 1 , x + 1 , x − i , x + i x - 1,\;x + 1,\;x - 1,\;x + 1,\;x - i,\;x + i x − 1 , x + 1 , x − 1 , x + 1 , x − i , x + i
其中 i i i 是 C \mathbb{C} C 中的 -1 的平方根,所以这个矩阵的乔丹形式是对角矩阵,对角线上的条目为 1 , 1 , − 1 , − 1 , i , − i 1,1, - 1, - 1,i, - i 1 , 1 , − 1 , − 1 , i , − i 。
(5) 相比之下,满足 A 6 = I {A}^{6} = I A 6 = I 的 3 × 3 3 \times 3 3 × 3 矩阵的相似类 A A A 在 C \mathbb{C} C 上比在 Q \mathbb{Q} Q 上大得多。如果 A A A 是这样一个矩阵, m A ( x ) ∣ x 6 − 1 {m}_{A}\left( x\right) \mid {x}^{6} - 1 m A ( x ) ∣ x 6 − 1 ,那么由于后者多项式在 C \mathbb{C} C 中没有重根,A A A 的最小多项式也没有重根。根据推论25,A A A 的乔丹标准形是对角矩阵。由于这个对角矩阵具有相同的最小多项式,它的 6 th {6}^{\text{th }} 6 th 次方也是单位矩阵,因此每个对角线上的条目都是 6 th {6}^{\text{th }} 6 th 的单位根。对于每个 ζ 1 , ζ 2 , ζ 3 {\zeta }_{1},{\zeta }_{2},{\zeta }_{3} ζ 1 , ζ 2 , ζ 3 的 6 th {6}^{\text{th }} 6 th 单位根列表,我们得到一个乔丹标准形,当且仅当这两个列表是彼此的排列版本时,这两个形式是相同的(即,产生相似的矩阵)。人们发现,在相似性下,有56个这样的 A ′ {A}^{\prime } A ′ 类。