【线性代数】相似矩阵及二次型

27 阅读5分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

方阵的特征值与特征向量

AAnn阶方阵,如果对于数λ\lambda,存在非零向量α\alpha,使得Aα=λα(α0)A \alpha=\lambda \alpha\quad (\alpha \ne \boldsymbol{0})成立,则称λ\lambdaAA的特征值,α\alphaAA的对应于λ\lambda的特征向量

 

性质:

  • 不同特征值的特征向量线性无关

  • 任取特征值λ\lambda,线性无关的特征向量的个数λ\leq \lambda的重数

  • AA的特征值为λ1,,λn\lambda_{1},\cdots,\lambda_{n},则{A=λ1,,λn=i=1nλitr(A)=i=1naii=i=1nλi\begin{cases}|A|=\lambda_{1},\cdots,\lambda_{n}=\prod\limits_{i=1}^{n}\lambda_{i}\\tr(A)=\sum\limits^{n}_{i=1}a_{ii}=\sum\limits^{n}_{i=1} \lambda_{i}\end{cases}

 

步骤:

  1. λEA=O| \lambda E-A|=O,解得λ1,,λn\lambda_{1},\cdots,\lambda_{n}

  2. [λiEA]X=0[\lambda_{i}E-A]X=0的解,得到特征向量

 

例1:求矩阵A=(211020413)A=\begin{pmatrix}-2 & 1 & 1 \\ 0 & 2 & 0 \\ -4 & 1 & 3\end{pmatrix}的特征值和特征向量

λEA=λ+2110λ2041λ3=(1)2+2(λ2)λ+214λ3=(λ2)2(λ+1)=0\begin{aligned}|\lambda E-A|&=\begin{vmatrix}\lambda+2&-1&-1\\0&\lambda -2&0\\4&-1&\lambda-3\end{vmatrix}\\&=(-1)^{2+2}(\lambda-2)\begin{vmatrix}\lambda+2&-1\\4&\lambda-3\end{vmatrix}\\&=(\lambda-2)^2(\lambda+1)\\&=0\end{aligned}

解得λ1=λ2=2\lambda_{1}=\lambda_{2}=2

λ1=λ2=2\lambda_{1}=\lambda_{2}=2

(2EA)=(411000411)(11414000000)\begin{aligned}(2E-A)&=\begin{pmatrix}4 & -1 & -1 \\ 0 & 0 & 0 \\ 4 & -1 & -1\end{pmatrix}\\\rightarrow& \begin{pmatrix}1 & - \frac{1}{4} & - \frac{1}{4} \\ 0 & 0 & 0 \\ 0 & 0 & 0\end{pmatrix}\end{aligned}

解得α1=(14,1,0)T,α2=(14,0,1)T\alpha_{1}=(\frac{1}{4},1,0)^T,\alpha_{2}=(\frac{1}{4},0,1)^T

λ3=1\lambda_{3}=-1

(EA)=(111030414)(101010000)\begin{aligned}(-E-A)&=\begin{pmatrix}1 & -1 & -1 \\ 0 & -3 & 0 \\ 4 & -1 & -4\end{pmatrix}\\\rightarrow&\begin{pmatrix}1 & 0 & -1 \\ 0 & 1 & 0 \\ 0 & 0 & 0\end{pmatrix}\end{aligned}

解得α3=(1,0,1)T\alpha_{3}=(1,0,1)^T

λ1=λ2=2\lambda_1=\lambda_2=2时,特征向量为k1α1+k2α2(k1,k2k_{1}\alpha_1+k_{2}\alpha_{2}\quad(k_1,k_2不同时为0)0)

λ3=1\lambda_{3}=-1时,特征向量为k3α3(k3k_3\alpha_3\quad(k_{3}为非零常数))

 

例2:设λ\lambda是方阵AA的特征值,证明

  • λ2\lambda^2A2A^{2}的特征值

      λ\because \lambdaAA特征值

      故α0\exists \alpha \ne \boldsymbol{0},使Aα=λαA \alpha=\lambda \alpha

      设α\alphaλ\lambda的特征向量

      A2α=A(Aα)=λAα=λ2αA^{2}\alpha=A(A \alpha)=\lambda A \alpha=\lambda^{2}\alpha

      故λ2\lambda^2A2A^2为特征值,且α\alphaλ2\lambda^2对应的特征向量

  • AA可逆时,1λ\frac{1}{\lambda}A1A^{-1}的特征值

      A\because A可逆

      对Aα=λαA \alpha=\lambda \alpha左乘A1A^{-1}

      得α=A1λα=λA1α\alpha=A^{-1}\lambda \alpha=\lambda A^{-1}\alpha

      即A1α=1λαA^{-1} \alpha=\frac{1}{\lambda}\alpha

      故1λ\frac{1}{\lambda}A1A^{-1}的特征值

 

推广:

 

    AA          A1A^-1           f(A)f(A)     A1A^{-1}           AA^*            P1APP^{-1}AP  
λ\lambda1λ\frac{1}{\lambda}f(λ)f(\lambda)λ\lambda Aλ\frac{\|A\|}{\lambda}   λ\lambda   
α\alpha       α\alpha         α\alpha  无明显规律        α\alpha        P1αP^{-1}\alpha

 

其中

  • f(A)f(A)AA的多项式,例如A3+2A2+6EA^{3}+2A^{2}+6E,则对应f(λ)=λ3+2λ2+6f(\lambda)=\lambda^3+2\lambda^{2}+6

  • P1APP^{-1}AP表示AA的相似矩阵

 

 

例3:设33阶矩阵AA的特征值为1,1,21,-1,2,求A+3A2EA^*+3A-2E的特征值

A=2|A|=-2

AA的特征值为11时,AA^*的特征值为2-2

AA的特征值为1-1时,AA^*的特征值为22

AA的特征值为22时,AA^*的特征值为1-1

A+3A2EA^*+3A-2E的特征值为Aλ+3λ2\frac{|A|}{\lambda}+3\lambda-2

即为2+3×12=1,2+3×(1)2=3,(1)+3×22=3-2+3\times1-2=-1,2+3\times(-1)-2=-3,(-1)+3\times2-2=3

 

相似矩阵

一、相似矩阵

1. 相似矩阵的定义

A,BA,B都是nn阶矩阵,若有可逆矩阵PP,使P1AP=BP^{-1}AP=B,则称BBAA的相似矩阵,或说矩阵AABB相似。对AA进行运算P1APP^{-1}AP称为对AA进行相似变换,可逆矩阵PP称为把AA变成BB的相似变换矩阵

 

2. 相似矩阵的性质

nn阶矩阵AABB相似,则AABB的特征多项式相同,从而AABB的特征值亦相同

 

二、相似对角化

1. 相似对角化的定义

nn阶矩阵AA与对角阵Λ=(λ1    λ2        λn)\Lambda=\begin{pmatrix}\lambda_1 &  &  &  \\  & \lambda_2 &  &  \\  &  & \ddots &  \\  &  &  & \lambda_{n}\end{pmatrix}相似,则λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n即是nn个特征值

 

2. 相似对角化的充要条件

  1. kk重特征值含有kk个线性无关的特征向量

  2. nn阶矩阵AA与对角阵相似(即AA能对角化)的充分必要条件是AAnn个线性无关的特征向量

 

3. 相似对角化的充分条件

  1. AA是对称矩阵

  2. 如果nn阶矩阵AAnn个特征值互不相等,则AA与对角阵相似

 

例1:设A=(00111x100)A=\begin{pmatrix}0 & 0 & 1 \\ 1 & 1 & x \\ 1 & 0 & 0\end{pmatrix},问xx为何值时,矩阵AA能对角化

先看是不是对称矩阵,发现不是

再算特征值,看特征值是否都不相等

λEA=λ011λ1x10λ=(1)2+2(λ1)λ11λ=(λ+1)(λ1)2=0\begin{aligned}|\lambda E-A|&=\begin{vmatrix}\lambda & 0 & -1 \\ -1 & \lambda-1 & -x \\ -1 & 0 & \lambda\end{vmatrix}\\&=(-1)^{2+2}(\lambda-1)\begin{vmatrix}\lambda&-1\\-1&\lambda\end{vmatrix}\\&=-(\lambda+1)(\lambda-1)^{2}=0\end{aligned}

解得λ1=λ2=1,λ3=1\lambda_{1}=\lambda_{2}=1,\lambda_{3}=-1

发现特征值不相等,则不能使用充分条件,考虑充要条件

λ1=λ2=1\lambda_{1}=\lambda_{2}=1

(1EA)X=0(1\cdots E-A)X=0

需要组成基础解系的个数为22

nr(1EA)=2\therefore n-r(1E-A)=2,其中nn33

r(1EA)=1r(1E-A)=1

(EA)=(10110x101)(101001x000)(E-A)=\begin{pmatrix}1 & 0 & -1 \\ -1 & 0 & -x \\ -1 & 0 & 1\end{pmatrix}\rightarrow \begin{pmatrix}1 & 0 & -1 \\ 0 & 0 & -1-x \\ 0 & 0 & 0\end{pmatrix}

x=1x=-1时,r(EA)=1r(E-A)=1

nr(EA)=31=2\therefore n-r(E-A)=3-1=2

故此时矩阵AA可对角化

 

实对称矩阵的对角化

一、实对称矩阵的定义

元素aija_{ij}都是实数的对称矩阵称为实对称矩阵,即AT=AA^T=A

 

二、实对称矩阵的性质

  1. λ1,λ2\lambda_{1},\lambda_{2}是对称阵AA的两个特征值,p1,p2p_1,p_2是对应的特征向量。若λ1λ2\lambda_{1}\ne \lambda_{2},则p1p_{1}p2p_{2}正交且线性无关

  2. AAnn阶对称阵,则必有正交阵PP,使P1AP=PTAP=ΛP^{-1}AP=P^TAP=\Lambda,其中Λ\Lambda是以AAnn个特征值为对角元的对角阵

  3. AAnn阶对称阵,λ\lambdaAA的特征方程的kk重根,则矩阵λEA\lambda E-A的秩R(λEA)=nkR(\lambda E-A)=n-k,从而对应特征值λ\lambda恰有kk个线性无关的特征向量

 

三、施密特正交化

一般地,用数学归纳法可以证明

α1,,αm(mn)\alpha_1,\cdots,\alpha_{m}(m\leq n)RnR^{n}中的一个线性无关的向量组,若令β1=α1β2=α2α2,β1β1,β1β1βm=αmαm,β1β1,β1β1αm,β2β2,β2β2αm,βm1βm1,βm1βm1\begin{gathered}\beta_1=\alpha_1\\\beta_2=\alpha_{2}-\frac{\langle\alpha_{2},\beta_{1}\rangle}{\langle\beta_{1},\beta_{1}\rangle}\beta_1\\\beta_{m}=\alpha_{m}-\frac{\langle\alpha_{m},\beta_{1}\rangle}{\langle\beta_{1},\beta_{1}\rangle}\beta_{1}-\frac{\langle\alpha_{m},\beta_{2}\rangle}{\langle\beta_{2},\beta_{2}\rangle}\beta_{2}-\cdots-\frac{\langle\alpha_{m},\beta_{m-1}\rangle}{\langle\beta_{m-1},\beta_{m-1}\rangle}\beta_{m-1}\end{gathered}

β1,,βm\beta_{1},\cdots,\beta_{m}就是一个正交向量组,若再令ei=βiβi(i=1,2,,m)e_{i}=\frac{\beta_i}{||\beta_{i}||}(i=1,2,\cdots,m)

就得到一个标准的正交向量组e1,,eme_{1},\cdots,e_{m},且该向量组与α1,,αm\alpha_1,\cdots,\alpha_m等价

 

 

例1:设A=(011101110)A=\begin{pmatrix}0 & -1 & 1 \\ -1 & 0 & 1 \\ 1 & 1 & 0\end{pmatrix},求一个正交阵PP,使P1AP=ΛP^{-1}AP=\Lambda为对角阵

λEA=λ111λ111λ=λ211λ+1100λ1=(1)3+3(λ1)(λ2+λ2)=(λ1)2(λ+2)=0\begin{aligned}|\lambda E-A|&=\begin{vmatrix}\lambda&1&-1\\1&\lambda&-1\\-1&-1&\lambda\end{vmatrix}\\&=\begin{vmatrix}\lambda&2&-1\\1&\lambda+1&-1\\0&0&\lambda-1\end{vmatrix}\\&=(-1)^{3+3}(\lambda-1)(\lambda^2+\lambda-2)\\&=(\lambda-1)^2(\lambda+2)=0\end{aligned}

解得λ1=λ2=1,λ3=2\lambda_1=\lambda_2=1,\lambda_3=-2

α1=α2=1\alpha_1=\alpha_2=1

(1EA)(111000000)(1E-A)\rightarrow\begin{pmatrix}1 & 1 & -1 \\ 0 & 0 & 0 \\ 0 & 0 & 0\end{pmatrix}

解得,α1=(0,1,1)T,α2=(1,0,1)T\alpha_{1}=(0,1,1)^T,\alpha_2=(1,0,1)^T

α3=2\alpha_{3}=-2

(2EA)(101011000)(-2E-A)\rightarrow \begin{pmatrix}1 & 0 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 0\end{pmatrix}

解得,α3=(1,1,1)T\alpha_{3}=(-1,-1,1)^T

β1=α1=(0,1,1)\beta_1=\alpha_1=(0,1,1)

β2=α2α2,β1β1,β1β1=(101)12(011)=12(211)\beta_2=\alpha_2-\frac{\langle\alpha_{2},\beta_{1}\rangle}{\langle\beta_{1},\beta_{1}\rangle}\beta_1=\begin{pmatrix}1 \\ 0 \\ 1\end{pmatrix}-\frac12 \begin{pmatrix}0 \\ 1 \\ 1\end{pmatrix}=\frac12 \begin{pmatrix}2 \\ -1 \\ 1\end{pmatrix}

单位化

e1=12(011),e2=16(211),e3=13(111)e_1=\frac{1}{\sqrt{2}}\begin{pmatrix}0 \\ 1 \\ 1\end{pmatrix},e_2=\frac{1}{\sqrt{6}}\begin{pmatrix}2 \\ -1 \\ 1\end{pmatrix},e_{3}=\frac{1}{\sqrt{3}}\begin{pmatrix}-1 \\ -1 \\ 1\end{pmatrix}

P=(02613121613121613)P=\begin{pmatrix}0 & \frac{2}{\sqrt{6}} & -\frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{2}} & - \frac{1}{\sqrt{6}} & - \frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{6}} & \frac{1}{\sqrt{3}}\end{pmatrix}

使PTAP=Λ=(1   1   2)P^TAP=\Lambda=\begin{pmatrix}1 &  &  \\  & 1 &  \\  &  & -2\end{pmatrix}

 

二次型及其标准形

 

一、二次型的定义

nn个变量的一个二次齐次多项式

f(x1,x2,,xn)=a11x12+2a12x1x2+2a13x1x3++2a1nx1xn+a22x22+2a23x2x3++2a2nx2xn+annxn2\begin{aligned} f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+&2a_{12}x_1x_2+2a_{13}x_1x_3+\cdots+2a_{1n}x_1x_n\\ +&a_{22}x_2^2+2a_{23}x_2x_3+\cdots+2a_{2n}x_2x_n\\ &\cdots\\ &+a_{nn}x_n^2 \end{aligned}

称为nn个变量的二次型,系数均为实数时,称为nn元实二次型

 

二次型的矩阵形式为f(x1,x2,,xn)=(x1,x2,,xn)(a11a12a1na21a22 a2n an1an2ann)(x1x2xn)=xTAxf(x_1,x_2,\cdots,x_n)=(x_1,x_2,\cdots,x_n)\begin{pmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots &  a_{2n} \\ \vdots & \vdots &  & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\end{pmatrix}\begin{pmatrix}x_1 \\ x_2 \\ \vdots \\ x_n\end{pmatrix}=x^TAx。其中AT=AA^T=A为对称矩阵,称为二次型ff的对应矩阵

 

二、合同的定义

AABBnn阶矩阵,若有可逆矩阵CC,使B=CTACB=C^TAC,则称矩阵AABB合同。记作ABA\simeq B

 

三、用正交变换法化二次型为标准形

任给定二次型f=i,j=1naijxiyj(aij=aji)f=\sum^{n}_{i,j=1}a_{ij}x_iy_j(a_{ij}=a_{ji}),总有正交变换x=Pyx=Py,使ff化为标准形f=λ1y12+λ2y22++λnyn2f=\lambda_1y_1^2+\lambda_2y_2^2+\cdots+\lambda_ny_n^2,其中λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_nff的矩阵A=(aij)A=(a_{ij})的特征值

 

例1:求一个正交变换x=Pyx=Py,把二次型f=2x1x2+2x1x3+2x2x3f=-2x_1x_2+2x_1x_3+2x_2x_3化为标准形

A=(011101110)A=\begin{pmatrix}0 & -1 & 1 \\ -1 & 0 & 1 \\ 1 & 1 & 0\end{pmatrix}

λEA=λ111λ111λ=λ211λ+1100λ1=(λ1)2(λ+2)=0|\lambda E-A|=\begin{vmatrix}\lambda&1&-1\\1&\lambda&-1\\-1&-1&\lambda\end{vmatrix}=\begin{vmatrix}\lambda&2&-1\\1&\lambda+1&-1\\0&0&\lambda-1\end{vmatrix}=(\lambda-1)^2(\lambda+2)=0

λ1=λ2=1,λ3=2\lambda_1=\lambda_2=1,\lambda_3=2

λ1=λ2=1\lambda_1=\lambda_2=1

(EA)(111000000)(E-A)\rightarrow \begin{pmatrix}1 & 1 & -1 \\ 0 & 0 & 0 \\ 0 & 0 & 0\end{pmatrix}

解得α1=(1,1,0)T,α2=(1,0,1)T\alpha_1=(-1,1,0)^T,\alpha_2=(1,0,1)^T

λ3=2\lambda_3=-2

(2EA)(101011000)(-2E-A)\rightarrow\begin{pmatrix}1 & 0 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 0\end{pmatrix}

α3=(1,1,1)T\alpha_3=(-1,-1,1)^T

β1=(1,1,0)T,β2=α2α2,β1β1,β1β1=12(112)\beta_1=(-1,1,0)^T,\beta_2=\alpha_2-\frac{\langle\alpha_{2},\beta_{1}\rangle}{\langle\beta_{1},\beta_{1}\rangle}\beta_{1=\frac12}\begin{pmatrix}1 \\ 1 \\ 2\end{pmatrix}

e1=12(110),e2=16(112),e3=13(111)e_1=\frac{1}{\sqrt{2}}\begin{pmatrix}-1 \\ 1 \\ 0\end{pmatrix},e_2=\frac{1}{\sqrt{6}}\begin{pmatrix}1 \\ 1 \\ 2\end{pmatrix},e_3=\frac{1}{\sqrt{3}}\begin{pmatrix}-1 \\ -1 \\ 1\end{pmatrix}

P=(e1,e2,e3)=(12161312161302613)P=(e_1,e_2,e_3)=\begin{pmatrix}- \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{6}} & - \frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{6}} & - \frac{1}{\sqrt{3}} \\ 0 & \frac{2}{\sqrt{6}} & \frac{1}{\sqrt{3}}\end{pmatrix}

则在正交变换x=Pyx=Py

能将二次型ff变换成标准形

f=x=Pyy12+y22+2y32f \overset{x=Py}{=}y_{1}^2+y_2^2+2y_3^2

 

四、用配方法化二次型为标准形

主要思路:凑完全平方

f=x=Cyd1y12++dnyn2f \overset{x=Cy}{=}d_1y_1^2+\cdots+d_ny_n^2

 

例2:化二次型f=x12+2x22+5x32+2x1x2+2x1x3+6x2x3f=x_1^2+2x_2^2+5x_3^2+2x_1x_2+2x_1x_3+6x_2x_3称标准形,并求所用的变换矩阵

先配所有含有x1x_1的平方,减去多余的,然后配x2x_2,依次向后

f=(x1+x2+x3)2x22x322x2x3+2x22+5x32+6x2x3=(x1+x2+x3)2+x22+4x32+4x2x3=(x1+x2+x3)2+(x2+2x3)24x32+4x32=(x1+x2+x3)2+(x2+2x3)2+0x32\begin{aligned}f&=(x_1+x_2+x_3)^2-x_2^2-x_3^2-2x_2x_3+2x_2^2+5x_3^2+6x_2x_3\\&=(x_1+x_2+x_3)^2+x_2^2+4x_3^2+4x_2x_3\\&=(x_1+x_2+x_3)^2+(x_2+2x_3)^2-4x_3^2+4x_3^2\\&=(x_{1}+x_{2}+x_{3})^{2}+(x_{2}+2x_{3})^{2}+0\cdot x_3^2\end{aligned}

{y1=x1+x2+x3y2=x2+2x3y3=x3\begin{cases}y_1=x_1+x_2+x_3\\y_2=x_2+2x_3\\y_3=x_3\end{cases}

{x1=y1y2+y3x2=y22y3x3=y3\begin{cases}x_1=y_1-y_2+y_3\\x_2=y_2-2y_3\\x_3=y_3\end{cases}

C=(111012001)C=\begin{pmatrix}1 & -1 & 1 \\ 0 & 1 & -2 \\ 0 & 0 & 1\end{pmatrix}

x=Cyx=Cy

将二次型化为标准形f=y12+y22f=y_1^2+y_2^2

 

正定二次型

一、正负惯性指数的定义

设有二次型f=xTAxf=x^TAx,它的秩为rr,有两个可逆变换x=Cyx=Cyx=Pzx=Pz使f=k1y12+k2y22++kryr2(ki0)f=k_1y_1^2+k_2y_2^2+\cdots+k_ry_r^2\quad(k_i\ne0),及f=λ1z12+λ2z22++λrzr2(λi0)f=\lambda_1z_1^2+\lambda_2z_2^2+\cdots+\lambda_rz_r^2\quad(\lambda_i\ne0)k1,,krk_1,\cdots,k_r中正数的个数与λ1,,λr\lambda_1,\cdots,\lambda_r中正数的个数相等

二次型的标准形中正系数的个数称为二次型的正惯性指数,记作pp,负系数的个数称为负惯性指数,记作qq

 

二、正定二次型

1. 正定二次型的定义

设有二次型f(x)=xTAxf(x)=x^TAx,如果对任何x0x\ne0,都有f(x)>0f(x)>0(显然f(0)=0f(0)=0),则称ff为正定二次型,并称对称阵AA是正定的;如果对任何x0x\ne0都有f(x)<0f(x)<0,则称ff为负定二次型,并称对称阵AA是负定的

 

2. 二次型正定的充要条件

nn元二次型f(x)=xTAxf(x)=x^TAx为正定的充分必要条件是:它的标准形的nn个系数全为正,即它的规范形的nn个系数全为11,亦即它的正惯性指数等于nn

 

矩阵的规范形,即整的系数化为11,负的系数化为1-1,不存在的系数为00

例如:f=2y12+3y227y32f=2y_1^2+3y_2^2-7y^2_3,规范形f=z12+z22z32f=z^2_1+z^2_2-z^2_3

 

3. 二次型矩阵正定的充要条件

  1. 对称阵AA的正定的充分必要条件是:AA的特征值全为正

  2. 对称阵AA的正定的充分必要条件是:AA的各阶主子式都是正,即a11>0,a11a12a21a22>0,a11a1nan1ann>0a_{11}>0,\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}>0,\begin{vmatrix}a_{11}&\cdots&a_{1n}\\\vdots&&\vdots\\a_{n1}&\cdots&a_{nn}\end{vmatrix}>0