矩阵对角化的几何理解

514 阅读2分钟

目录

  1. 基变换
  2. 特征向量和特征值
  3. 对角化几何含义
  4. 对角化在简化计算中的使用

先上3blue1brown的前置知识

笔记可以看

前置知识

1.基变换

在向量空间中,基是一组线性无关的向量,它们可以用来表示该向量空间中的任意向量。
基变换是指在给定向量空间中选择不同的基时,对向量和矩阵进行重新表示的过程,或者做做一个线性变换。

image.png

2.特征向量和特征值

特征向量(eigenvector)是指在线性变换下保持方向不变或仅仅改变尺度的非零向量。
换句话说,特征向量是一个向量,当被一个线性变换作用时,只发生尺度的缩放而不改变方向。
特征向量可以用来描述线性变换对空间的拉伸、压缩、旋转等影响。
特征值(eigenvalue)是与特征向量相关联的数值,表示对应特征向量的缩放因子或尺度大小。
特征值可以用来衡量线性变换对特征向量的影响程度。一个特征向量可以对应一个或多个特征值。

image.png

3.对角化几何含义

1 原矩阵基为 [1001]\ \begin{bmatrix} 1&0\\ 0&1\\ \end{bmatrix} 假设有变换矩阵 M=[2112]\vec{M} = \begin{bmatrix} 2&1\\ 1&2\\ \end{bmatrix}

通过[2112][1001]进行基转换得到新矩阵\begin{bmatrix} 2&1\\ 1&2\\ \end{bmatrix} \begin{bmatrix} 1&0\\ 0&1\\ \end{bmatrix} 进行基转换得到新矩阵

2在新矩阵中,可以发现有的向量保持原方向并没有改变,而只是改变长度,且改变的长度等于特征值λ\lambda,而这些这就是特征向量,如下图所示。

image.png

3.那么该怎么找出这些特征向量呢,根据定义: Ax=λx,(AλI)x=0可以求出解(当且仅当det(AλI)=0A\vec{x} = \lambda\vec{x},即(A - \lambda I)\vec{x} = 0可以求出解(当且仅当det(A - \lambda I) = 0)

[2112]进行计算得:\begin{bmatrix} 2&1\\ 1&2\\ \end{bmatrix} 进行计算得: x=[1111]\vec{x} = \begin{bmatrix} -1&1\\ 1&1\\ \end{bmatrix}

image.png

4.那到底怎么得到x\vec{x}在新基下的表示呢?

同理,对x\vec{x}矩阵进行变换,通过 [2112][1111]\begin{bmatrix} 2&1\\ 1&2\\ \end{bmatrix}\begin{bmatrix} -1&1\\ 1&1\\ \end{bmatrix} 进行变换, 这里的几何含义

是将x的网格转到变换矩阵[2112]的网格,但是数值的结果是在原坐标的值,需要继续变换,将这个值转为在新基下的值。是将\vec{x}的网格转到变换矩阵\begin{bmatrix} 2&1\\ 1&2\\ \end{bmatrix}的网格,但是数值的结果是在原坐标的值,需要继续变换,将这个值转为在新基下的值。

接着通过[1111]1[2112][1111]=[1003]\begin{bmatrix} -1&1\\ 1&1\\ \end{bmatrix}^{-1}\begin{bmatrix} 2&1\\ 1&2\\ \end{bmatrix}\begin{bmatrix} -1&1\\ 1&1\\ \end{bmatrix} = \begin{bmatrix} 1&0\\ 0&3\\ \end{bmatrix} 得到在新基下的坐标表示,而这个矩阵也是对角的

image.png

PS:入如果对基转换感到迷惑,可以去看看基变换的知识

4对角化在简化计算中的使用

计算 [3102]100  \begin{bmatrix} 3&1\\ 0&2\\ \end{bmatrix} ^ {100} ,一种更容易的做法是先变换到特征基,计算100次幂,然后转化回标准系

计算特征值和特征向量,得特征基变换矩阵  [1101]  \begin{bmatrix} 1&-1\\ 0&1\\ \end{bmatrix},求出逆矩阵 [1101]1=[1101]  \begin{bmatrix} 1&-1\\ 0&1\\ \end{bmatrix}^{-1} = \begin{bmatrix} 1&1\\ 0&1\\ \end{bmatrix}

对角化,[1101]1[3102][1101]=[3002]\begin{bmatrix} 1&-1\\ 0&1\\ \end{bmatrix}^{-1}\begin{bmatrix} 3&1\\ 0&2\\ \end{bmatrix}\begin{bmatrix} 1&-1\\ 0&1\\ \end{bmatrix} = \begin{bmatrix} 3&0\\ 0&2\\ \end{bmatrix}

特征基下 [3002]100=[3100002100]  \begin{bmatrix} 3&0\\ 0&2\\ \end{bmatrix}^{100} = \begin{bmatrix} 3^{100}&0\\ 0&2^{100}\\ \end{bmatrix}

回到标准系下

 [3102]100=[1101][3102][3100002100]=[3002]1=[31003100210002100]  \begin{bmatrix} 3&1\\ 0&2\\ \end{bmatrix} ^ {100} = \begin{bmatrix} 1&-1\\ 0&1\\ \end{bmatrix}\begin{bmatrix} 3&1\\ 0&2\\ \end{bmatrix}\begin{bmatrix} 3^{100}&0\\ 0&2^{100}\\ \end{bmatrix} = \begin{bmatrix} 3&0\\ 0&2\\ \end{bmatrix}^{-1} = \begin{bmatrix} 3^{100}&3^{100} - 2^{100}\\ 0&2^{100}\\ \end{bmatrix}