5 矩阵函数

413 阅读2分钟

矩阵函数

范数

定义与例子

考虑VV在数域FF上的向量空间,定义VV上的函数vv,满足:

  • θα,v(α)>0\forall \theta \ne \alpha, v(\alpha) > 0
  • αV,kF,v(kα)=kv(α)\forall \alpha \in V, k \in F, v(k\alpha) = |k|v(\alpha)
  • α,βV,v(α+β)v(α)+v(β)\forall \alpha, \beta \in V, v(\alpha + \beta) \le v(\alpha) + v(\beta)

vv是范数,空间是范线性空间

例子:

  • p-norm X1=ixi||X||_1 = \sum_{i}|x_i|
  • 2-norm X2=i(XHX)1/2||X||_2 = \sum_{i}(X^HX)^{1/2}

    如果U,V都是酉矩阵,那么A2=UAV2||A||_2=||UAV||_2 矩阵2-范数的一个计算方法tr(AHA)\sqrt{tr(A^HA)}

  • \infty-norm X=maxxi||X||_\infty = \max |x_i|

极限

定义limηtη0=0\lim ||\eta_t-\eta_0||=0,在范数下趋向于η0\eta_0

收敛定理:每一个位置的数字都收敛和按照范数收敛等价。

幂级数: 简单复习一下幂级数的收敛半径的概念
f(x)=i=1naixg(i)f(x) = \sum_{i=1}^n a_i x^{g(i)}
验证其收敛性可以通过求解limai+1xg(i+1)aixg(i)=λ(x)\lim |\frac{a_{i+1}x^{g(i+1)}}{a_i x^{g(i)}}| = \lambda(x) \ 要想幂级数收敛,λ(x)<1\lambda(x) < 1,可以得到x的范围,对于λ(x)=1\lambda(x)=1的情况还需要额外验证。
如果f(x)f(x)是矩阵函数,那么能否收敛关键看rho(X)rho(X)和收敛半径的关系,严格小于是收敛,等号验证,严格大于发散

可比较性

如果存在两个正实数k1,k2k_1, k_2,对任意向量,有k1ααk2αk_1||\alpha|| \le ||\alpha||' \le k_2||\alpha||,两个范数可比较

作用:可比较的范数之间,收敛性是一样的。

性质:有限维的线性空间上任意的范数都是可以比较的。

这很有用,这样的话,收敛的讨论具有较高的泛化性。

相容性

ABAB||AB|| \le ||A||||B||,则范数相容

eg 1,2-norm相容,\infty-norm不相容

算子范数

A=maxθXAXX||A|| = \max_{\theta \ne X} \frac{||AX||}{||X||}

A是一个线性映射,看作是一种算子,所以对这个矩阵的范数看作是算子范数。

它有没有意义(会不会没有最大值)?始终有意义。

他是不是一个范数?可以证明是。

定理:算子范数一定相容。

eg

  • 1-norm max{iaij}\max\{\sum_{i}|a_{ij}|\} 列模和范数
  • 2-norm ρ(AHA)\sqrt{\rho(A^HA)},谱范数 特征值模的最大值
  • \infty-norm max{jaij}\max\{\sum_{j}|a_{ij}|\} 行模和范数

矩阵函数

矩阵函数的定义很保守,他不能包含全部基本初等函数,定义方式是能够展开成幂级数,并且在收敛域内,在可以定义。按照幂级数定义。

对于Jordan块,我们会在特征值处展开,这样的好处是只有NN矩阵,随着次数升高就变成0了。

如果是Jordan矩阵,就分别对每个块去求。

能算Jordan矩阵了,对于任意方阵AAf(A)=f(P1JP)=P1f(J)Pf(A) = f(P^{-1}JP) = P^{-1}f(J)P

性质定理:A的特征值λ\lambdaf(A)f(A)的特征值为f(λ)f(\lambda)

性质

  • eO=Ie^O = I
  • AB=BAeAeB=eA+BAB=BA \Rightarrow e^A e^B = e^{A+B}
  • (e^A)^{-1} = e^{-A}

例题

1 对Jordan块J=[λ0100λ0100λ]J = \begin{bmatrix}\lambda_0 & 1 & 0 \\ 0 & \lambda_0 & 1 \\ 0 & 0 & \lambda\end{bmatrix},求p(J)p(J)

对p(x)在λ0\lambda_0点Taylor展开。

p(x)=p(λ0)+11!p(1)(λ0)(xλ0)+12!p(2)(λ0)(xλ0)2+...p(x) = p(\lambda_0) + \frac{1}{1!}p^{(1)}(\lambda_0)(x-\lambda_0) + \frac{1}{2!}p^{(2)}(\lambda_0)(x-\lambda_0)^2 + ...

p(J)=p(λ0)I+11!p(1)(λ0)N+12!p(2)(λ0)N2+...p(J) = p(\lambda_0)I + \frac{1}{1!}p^{(1)}(\lambda_0)N + \frac{1}{2!}p^{(2)}(\lambda_0)N^2 + ...

由于N的特点,很容易写出来。

2 待定系数法求解

基本思想,从上一题我们发现,f(A)f(A)的作用其实很小,因为只有特征值那一点是在实际做映射,但是导数次数很高。 所以尝试找到一个多项式函数,让他在导数和原函数特征值的位置跟ff一样,就可以了。

那么多项式次数多少、系数满足什么条件,参照如下定理 AA的最小多项式为π(λλi)ti\pi(\lambda-\lambda_i)^{t_i}f(A)=g(A)fi(λt)=gi(λt)f(A) = g(A) \Leftrightarrow f^i(\lambda_t)=g^i(\lambda_t)

i=0,1,...ti1i = 0, 1, ... t_i - 1