【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(10):线性变换定义

211 阅读4分钟

「这是我参与2022首次更文挑战的第18天,活动详情查看:2022首次更文挑战」。

@TOC

在这里插入图片描述

前言

Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~   自我介绍 ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|C++选手|学生 简介:因C语言结识编程,随后转入计算机专业,有幸拿过一些国奖、省奖...已保研。目前正在学习C++/Linux/Python 学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!   机器学习小白阶段 文章仅作为自己的学习笔记 用于知识体系建立以及复习 知其然 知其所以然!

往期文章

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(1):集合与映射

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(2):线性空间定义及其性质

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(3):线性空间的基与坐标

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(4):基变换与坐标变换

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(5):线性子空间

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(6):子空间的交与和

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(7):欧氏空间

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(8):标准正交基与Gram-Schmidt过程

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(9):正交补与投影定理

3.1 线性变换定义

定义3.1 :线性变换

A\mathscr{A}是数域KK上线性空间VVVV的一个变换,如果满足

  • A(α+β)=A(α)+A(β)\mathscr{A}(\alpha + \beta) = \mathscr{A}(\alpha) + \mathscr{A}(\beta)
  • A(kα)=kA(α)kK,αV\mathscr{A}(k\alpha)=k\mathscr{A}(\alpha) \quad k\in K,\alpha \in V

则称,A\mathscr{A}VV上的一个线性变换(或线性算子)


根据上面的定义,也可以定义

A(kα+lβ)=kA(α)+lA(β)α,βV,k,lK\mathscr{A}(k\alpha + l\beta)=k\mathscr{A}(\alpha) + l\mathscr{A}(\beta) \quad \alpha,\beta \in V, k,l\in K

作为A\mathscr{A}VV的一个线性变换的充分必要条件

线性变换的简单性质:

(1)T(0)=0\mathscr{T}(0)=0

T(0)=T(0α)=0T(α)=0\mathscr{T}(0)=\mathscr{T}(0 \cdot \alpha)=0\cdot\mathscr{T}( \alpha)=0

(2)T(α)=T(α)\mathscr{T}(-\alpha)=-\mathscr{T}(\alpha)

T(α)=T((1)α)=(1)T(α)=T(α)\mathscr{T}(-\alpha)=\mathscr{T}((-1) \cdot \alpha)=(-1) \cdot \mathscr{T}(\alpha)=-\mathscr{T}(\alpha)

(3)T(i=1skiαi)=i=1skiT(αi)\mathscr{T}(\sum^{s}_{i=1}k_i\alpha_i)=\sum^s_{i=1}k_i\mathscr{T}(\alpha_i)


恒等变换

VV是任意一个数域KK上的线性空间,定义如下映射

称该变换为恒等变换

零变换

VV是任意一个数域KK上的线性空间,定义如下映射

O:VVχ0\mathscr{O}: V \rightarrow V\\ \quad\boldsymbol{\chi} \rightarrow 0

称该变换为零变换

数乘运算

VV是任意一个数域KK上的线性空间,定义如下映射

K:VVχkχkK\mathscr{K}: V \rightarrow V\\ \boldsymbol{\chi} \rightarrow k\boldsymbol{\chi} \quad k \in K

称该变换为数乘变换

RnR^n上的一个线性变换

T:RnRnχAχ\mathscr{T}: R^n \rightarrow R^n\\ \quad\boldsymbol{\chi} \rightarrow A\boldsymbol{\chi}

A\mathscr{A}RnR^n上的一个线性变换

R[a  b]R[a \; b]上的一个线性变换

R[a  b]R[a \; b]表示[a  b][a \; b]区间上实连续函数构成的线性空间,定义

T:R[a  b]R[a  b]f(x)0xf(t)dt\mathscr{T}: R[a \; b] \rightarrow R[a \; b]\\ \quad f(x) \rightarrow \int_0^xf(t)dt

T\mathscr{T}R[a  b]R[a \; b]上的一个线性变换

定义3.2

T\mathscr{T}是线性空间VV上的线性变换

集合

R(T)={TχχV}R(\mathscr{T})=\{\mathscr{T} \boldsymbol{\chi} | \boldsymbol{\chi} \in V\}

称之为T\mathscr{T}的值域,也就是VVT\mathscr{T}之下像的集合


集合

N(T)={χTχ=0,χV}N(\mathscr{T})=\{\boldsymbol{\chi}|\mathscr{T}\boldsymbol{\chi}=0,\boldsymbol{\chi}\in V\}

称之为T\mathscr{T}的核域,也就是像为零元的那些源像的集合

定理3.1.1

T\mathscr{T}是线性空间的一个线性变换,则R(T)R(\mathscr{T})N(T)N(\mathscr{T})都是VV的线性子空间


1)证明R(T)R(\mathscr{T})是子空间

证加法封闭性:

α,βR(T)\alpha,\beta\in R(\mathscr{T})

则一定存在ξ,ηV\xi,\eta\in V,使得

T(ξ)=α,T(η)=β,ξ+ηV\mathscr{T}(\xi)=\alpha,\mathscr{T}(\eta)=\beta,且\xi + \eta \in V

那么,有

α+β=T(ξ)+T(η)=T(ξ+η)R(T)\alpha + \beta=\mathscr{T}(\xi)+\mathscr{T}(\eta)=\mathscr{T}(\xi+\eta)\in R(\mathscr{T})

α+βR(T)\alpha + \beta\in R(\mathscr{T})

证数乘封闭性:

αR(T),kK\alpha\in R(\mathscr{T}),k\in K,则一定存在T(ξ)=α,kαV\mathscr{T}(\xi)=\alpha,且k\alpha \in V

那么,有

kα=kT(ξ)=T(kξ)R(T)k\alpha=k\cdot\mathscr{T}(\xi)=\mathscr{T}(k\xi)\in R(\mathscr{T})

kαR(T)k\alpha\in R(\mathscr{T})

综上,R(T)R(\mathscr{T})是子空间

2)证明N(T)N(\mathscr{T})是子空间

证加法封闭性:

α,βN(T)\alpha,\beta\in N(\mathscr{T}),依据N(T)N(\mathscr{T})定义可知

T(α)=0,T(β)=0\mathscr{T}(\alpha)=0,\mathscr{T}(\beta)=0

从而,有

T(α+β)=T(α)+T(β)=0+0=0\mathscr{T}(\alpha + \beta) =\mathscr{T}(\alpha) + \mathscr{T}(\beta)=0 + 0= 0

可以推导出

α+βN(T)\alpha + \beta \in N(\mathscr{T})

α\alpha属于N(T)N(\mathscr{T}),则一定有T(α)=0\mathscr{T}(\alpha)=0 \Longleftrightarrow\quadT(α)=0\mathscr{T}(\alpha)=0,则有α\alpha属于N(T)N(\mathscr{T})

证数乘封闭性:

αR(T),kK\alpha\in R(\mathscr{T}),k\in K,依据N(T)N(\mathscr{T})定义可知

T(α)=0\mathscr{T}(\alpha)=0

从而,有

T(kα)=kT(α)=k0=0\mathscr{T}(k \cdot \alpha)=k\mathscr{T}(\alpha)=k\cdot0=0

可以推导出

kαN(T)k\alpha\in N(\mathscr{T})

综上,N(T)N(\mathscr{T})是子空间

定理3.1.2

VVnn维线性空间,T\mathscr{T}VV上的一个线性变换,则

dimR(T)+dimN(T)=ndimR(\mathscr{T})+dimN(\mathscr{T}) = n

一般称

  • dimR(T)dimR(\mathscr{T})为线性变换T\mathscr{T}
  • dimN(T)dimN(\mathscr{T})为线性变换T\mathscr{T}零度

定义3.3

A1,A2\mathscr{A_1},\mathscr{A_2}都是线性空间VV上的线性变换

若对任意的αV\alpha \in V,都有A1α=A2α\mathscr{A_1}\alpha=\mathscr{A_2}\alpha

A1\mathscr{A_1}A2\mathscr{A_2}相等,记为

A1=A2\mathscr{A_1}=\mathscr{A_2}

定义3.4

A,B\mathscr{A},\mathscr{B}都是线性空间VV上的线性变换,定义A\mathscr{A}B\mathscr{B}的和

(A+B)(α)=A(α)+B(α)αV(\mathscr{A}+\mathscr{B})(\alpha)=\mathscr{A}(\alpha)+\mathscr{B}(\alpha)\quad \alpha\in V

A+B\mathscr{A}+\mathscr{B}依然是VV上的线性变换

定义3.5

A\mathscr{A}是线性空间VV上的线性变换,定义数kk乘以线性变换A\mathscr{A}

(kA)(α)=kA(α)αV(k\mathscr{A})(\alpha)=k\mathscr{A}(\alpha) \quad \alpha \in V

kAk\mathscr{A}也是VV上的线性变换

定义3.6

A,B\mathscr{A},\mathscr{B}都是线性空间VV上的线性变换,定义A\mathscr{A}B\mathscr{B}的积

(AB)(α)=A(B(α))(\mathscr{A}\mathscr{B})(\alpha)=\mathscr{A}(\mathscr{B}(\alpha))

意思就是:AB\mathscr{A}\mathscr{B}是先对α\alpha进行B\mathscr{B}变换,再进行A\mathscr{A}变换 同样,AB\mathscr{A}\mathscr{B}也是VV上的线性空间

注意:一般来说,线性变化中的乘法不满足交换律,即ABBA\mathscr{A}\mathscr{B}\neq\mathscr{B}\mathscr{A}

但对于恒等变换C\mathscr{C},任意的线性变换A\mathscr{A},有

AC(α)=A(α)=CA(α)\mathscr{A}\mathscr{C}(\alpha)=\mathscr{A}(\alpha)=\mathscr{C}\mathscr{A}(\alpha)


如果线性变换A\mathscr{A}是一一对应的变换,假设A(β)=α\mathscr{A}(\beta)=\alpha

那么一定存在A\mathscr{A}的逆变换A1\mathscr{A}^{-1}

\quad \alpha \rightarrow \beta$$ 即 $$\mathscr{A}^{-1}(\alpha)=\beta$$ > 简单的理解:$\beta$可以通过线性变换$\mathscr{A}$变为$\alpha$,$\alpha$也可以通过线性变换$\mathscr{A}^{-1}$变为$\beta$(因为是一一对应的) 那么,可以推导出 $$\mathscr{A}\mathscr{A}^{-1}(\alpha)=\alpha\\ \quad\\ \mathscr{A}\mathscr{A}^{-1}(\beta)=\beta$$ > 说明: > - $\mathscr{A}\mathscr{A}^{-1}(\alpha)=\mathscr{A}(\mathscr{A}^{-1}(\alpha))=\mathscr{A}(\beta)=\alpha$ > - $\mathscr{A}\mathscr{A}^{-1}(\beta)=\mathscr{A}(\mathscr{A}^{-1}(\beta))=\mathscr{A}(\alpha)=\beta$ 即 $$\mathscr{A}\mathscr{A}^{-1}=\mathscr{C}$$ > $\mathscr{C}$为恒等变换 --- 线性变换的指数法则: - $\mathscr{T}^{0}=\mathscr{C}$ - $\mathscr{T}^{n}=\underbrace{\mathscr{T}\mathscr{T}...\mathscr{T}}_{n个}$ - $\mathscr{T}^{-n}=\underbrace{\mathscr{T}^{-1}\mathscr{T}^{-1}...\mathscr{T}^{-1}}_{n个}$ - $\mathscr{T}^{m+n}=\mathscr{T}^{m} \cdot \mathscr{T}^{n}$ - $(\mathscr{T}^{m})^{n}=\mathscr{T}^{mn}$ - $\mathscr{T}^{-n}=(\mathscr{T}^{-1})^n$ --- 设多项式$f(x)=a_nx^{n}+a_{n-1}x^{n-1}+...+a_1x+a_0\quad a_i\in K$,$\mathscr{T}$是数域$K$上线性空间$V$的线性变换,由线性变换运算可知 $$f(\mathscr{T})=a_n\mathscr{T}^{n}+a_{n-1}\mathscr{T}^{n-1}+...+a_1\mathscr{T}+a_0\mathscr{C}$$ 也是$V$的一个线性变换 # 结语 说明: - 参考于 课本《矩阵理论》 - 配合书中概念讲解 结合了自己的一些理解及思考 文章仅作为学习笔记,记录从0到1的一个过程 希望对您有一点点帮助,如有错误欢迎小伙伴指正 ![在这里插入图片描述](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/5e4bb6c0f4a04fc6abf336a44b052da1~tplv-k3u1fbpfcp-zoom-1.image)