【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(17):函数矩阵的微分和积分

373 阅读4分钟

「这是我参与2022首次更文挑战的第11天,活动详情查看:2022首次更文挑战」。

@TOC

在这里插入图片描述

前言

Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~   自我介绍 ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|C++选手|学生 简介:因C语言结识编程,随后转入计算机专业,有幸拿过一些国奖、省奖...已保研。目前正在学习C++/Linux/Python 学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!   机器学习小白阶段 文章仅作为自己的学习笔记 用于知识体系建立以及复习 知其然 知其所以然!

往期文章

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(1):集合与映射

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(2):线性空间定义及其性质

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(3):线性空间的基与坐标

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(4):基变换与坐标变换

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(5):线性子空间

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(6):子空间的交与和

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(7):欧氏空间

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(8):标准正交基与Gram-Schmidt过程

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(9):正交补与投影定理

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(10):线性变换定义

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(11):线性变换的矩阵表示

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(12):相似形理论

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(13):Hamliton-Cayley定理、最小多项式

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(14):向量范数及其性质

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(15):矩阵的范数

【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(16):向量和矩阵的极限

5.2 函数矩阵的微分和积分

5.2.1 函数矩阵对自变量的微分和积分

定义5.3:函数矩阵

设矩阵

a_{11}(z) & a_{12}(z) &... & a_{1n}(z)\\ a_{21} (z)& a_{22}(z) & ... &a_{2n}(z)\\ . & . & & . \\ . & . & & . \\ a_{n1}(z) & a_{n2}(z) &... & a_{nn}(z)\\ \end{bmatrix}

其中每个元素aij(z)a_{ij}(z)都是复变量函数,称A(z)\boldsymbol A(z)为函数矩阵

定义5.4:函数矩阵的微分

若函数矩阵A(z)=(aij(z))m×n\boldsymbol A(z)=(a_{ij}(z))_{m×n}的每个元素aij(z)a_{ij}(z)都是复变量zz的函数,且都在z=z0z=z_0或变量zz的某个区域DD上可微

则称此函数矩阵A(z)\boldsymbol A(z)z=z0z=z_0或区域DD上是可微的

并规定A(z)\boldsymbol A(z)zz的导数为

\frac{d}{dz}a_{11}(z) & \frac{d}{dz}a_{12}(z) &... & \frac{d}{dz}a_{1n}(z)\\ \frac{d}{dz}a_{21} (z)& \frac{d}{dz}a_{22}(z) & ... &\frac{d}{dz}a_{2n}(z)\\ . & . & & . \\ . & . & & . \\ \frac{d}{dz}a_{m1}(z) & \frac{d}{dz}a_{m2}(z) &... & \frac{d}{dz}a_{mn}(z)\\ \end{bmatrix}

单元函数矩阵的一些性质

性质1

若函数矩阵A(z),B(z)\boldsymbol A(z),\boldsymbol B(z)是可微的,则它们的和也可微,且

ddz[A(z)+B(z)]=ddzA(z)+ddzB(z)\frac{d}{d_z}[\boldsymbol A(z)+\boldsymbol B(z)]=\frac{d}{dz}\boldsymbol A(z)+\frac{d}{dz}\boldsymbol B(z)

性质2

设函数矩阵A(z),B(z)\boldsymbol A(z),\boldsymbol B(z)分别是m×nm×nn×sn×s阶矩阵,且A(z),B(z)\boldsymbol A(z),\boldsymbol B(z)都可微

ddz[A(z)B(z)]=[ddzA(z)]B(z)+A(z)[ddzB(z)]\frac{d}{dz}[\boldsymbol A(z)\boldsymbol B(z)]=[\frac{d}{dz}\boldsymbol A(z)]\boldsymbol B(z)+\boldsymbol A(z)[\frac{d}{dz}\boldsymbol B(z)]

性质3

设函数矩阵A(u)=(aij(u))m×n\boldsymbol A(u)=(a_{ij}(u))_{m×n}及变量zz的函数u=f(z)u=f(z)都可微,则

ddzA[f(z)]=dduA(u)ddzf(z)\frac{d}{dz}\boldsymbol A[f(z)]=\frac{d}{du}\boldsymbol A(u)\cdot\frac{d}{dz}f(z)

性质4

nn阶函数矩阵A(z)\boldsymbol A(z)可逆,且A(z)\boldsymbol A(z)及其逆阵A1(z)\boldsymbol A^{-1}(z)都可微,则

ddzA1(z)=A1(z)[ddzA(z)]A1(z)\frac{d}{dz}\boldsymbol A^{-1}(z)=-\boldsymbol A^{-1}(z)[\frac{d}{dz}\boldsymbol A(z)]\boldsymbol A^{-1}(z)

例1

求二次型χTAχ\boldsymbol\chi^TA\boldsymbol\chi对变量tt的导数

其中

x_1(t)\\ x_2(t)\\ .\\ .\\ .\\ x_n(t)\\ \end{bmatrix},\boldsymbol A=(a_{ij})_{n×n},a_{ij}=a{ij}$$ **解答** $\frac{d}{dt}[\boldsymbol\chi^TA\boldsymbol\chi]=(\frac{d}{dt}\boldsymbol\chi^T)A\boldsymbol\chi+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad\\ \quad\quad\quad\quad\;=(\frac{d}{dt}\boldsymbol\chi^T)(\boldsymbol\chi^TA^T)^T+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad\\ \quad\quad\quad\quad\;=(\frac{d}{dt}\boldsymbol\chi)^T(\boldsymbol\chi^TA^T)^T+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad\\ \quad\quad\quad\quad\;=(\boldsymbol\chi^TA^T)\frac{d}{dt}\boldsymbol\chi+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad \\ \quad\quad\quad\quad\;=\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad \\ \quad\quad\quad\quad\;=2\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi$ ### 定义5.5 函数矩阵的积分(定积分与不定积分) 若函数矩阵$\boldsymbol A(t)=(a_{ij}(t))$的每个元素都是实变数$t$的函数,且都在$[a,b]$上可积 则称函数矩阵$\boldsymbol A(t)$在$[a,b]$上是可积的,并规定 $$\int_a^b\boldsymbol A(t)dt=\begin{bmatrix} \int_a^ba_{11}(t)dt & \int_a^ba_{12}(t)dt &... & \int_a^ba_{1n}(t)dt\\ \int_a^ba_{21}(t)dt & \int_a^ba_{22}(t)dt & ... &\int_a^ba_{2n}(t)dt\\ . & . & & . \\ . & . & & . \\ \int_a^ba_{m1}(t)dt & \int_a^ba_{m2}(t)dt &... & \int_a^ba_{mn}(t)dt\\ \end{bmatrix}

A(t)\boldsymbol A(t)[a,b][a,b]上的定积分

\int a_{11}(t)dt & \int a_{12}(t)dt &... & \int a_{1n}(t)dt\\ \int a_{21}(t)dt & \int a_{22}(t)dt & ... &\int a_{2n}(t)dt\\ . & . & & . \\ . & . & & . \\ \int a_{m1}(t)dt & \int a_{m2}(t)dt &... & \int a_{mn}(t)dt\\ \end{bmatrix}

称为A(t)\boldsymbol A(t)的不定积分

函数矩阵的积分的一些性质

性质1

对任何函数A(t)\boldsymbol A(t),有

AT(t)dt=[A(t)dt]T\int \boldsymbol A^T(t)dt=[\int \boldsymbol A(t)dt]^T

性质2

对函数矩阵A(t),B(t)\boldsymbol A(t),\boldsymbol B(t)a,bRa,b\in R,有

[aA(t)+bB(t)]dt=aA(t)dt+bB(t)dt\int[a\boldsymbol A(t)+b\boldsymbol B(t)]dt=a\int \boldsymbol A(t)dt+b\int \boldsymbol B(t)dt

性质3

对函数矩阵A(t)\boldsymbol A(t)及常矩阵B,C\boldsymbol B,\boldsymbol C,有

A(t)Bdt=[A(t)dt]B\int \boldsymbol A(t)\boldsymbol Bdt=[\int \boldsymbol A(t)dt]\boldsymbol B

CA(t)dt=CA(t)dt\int \boldsymbol C\boldsymbol A(t)dt=\boldsymbol C\int \boldsymbol A(t)dt

性质4

对于函数矩阵A(t),B(t)\boldsymbol A(t),\boldsymbol B(t),有

[A(t)ddtB(t)]dt=A(t)B(t)[ddtA(t)]B(t)dt\int[\boldsymbol A(t)\frac{d}{dt}\boldsymbol B(t)]dt=\boldsymbol A(t)\boldsymbol B(t)-\int[\frac{d}{dt}\boldsymbol A(t)]\boldsymbol B(t)dt

结语

说明:

  • 参考于 课本《矩阵理论》
  • 配合书中概念讲解 结合了自己的一些理解及思考

文章仅作为学习笔记,记录从0到1的一个过程

希望对您有一点点帮助,如有错误欢迎小伙伴指正

在这里插入图片描述