矩阵基础

153 阅读1分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第2天,点击查看活动详情

一、矩阵的定义

数学上,通常

  • 使用xi,jx_{i,j}表示标量
  • 使用XiX_i表示向量
  • 使用X来表示n×mn\times m的矩阵
  • 使用Rn×mR^{n\times m}来表示n×mn\times m的矩阵全体

标量、向量和矩阵的关系如下 xi=(xi,1,xi,2,,xi,m)x_i=(x_{i,1},x_{i,2},\cdots,x_{i,m}) X=(X1X2Xn)=(xi,j)Rn×mX=\left(\begin{matrix}X_1\\X_2\\\vdots\\X_n\end{matrix}\right)=(x_{i,j})\in R^{n\times m}

一些特殊的矩阵

单位矩阵In=(100010001)=(1{i=j})Rn×nI_n=\left( \begin{matrix}{ 1 } & { 0 } & { \cdots } & { 0 } \\ { 0 } & { 1 } & { \cdots } & { 0 } \\ { \vdots } & { \vdots } & { } & { \vdots } \\ { 0 } & { 0 } & { \cdots } & { 1 } \end{matrix} \right)=(1_{\{i=j\}})\in R^{n\times n} 对角矩阵:diag(d1,d2,,dn)=(d1000d2000dn)Rn×ndiag(d_1,d_2,\cdots,d_n)=\left( \begin{matrix}{ d _ { 1 } } & { 0 } & { \cdots } & { 0 } \\ { 0 } & { d _ { 2 } } & { \cdots } & { 0 } \\ \vdots&\vdots& &\vdots\\ { 0 } & { 0 } & { \cdots } & { d _ { n } } \end{matrix} \right)\in R^{n\times n} 三角矩阵

  • 下三角矩阵L=(l1,100l2,1l2,20ln,1ln,2ln,n)Rn×nL=\left( \begin{matrix}{ l _ { 1,1 } } & { 0 } & { \cdots } & { 0 } \\ { l _ { 2,1 } } & { l _ { 2,2 } } & { \cdots } & { 0 } \\ \vdots&\vdots &&\vdots \\{ l _ { n , 1 } } & { l _ { n , 2 } } & { \cdots } & { l _ { n , n } } \end{matrix} \right)\in R^{n\times n}
  • 上三角矩阵U=(u1,1u1,2u1,n0u2,2u2,n00un,n)Rn×nU=\left( \begin{matrix} { u _ { 1,1 } } & { u _ { 1,2 } } & { \cdots } & { u _ { 1,n } } \\ { 0 } & { u _ { 2,2 } } & { \cdots } & { u _ { 2,n } } \\\vdots&\vdots &&\vdots \\{ 0 } & { 0 } & { \cdots } & { u _ { n , n } } \end{matrix} \right)\in R^{n\times n}

二、矩阵运算

矩阵可以看做是一些实数的排列,因此,我们希望将实数的四则运算延续到矩阵上

矩阵加减法

矩阵的加减法要求矩阵的形状是一样的,即两个矩阵的函数和列数相同 X±Y=(x1,1±y1,1x1,m±y1,mxn,1±yn,1xn,m±yn,m)=(xi,j±yi,j)Rn×mX\pm Y=\left( \begin{matrix} x _ { 1 , 1 } \pm y _ { 1 , 1 } & \cdots & { x _ { 1 , m }\pm y _ { 1 , m } } \\\vdots &&\vdots \\ x _ { n , 1 } \pm y _ { n , 1 } & \cdots & { x _ { n , m } } \pm y _ { n , m } \end{matrix} \right)=(x_{i,j}\pm y_{i,j})\in R^{n\times m}

矩阵加法满足加法交换律和结合律

  • X+Y=Y+XX+Y=Y+X
  • X+Y+Z=X+(Y+Z)X+Y+Z=X+(Y+Z)

矩阵乘法

矩阵的乘法运算分为两种

矩阵与数字的乘法

kX=(kx1,1kx1,mkxn,1kxn,m)=(kxi,j)Rn×mkX=\left( \begin{matrix}{ k x _ { 1 , 1 } } & { \cdots } & { k x _ { 1 , m } } \\\vdots &&\vdots \\ { kx_{n,1} } & { \cdots } & { k x _ { n , m } } \end{matrix} \right)=(kx_{i,j})\in R^{n\times m}

矩阵与矩阵的乘法

矩阵乘法

矩阵乘法的要求:第一个矩阵的列数=第二个矩阵的行数 A=(ai,j)Rn×pA=(a_{i,j})\in R^{n\times p} B=(bi,j)Rp×mB=(b_{i,j})\in R^{p\times m} AB=(γ=1pai,γbγ,j)Rn×mAB=(\sum^p_{\gamma=1}a_{i,\gamma}b_{\gamma,j})\in R^{n\times m}

矩阵乘法满足结合律和分配律

  • (AB)C=A(BC)(AB)C=A(BC)
  • A(B+C)=AB+ACA(B+C)=AB+AC

矩阵乘法可以简化模型的表示和计算 {y1=ax1+by2=ax2+b\left\{ \begin{matrix} y_{1}=ax_{1}+ {b}\\ y_{2}=ax_{2}+b \\ \end{matrix} \right.X=(x11x21),β=(ab),Y=(y1y2)X=\left(\begin{matrix}x_1&1\\x_2&1\end{matrix}\right),\beta=\left(\begin{matrix}a\\b\end{matrix}\right),Y=\left(\begin{matrix}y_1\\y_2\end{matrix}\right)Y=XβY=X\beta

Hadamard乘法

矩阵的Hadamard乘法要求两个矩阵的形状一样 AB=(ai,jbi,j)Rn×mA\circ B=(a_{i,j}b_{i,j})\in R^{n\times m}

逆矩阵

逆矩阵的定义只针对n×nn\times n的方阵

如果对于方阵MM,存在方阵NN满足MN=NM=InMN=NM=I_n则称NNMM的逆矩阵,记为N=M1N=M^{-1}

容易证明,逆矩阵如果存在,则逆矩阵唯一。并且有如下的性质

  • (M1)1=M(M^{-1})^{-1}=M
  • (kM)1=1kM1(kM)^{-1}= \frac{1}{k}M^{-1}
  • (MN)1=N1M1(MN)^{-1}=N^{-1}M^{-1}

转置

对于一个n×mn\times m的矩阵,它的转置是m×nm\times n的矩阵

具体定义X=(xi,j)Rn×mXT=(xj,i)Rn×m\begin{gathered}X=(x_{i,j})\in R^{n\times m}\\X^T=(x_{j,i})\in R^{n\times m}\end{gathered}

容易证明

  • (XT)T=X(X^T)^T=X
  • (X+Y)T=XT+YT(X+Y)^T=X^T+Y^T
  • (kX)T=kXT(kX)^T=kX^T
  • (XY)T=YTXT(XY)^T=Y^TX^T
  • (XT)1=(X1)T(X^T)^{-1}=(X^{-1})^T

定义对称矩阵XT=XX^T=X