「这是我参与2022首次更文挑战的第21天,活动详情查看:2022首次更文挑战」。
@TOC

前言
Hello!小伙伴!
非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~
自我介绍 ଘ(੭ˊᵕˋ)੭
昵称:海轰
标签:程序猿|C++选手|学生
简介:因C语言结识编程,随后转入计算机专业,有幸拿过一些国奖、省奖...已保研。目前正在学习C++/Linux/Python
学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!
机器学习小白阶段
文章仅作为自己的学习笔记 用于知识体系建立以及复习
知其然 知其所以然!
往期文章
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(1):集合与映射
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(2):线性空间定义及其性质
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(3):线性空间的基与坐标
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(4):基变换与坐标变换
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(5):线性子空间
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(6):子空间的交与和
2.1 欧氏空间
2.1.1 欧式空间定义
定义2.1
设V是实数域R上的线性空间,如果V中的任意两个向量α,β都按照某一确定的法则对应于惟一确定的实数,记作(α,β),并且(α,β)满足:
- 对于任意的α,β∈V,有(α,β)=(β,α)
- 对于任意的α,β,γ∈V,有(α+β,γ)=(α,γ)+(β,γ)
- 对任意的k∈R,α,β∈V,有(kα,β)=k(α,β)
- 对任意的α∈V,有(α,α)≥0,当且仅当α=0时,(α,α)=0
则称(α,β)为向量α与β的内积
定义了内积的实线性空间V称为欧几里得空间,简称欧式空间
例 - 1
在n维向量空间Rn中,对任意的向量α=(a1,a2,...,an),β=(b1,b2,...,bn)定义法则:
(α,β)=a1b1+a2b2+...+anbn
试说明Rn关于内积(α,β)成一个欧式空间
证明
设α,β∈Rn,其中α=(a1,a2,...,an),β=(b1,b2,...,bn)
由法则定义可知:
(α,β)=a1b1+a2b2+...+anbn
(β,α)=b1a1+b2a2+...+bnan
得到
(α,β)=(β,α)
再设γ∈Rn,γ=(c1,c2,...,cn),有
(α+β,γ)=(a1+b1)c1+(a2+b2)c2+....+(an+bn)cn=a1c1+b1c1+a2c2+b2c2+...+ancn+bncn=(a1c1+a2c2+...+ancn)+(b1c1+b2c2+...bncn)=(α,γ)+(β,γ)
设k∈R,有
(kα,β)=ka1b1+ka2b2+...+kanbn=k(a1b1+a2b2+...+anbn)=k(α,β)
对于任意的α∈Rn
(α,α)=a12+a22+...+an2
易得
(α,α)=a12+a22+...+an2≥0
当且仅当α=0,即a1=a2=....=an=0时,(α,α)=0
综上,Rn关于内积(α,β)成一个欧式空间
例 - 2
在n维空间Rn×n中,对任意向量A=(aij)n×n,B=(bij)n×n,定义法则
(A,B)=∑i=1n∑j=1naijbij
则有
(A,B)=∑i=1n∑j=1naijbij=Tr(ABT)
补充知识
Tr(A):the trace of the matrix A,矩阵A的迹
设A=(aij)是一个n阶方阵(就是n×n的一个矩阵),A的对角线元素之和称为A的迹
记为trA或Tr(A),即
Tr(A)=a11+a22+...+ann
因为,有
a_{11} & a_{12} &... & a_{1n}\\
a_{21} & a_{22} & ... &a_{2n}\\
. & . & & . \\
. & . & & . \\
a_{n1} & a_{n2} &... & a_{nn}\\
\end{bmatrix}$$
$$B=\begin{bmatrix}
b_{11} & b_{12} &... & b_{1n}\\
b_{21} & b_{22} & ... &b_{2n}\\
. & . & & . \\
. & . & & . \\
b_{n1} & b_{n2} &... & b_{nn}\\
\end{bmatrix},B^T=\begin{bmatrix}
b_{11} & b_{21} &... & b_{n1}\\
b_{12} & b_{22} & ... &b_{n2}\\
. & . & & . \\
. & . & & . \\
b_{1n} & b_{2n} &... & b_{nn}\\
\end{bmatrix}$$
所以
$$(AB^T)=\begin{bmatrix}
a_{11} & a_{12} &... & a_{1n}\\
a_{21} & a_{22} & ... &a_{2n}\\
. & . & & . \\
. & . & & . \\
a_{n1} & a_{n2} &... & a_{nn}\\
\end{bmatrix}\begin{bmatrix}
b_{11} & b_{21} &... & b_{n1}\\
b_{12} & b_{22} & ... &b_{n2}\\
. & . & & . \\
. & . & & . \\
b_{1n} & b_{2n} &... & b_{nn}\\
\end{bmatrix}=...$$
$(AB^T)$的最后结果就不再继续展开了,这里不好使用markdowm文法输入
但是可以知道最后结果是一个$n×n$的矩阵,其中每一个元素是由$n$项相加而来
$\sum^n_{i=1}\sum^n_{j=1}a_{ij}b_{ij}$其实就是也就$n×n$项的累加,对应的就是$(AB^T)$对角线上所有元素的和
> 自己可以使用一个2×2矩阵进行验证,这里就不再验证了
综上
$$\sum^n_{i=1}\sum^n_{j=1}a_{ij}b_{ij}=Tr(AB^T)$$
---
(1)对任意$A,B\in R^{n×n}$,有
$$(A,B)=Tr(AB^T)=Tr((AB^T)^T)=Tr(BA^T)=(B,A)$$
> 注:$Tr(K)=Tr(K^T)$,矩阵$K$的转置不影响对角线所有元素的和,也就不影响其迹了
(2)对任意$A,B,C\in R^{n×n}$,有
$$(A+B,C)=Tr((A+B)C^T)=Tr(AC^T+BC^T)=Tr(AC^T)+Tr(BC^T)=(A,C)+(B,C)$$
> 注:$Tr(K+Q)=Tr(K)+Tr(Q)$
(3)对任意的$k\in R,\quad A,B\in R^{n×n}$,有
$$(kA,B)=Tr((kA)B^T)=Tr(kAB^T)=kTr(AB^T)=k(A,B)$$
> 注意:$Tr(kQ)=kTr(Q)$
(4)对于任意的$A\in R^{n×n}$,有
$$(A,A)=\sum^n_{i=1}\sum^n_{j=1}a_{ij}a_{ij}\geq0$$
当且仅当$A=\boldsymbol0$及$a_{ij}=0$时,$(A,A)=0$
综上,定义的法则$(A,B)$满足上面的四个条件,说明$R^{n×n}$对内积$(A,B)$成一个欧式空间
### 欧氏空间的向量内积性质
`(1)`对于任意的$\alpha\in V(V是欧空间)$,则
$$(0,\alpha)=(\alpha,0)=0$$
> 本质是:$(0,\alpha)=(0\alpha,\alpha)=0(\alpha,\alpha)=0$
特别地,若$\alpha$对任意的向量$\beta\in V$,都有$(\alpha,\beta)=0$,必有$\alpha=0$
> 当$\beta$取为$\alpha$时,有$(\alpha,\alpha)=0$,也就说明$\alpha=0$
`(2)`对于任意的$\alpha,\beta,\gamma\in V$,恒有
$$(\gamma,\alpha+\beta)=(\gamma,\alpha)+(\gamma,\beta)$$
> $(\gamma,\alpha+\beta)=(\alpha+\beta,\gamma)=(\alpha,\gamma)+(\beta,\gamma)=(\gamma,\alpha)+(\gamma,\beta)$
类似的,对任意的$\alpha,\beta\in V,k\in R$,有
$$(\beta,k\alpha)=(k\alpha,\beta)=k(\alpha,\beta)=k(\beta,\alpha)$$
`(3)`对欧式空间中任意向量$\alpha_1,\alpha_2,...,\alpha_s,\beta_1,\beta_2,...,\beta_t$及实数$k_1,...,k_s,l_1,...,l_t$,有
$$(\sum^s_{i=1}k_i\alpha_i,\sum^t_{j=1}l_j\beta_j)=\sum^s_{i=1}\sum^t_{j=1}k_il_j(\alpha_i,\beta_j)$$
## 2.1.2 向量的长度
### 定义2.2
设$\alpha$是欧式空间的一个向量,非负实数$(\alpha,\alpha)$的算术根$\sqrt{(\alpha,\alpha)}$称为$\alpha$的长度,记为$\lvert \alpha \rvert$
> 重点记忆:$\lvert \alpha \rvert=\sqrt{(\alpha,\alpha)}$
### 定理 2.1.1
设$V$是欧式空间,则对任意$\alpha,\beta \in V$及$k\in R$,有
- 齐次性:$\lvert k\alpha \rvert=\lvert k \rvert\lvert \alpha \rvert$
- 非负性:$\lvert \alpha \rvert\geq0$当且仅当$\alpha=0$时,$\lvert \alpha \rvert=0$
- 施瓦茨不等式:$(\alpha,\beta)^2\leq(\alpha,\alpha)(\beta,\beta)$,当且仅当$\alpha$与$\beta$线性相关时,等式成立
---
长度为1的向量称为单位向量
如果$\alpha\neq0$,则有
$$\lvert \frac{\alpha}{\lvert \alpha \rvert
} \rvert=\frac{1}{\lvert \alpha \rvert
}\lvert \alpha \rvert=1$$
即$\frac{\alpha}{\lvert \alpha \rvert}$是单位向量
利用非零向量$\alpha$的长度的倒数$\frac{1}{\lvert \alpha \rvert}$去乘以向量$\alpha$,使它化为单位向量的方法称为把向量$\alpha$单位化
### 定义2.3
设$\alpha,\beta$是欧式空间中任意两个非零向量,称
$$Q=arccos\frac{(\alpha,\beta)}{\lvert \alpha \rvert
\lvert \beta \rvert
}$$
为$\alpha$与$\beta$的夹角
注:
- 这样定义的两个非零向量的夹角总介于0与$\pi$之间
- 零向量与其他向量的夹角是不确定的
如果欧式空间中两向量$\alpha,\beta$的内积$(\alpha,\beta)=0$,则称$\alpha$与$\beta$正交,记作$\alpha \perp \beta$
> 零向量与任意向量都正交
### 命题1
$$\lvert \alpha + \beta \rvert \leq \lvert \alpha \rvert
+\lvert \beta \rvert
证明
∣α+β∣2=(α+β,α+β)=(α,α)+2(α,β)+(β,β)≤(α,α)+2(α,α)(β,β)+(β,β)(使用了施瓦茨不等式)=(α,α)+2(α,α)(β,β)+(β,β)=∣α∣2+2∣α∣∣β∣+∣β∣2=(∣α∣+∣β∣)2
即可得
+∣β∣
注:(α,β)2≤(α,α)(β,β)⇒(α,β)≤(α,α)(β,β)
命题2
∣α∣−∣β∣≤∣α−β∣
证明
令α=(α−β)+β,得到
∣α∣=∣(α−β)+β∣≤∣α−β∣+∣β∣
即
∣α∣≤∣α−β∣+∣β∣
移项得
∣α∣−∣β∣≤∣α−β∣
∣α−γ∣≤∣α−β∣+∣β−γ∣
证明
∣α−γ∣=∣(α−β)+(β−γ)∣≤∣α−β∣+∣β−γ∣
命题3
若α与β正交,则∣α+β∣2=∣α∣2+∣β∣2
证明
∣α+β∣2=(α+β,α+β)=(α,α)+2(α,β)+(β,β)
因为α与β正交,所以(α,β)=0,得
∣α+β∣2=(α,α)+(β,β)=∣α∣2+∣β∣2
即
∣α+β∣2=∣α∣2+∣β∣2
结语
说明:
- 参考于 课本《矩阵理论》
- 配合书中概念讲解 结合了自己的一些理解及思考
文章仅作为学习笔记,记录从0到1的一个过程
希望对您有一点点帮助,如有错误欢迎小伙伴指正
