一、范数与距离度量
1. 范数(Norm)
定义:范数是向量空间中衡量向量长度的函数,满足非负性、齐次性和三角不等式。
(1)L1范数(曼哈顿范数)
∣v∣1=i=1∑n∣vi∣
- 几何意义:向量分量绝对值之和,对应“曼哈顿距离”(沿网格路径行走的总距离)。
- 示例:向量 [3,−4] 的L1范数为 ∣3∣+∣−4∣=7。
(2)L2范数(欧几里得范数)
∣v∣2=i=1∑nvi2
- 几何意义:向量的欧几里得长度,即从原点到向量终点的直线距离。
- 示例:向量 [3,4] 的L2范数为 32+42=5。
(3)Lp范数(一般化范数)
∣v∣p=(i=1∑n∣vi∣p)1/p,p≥1
- 性质:当 p→∞ 时,Lp范数退化为无穷范数:
∣v∣∞=max(∣v1∣,∣v2∣,…,∣vn∣)
- 示例:向量 [3,−5,2] 的无穷范数为 5。
2. 距离度量
定义:两向量 u,v 之间的距离是范数的扩展,对应空间中的“间隔”。
(1)曼哈顿距离(L1距离)
d1(u,v)=∣u−v∣1=i=1∑n∣ui−vi∣
- 应用场景:城市导航、图像处理中像素差异计算。
- 示例:u=[1,3] 和 v=[4,−1] 的曼哈顿距离为 ∣1−4∣+∣3−(−1)∣=3+4=7。
(2)欧氏距离(L2距离)
d2(u,v)=∣u−v∣2=i=1∑n(ui−vi)2
- 应用场景:物理空间距离、KNN分类。
- 示例:u=[1,2] 和 v=[4,6] 的欧氏距离为 (1−4)2+(2−6)2=5。
(3)切比雪夫距离(L∞距离)
d∞(u,v)=∣u−v∣∞=max(∣u1−v1∣,…,∣un−vn∣)
- 应用场景:棋盘上国王的移动步数(任意方向一步可达)。
- 示例:u=[1,5] 和 v=[3,2] 的切比雪夫距离为 max(2,3)=3。
(4)闵可夫斯基距离(一般化距离)
dp(u,v)=(i=1∑n∣ui−vi∣p)1/p
- 统一性:当 p=1,2,∞ 时,分别对应曼哈顿、欧氏、切比雪夫距离。
二、点积与余弦相似度
1. 点积(内积)
定义:两向量的点积是分量乘积之和:
u⋅v=i=1∑nuivi
几何意义与公式推导
- 几何定义:u⋅v=∣u∣∣v∣cosθ(θ 为两向量夹角)。
- 推导:由余弦定理可得:
∣u−v∣2=∣u∣2+∣v∣2−2u⋅v
整理后得到 u⋅v=21(∣u∣2+∣v∣2−∣u−v∣2)。
示例:
u=[1,2] 和 v=[3,4] 的点积为 1×3+2×4=11。
2. 余弦相似度
定义:通过夹角余弦值衡量向量方向相似性:
CosSim(u,v)=∣u∣∣v∣u⋅v=cosθ
- 取值范围:[−1,1],值越大方向越接近。
- 特性:对向量长度不敏感(仅关注方向)。
几何解释:
- cosθ=1:两向量同向。
- cosθ=0:向量正交(垂直)。
- cosθ=−1:两向量反向。
示例:
u=[1,2] 和 v=[3,4] 的余弦相似度为:
12+22⋅32+4211=5⋅511≈0.98
三、应用示例
1. 特征向量表示
场景:机器学习中,数据(如图像、文本)被编码为特征向量。
- 图像:像素值展开为向量(如28×28图像→784维向量)。
- 文本:TF-IDF向量(词频-逆文档频率)表示文档内容。
- 示例:句子“猫喜欢牛奶”的TF-IDF向量可能为 [0.5,0.8,0.3,…](每个维度对应一个词的权重)。
2. 文本相似度计算
步骤:
- 向量化:用TF-IDF或词嵌入(Word2Vec)将文本转为向量。
- 计算余弦相似度:比较向量方向的接近程度。
案例:
- 句子A:“猫喜欢牛奶” → 向量 a
- 句子B:“狗爱喝水” → 向量 b
- 句子C:“猫讨厌水” → 向量 c
计算得:
CosSim(a,b)≈0.2,CosSim(a,c)≈0.7
结论:句子A与C更相似(均涉及“猫”和“液体”)。
3. 分类与聚类
- K-Means聚类:用欧氏距离衡量向量间的相似性。
- SVM分类:基于间隔最大化(依赖点积和范数计算)。
公式推导(SVM间隔):
分类超平面为 w⋅x+b=0,样本到超平面的距离为:
∣w∣∣w⋅x+b∣
四、总结
- 范数:衡量向量大小,不同范数对应不同几何意义。
- 距离度量:反映向量间的空间关系,与范数直接关联。
- 点积与余弦相似度:量化方向相似性,广泛应用于文本、图像等领域。
- 应用核心:将现实问题转化为向量运算,通过数学工具提取模式。