专题一:线性代数基础--向量(二)

561 阅读1分钟

一、范数与距离度量

1. 范数(Norm)

​定义​​:范数是向量空间中衡量向量长度的函数,满足非负性、齐次性和三角不等式。

(1)L1范数(曼哈顿范数)

v1=i=1nvi|\mathbf{v}|_1 = \sum_{i=1}^n |v_i|
  • ​几何意义​​:向量分量绝对值之和,对应“曼哈顿距离”(沿网格路径行走的总距离)。
  • ​示例​​:向量 [3,4][3, -4] 的L1范数为 3+4=7|3| + |-4| = 7

(2)L2范数(欧几里得范数)

v2=i=1nvi2|\mathbf{v}|_2 = \sqrt{\sum_{i=1}^n v_i^2}
  • ​几何意义​​:向量的欧几里得长度,即从原点到向量终点的直线距离。
  • ​示例​​:向量 [3,4][3, 4] 的L2范数为 32+42=5\sqrt{3^2 + 4^2} = 5

(3)Lp范数(一般化范数)

vp=(i=1nvip)1/p,p1|\mathbf{v}|_p = \left( \sum_{i=1}^n |v_i|^p \right)^{1/p}, \quad p \geq 1
  • ​性质​​:当 pp \to \infty 时,Lp范数退化为​​无穷范数​​:
    v=max(v1,v2,,vn)|\mathbf{v}|_\infty = \max(|v_1|, |v_2|, \dots, |v_n|)
  • ​示例​​:向量 [3,5,2][3, -5, 2] 的无穷范数为 55

2. 距离度量

​定义​​:两向量 u,v\mathbf{u}, \mathbf{v} 之间的距离是范数的扩展,对应空间中的“间隔”。

(1)曼哈顿距离(L1距离)

d1(u,v)=uv1=i=1nuivid_1(\mathbf{u}, \mathbf{v}) = |\mathbf{u} - \mathbf{v}|_1 = \sum_{i=1}^n |u_i - v_i|
  • ​应用场景​​:城市导航、图像处理中像素差异计算。
  • ​示例​​:u=[1,3]\mathbf{u} = [1, 3]v=[4,1]\mathbf{v} = [4, -1] 的曼哈顿距离为 14+3(1)=3+4=7|1-4| + |3-(-1)| = 3 + 4 = 7

(2)欧氏距离(L2距离)

d2(u,v)=uv2=i=1n(uivi)2d_2(\mathbf{u}, \mathbf{v}) = |\mathbf{u} - \mathbf{v}|_2 = \sqrt{\sum_{i=1}^n (u_i - v_i)^2}
  • ​应用场景​​:物理空间距离、KNN分类。
  • ​示例​​:u=[1,2]\mathbf{u} = [1, 2]v=[4,6]\mathbf{v} = [4, 6] 的欧氏距离为 (14)2+(26)2=5\sqrt{(1-4)^2 + (2-6)^2} = 5

(3)切比雪夫距离(L∞距离)

d(u,v)=uv=max(u1v1,,unvn)d_\infty(\mathbf{u}, \mathbf{v}) = |\mathbf{u} - \mathbf{v}|_\infty = \max(|u_1 - v_1|, \dots, |u_n - v_n|)
  • ​应用场景​​:棋盘上国王的移动步数(任意方向一步可达)。
  • ​示例​​:u=[1,5]\mathbf{u} = [1, 5]v=[3,2]\mathbf{v} = [3, 2] 的切比雪夫距离为 max(2,3)=3\max(2, 3) = 3

(4)闵可夫斯基距离(一般化距离)

dp(u,v)=(i=1nuivip)1/pd_p(\mathbf{u}, \mathbf{v}) = \left( \sum_{i=1}^n |u_i - v_i|^p \right)^{1/p}
  • ​统一性​​:当 p=1,2,p=1, 2, \infty 时,分别对应曼哈顿、欧氏、切比雪夫距离。

二、点积与余弦相似度

1. 点积(内积)

​定义​​:两向量的点积是分量乘积之和:

uv=i=1nuivi\mathbf{u} \cdot \mathbf{v} = \sum_{i=1}^n u_i v_i

几何意义与公式推导

  • ​几何定义​​:uv=uvcosθ\mathbf{u} \cdot \mathbf{v} = |\mathbf{u}| |\mathbf{v}| \cos\thetaθ\theta 为两向量夹角)。
  • ​推导​​:由余弦定理可得:
    uv2=u2+v22uv|\mathbf{u} - \mathbf{v}|^2 = |\mathbf{u}|^2 + |\mathbf{v}|^2 - 2\mathbf{u} \cdot \mathbf{v}
    整理后得到 uv=12(u2+v2uv2)\mathbf{u} \cdot \mathbf{v} = \frac{1}{2} (|\mathbf{u}|^2 + |\mathbf{v}|^2 - |\mathbf{u} - \mathbf{v}|^2)

​示例​​:
u=[1,2]\mathbf{u} = [1, 2]v=[3,4]\mathbf{v} = [3, 4] 的点积为 1×3+2×4=111 \times 3 + 2 \times 4 = 11


2. 余弦相似度

​定义​​:通过夹角余弦值衡量向量方向相似性:

CosSim(u,v)=uvuv=cosθ\text{CosSim}(\mathbf{u}, \mathbf{v}) = \frac{\mathbf{u} \cdot \mathbf{v}}{|\mathbf{u}| |\mathbf{v}|} = \cos\theta
  • ​取值范围​​:[1,1][-1, 1],值越大方向越接近。
  • ​特性​​:对向量长度不敏感(仅关注方向)。

​几何解释​​:

  • cosθ=1\cos\theta = 1:两向量同向。
  • cosθ=0\cos\theta = 0:向量正交(垂直)。
  • cosθ=1\cos\theta = -1:两向量反向。

​示例​​:
u=[1,2]\mathbf{u} = [1, 2]v=[3,4]\mathbf{v} = [3, 4] 的余弦相似度为:

1112+2232+42=11550.98\frac{11}{\sqrt{1^2 + 2^2} \cdot \sqrt{3^2 + 4^2}} = \frac{11}{\sqrt{5} \cdot 5} \approx 0.98

三、应用示例

1. 特征向量表示

​场景​​:机器学习中,数据(如图像、文本)被编码为特征向量。

  • ​图像​​:像素值展开为向量(如28×28图像→784维向量)。
  • ​文本​​:TF-IDF向量(词频-逆文档频率)表示文档内容。
  • ​示例​​:句子“猫喜欢牛奶”的TF-IDF向量可能为 [0.5,0.8,0.3,][0.5, 0.8, 0.3, \dots](每个维度对应一个词的权重)。

2. 文本相似度计算

​步骤​​:

  1. ​向量化​​:用TF-IDF或词嵌入(Word2Vec)将文本转为向量。
  2. ​计算余弦相似度​​:比较向量方向的接近程度。

​案例​​:

  • 句子A:“猫喜欢牛奶” → 向量 a\mathbf{a}
  • 句子B:“狗爱喝水” → 向量 b\mathbf{b}
  • 句子C:“猫讨厌水” → 向量 c\mathbf{c}

计算得:

CosSim(a,b)0.2,CosSim(a,c)0.7\text{CosSim}(\mathbf{a}, \mathbf{b}) \approx 0.2, \quad \text{CosSim}(\mathbf{a}, \mathbf{c}) \approx 0.7

结论:句子A与C更相似(均涉及“猫”和“液体”)。


3. 分类与聚类

  • ​K-Means聚类​​:用欧氏距离衡量向量间的相似性。
  • ​SVM分类​​:基于间隔最大化(依赖点积和范数计算)。

​公式推导(SVM间隔)​​:
分类超平面为 wx+b=0\mathbf{w} \cdot \mathbf{x} + b = 0,样本到超平面的距离为:

wx+bw\frac{|\mathbf{w} \cdot \mathbf{x} + b|}{|\mathbf{w}|}

四、总结

  • ​范数​​:衡量向量大小,不同范数对应不同几何意义。
  • ​距离度量​​:反映向量间的空间关系,与范数直接关联。
  • ​点积与余弦相似度​​:量化方向相似性,广泛应用于文本、图像等领域。
  • ​应用核心​​:将现实问题转化为向量运算,通过数学工具提取模式。