余弦相似度-1.认识余弦相似度（Cosine Similarity）是一种衡量两个非零向量之间方向相似性的数学方法，它通

余弦相似度（Cosine Similarity）是一种衡量两个非零向量之间方向相似性的数学方法，它通过计算这两个向量夹角的余弦值来判断它们是否“指向相近的方向”。

因此，余弦相似度的取值范围是：

[−1, 1]

在文本、推荐系统等实际应用中，向量分量通常为非负数（如词频、TF-IDF权重），此时余弦相似度范围为 [0, 1] 。

句子A：这只皮靴号码大了。那只号码合适。
句子B：这只皮靴号码不小，那只更合适。

→ 结果接近1，说明两句话语义较相似。

特别地，像 OpenAI 的 embedding 模型会将所有向量归一化为单位长度（范数=1） ，此时余弦相似度简化为直接计算点积，大幅提升计算效率。

余弦相似度衡量的是“方向是否一致”，而不是“距离有多近”。

这使得它在处理高维稀疏数据（如文本）时非常有效且高效。