企业级大数据技术与应用:标准差

66 阅读1分钟

标准差

标准差的概念

标准差(Standard Deviation)是反映一组数据离散程度的一种量化形式,是表示精确度的重要指标。标准差常称均方差,是离均差平方的算术平均数的平方根,用 σ 表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。

  • 一个较大的标准差代表大部分数值与其平均值之间差异较大,一个较小的标准差代表这些数值较接近其平均值。
  • 假设有一组数据 xi​,i∈[1,N],其算术平均值是 μ,则这组数据其标准差的计算公式为:

Snipaste_2025-11-13_19-03-33.png

方差是实际值与期望值之差平方的平均值,而标准差是方差算术平方根。

标准差的计算方法

  1. 使用 numpy 库计算标准差numpy.std(arr, axis=None, dtype=None)
  2. 使用 pandas 库计算标准差series.std(axis=None)