Z-score归一化:定义和例子

2,329 阅读2分钟

Z分数归一化是指对数据集中的每个数值进行归一化的过程,使所有数值的平均值为0,标准差为1。

我们使用以下公式对数据集中的每个值进行Z-score规范化。

新值 = (x - μ) / σ

其中。

  • x:原始值
  • μ:数据的平均值
  • σ:数据的标准偏差

下面的例子展示了如何在实践中对数据集进行Z-score归一化处理。

例子。执行Z-score归一化

假设我们有以下数据集。

使用计算器,我们可以发现该数据集的平均值是21.2,标准差是29.8

为了对数据集中的第一个值进行Z-score归一化,我们可以使用以下公式。

  • 新值 = (x - μ) / σ
  • 新值 = (3 - 21.2) / 29.8
  • 新值=-0.61

我们可以用这个公式对数据集中的每一个值进行Z-score归一化。

归一化值的平均值为0,归一化值的标准差为1

归一化的数值代表原始数值与平均值的标准差的数量。

比如说。

  • 数据集中的第一个值比平均值低0.61个标准差。
  • 数据集中的第二个值比平均值低0.54个标准差。
  • 数据集中的最后一个值是高于平均值的3.79个标准差。

进行这种归一化的好处是,数据集中明显的离群点(134)已经被转化,不再是一个巨大的离群点。

如果我们用这个数据集来拟合某种类型的机器学习模型,那么这个离群点将不再有它可能对模型拟合产生的那么大的影响。

其他资源

下面的教程提供了关于不同规范化技术的额外信息。

标准化与规范化。
如何将0和1之间的数据归一化
如何将0和100之间的数据归一化

The postZ-Score Normalization:定义和例子出现在统计学