Z分数归一化是指对数据集中的每个数值进行归一化的过程,使所有数值的平均值为0,标准差为1。
我们使用以下公式对数据集中的每个值进行Z-score规范化。
新值 = (x - μ) / σ
其中。
- x:原始值
- μ:数据的平均值
- σ:数据的标准偏差
下面的例子展示了如何在实践中对数据集进行Z-score归一化处理。
例子。执行Z-score归一化
假设我们有以下数据集。
使用计算器,我们可以发现该数据集的平均值是21.2,标准差是29.8。
为了对数据集中的第一个值进行Z-score归一化,我们可以使用以下公式。
- 新值 = (x - μ) / σ
- 新值 = (3 - 21.2) / 29.8
- 新值=-0.61
我们可以用这个公式对数据集中的每一个值进行Z-score归一化。
归一化值的平均值为0,归一化值的标准差为1。
归一化的数值代表原始数值与平均值的标准差的数量。
比如说。
- 数据集中的第一个值比平均值低0.61个标准差。
- 数据集中的第二个值比平均值低0.54个标准差。
- …
- 数据集中的最后一个值是高于平均值的3.79个标准差。
进行这种归一化的好处是,数据集中明显的离群点(134)已经被转化,不再是一个巨大的离群点。
如果我们用这个数据集来拟合某种类型的机器学习模型,那么这个离群点将不再有它可能对模型拟合产生的那么大的影响。
其他资源
下面的教程提供了关于不同规范化技术的额外信息。
标准化与规范化。
如何将0和1之间的数据归一化
如何将0和100之间的数据归一化
The postZ-Score Normalization:定义和例子出现在统计学上。