数据的归一化

194 阅读1分钟

☞普通的数据归一化

1、数据归一化:将所有的数据映射到同一尺度

2、最值归一化:将所有数据映射到0~1之间【适用于分布有明显边界的情况,例如成绩分布在0~100之间】公式如下:

部分代码如下:
(*对数据处理时,以列为单位,表示一个特征值,分别归一化处理)

3、均值方差归一化:将所有数据归一到均值为0,方差为1 的分布中【适用于分布无明显边界的数据,例如居民收入水平】公式如下:(mean为平均值,S表示方差)

部分代码如下:

☞sscikit_learn中的数据归一化

1、

(其中用测试数据来跟归一化后的训练数据进行处理)

2、在sklearn中,数据归一化的处理流程如下

部分代码如下:

【PS:本人为机器学习初学者,有不对之处,还请多多指教】