常见归一化方法

181 阅读1分钟

Min-Max Normalization

对原始数据的线性变换,使得结果值映射到[a,b]之间

xi=xixminxmaxxmin(ba)+a x_i^{\prime} = \frac{x_i - x_{min}}{x_{max} - x_{min}}(b-a) + a

如果是映射到[0,1]之间,则

xi=xixminxmaxxmin x_i^{\prime} = \frac{x_i - x_{min}}{x_{max} - x_{min}}

这种归一化方式容易受最大值最小值的影响,实际使用中一般采用经验常量来代替Max和Min

Z-score Normalization

经过处理后的数据服从标准正态分布

xi=ximean(x)std(x) x_i^{\prime} = \frac{x_i - mean(x)}{std(x)}

Decimal scaling

xi=xi/10j, smallest j s.t.  max(x)<xi x_i^{\prime} = x_i / 10^{j}, \ smallest \ j \ s.t. \ \ max(x^{\prime}) < x_i

Log Scaling

一般形式

xi=log10xi x_i^{\prime} = log_{10}x_i

如果要映射到[0,1],则

xi=log10(Xi)log10max(xi) x_i^{\prime} = \frac{log_{10}(X_i)}{log_{10}max(x_i)}