常用归一化方法
1). 线性归一化,线性归一化会把输入数据都转换到[0 1]的范围,公式如下
该方法实现对原始数据的等比例缩放,其中Xnorm为归一化后的数据,X为原始数据,Xmax、Xmin分别为原始数据集的最大值和最小值。
优点:通过利用变量取值的最大值和最小值将原始数据转换为界于某一特定范围的数据,从 而消除量纲和数量级的影响
缺点:由于极值化方法在对变量无量纲化过程中仅仅与该变量的最大值和最小值这两个极端 值有关,而与其他取值无关,这使得该方法在改变各变量权重时过分依赖两个极端取值。 零均值归一化:
2). 0均值标准化,0均值归一化方法将原始数据集归一化为均值为0、方差1的数据集,归一化公式如下:
其中,μ、σ分别为原始数据集的均值和方法。该种归一化方式要求原始数据的分布可以近似为高斯分布,否则归一化的效果会变得很糟糕。
优点:去量纲化
缺点:这种归一化方式要求原始数据的分布可以近似为高斯分布,否则归一化的效果会变得 很糟糕。