问:写出最小最大归一化公式,并对以下数据集进行最小最大归一化。
x={6.3,9.2,-0.8,0.2,3.6}
答:
x_{min}=-0.8
x_{max}=9.2
将每个数据点应用最小最大归一化公式:
$x'_1={6.3-(-0.8)}/{9.2-(-0.8)}=0.71
$x'_2={9.2-(-0.8)}/{9.2-(-0.8)}=1.0
$x'_3={-0.8-(-0.8)}/{9.2-(-0.8)}=0
$x'_4={0.2-(-0.8)}/{9.2-(-0.8)}=0.1
$x'_5={3.6-(-0.8)}/{9.2-(-0.8)}=0.44
归一化定义:
- 归一化(Normalization): 将一列数据变化到某个固定区间(范围)中, 通常 这个区间是[0,1],广义的讲, 可以是各种区间, 比如映射到[0,1] 也可以映射到其他范围,在图像中可能会映射到[0, 255], 其他情况也有可能映射到[-1,1];
- 最大值最小值的归一化,范围[0,1]
- 均值归一化(Mean normalization), 范围[-1,1]
为什么要对数据进行归一化处理?
归一化化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。
首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。