(A,B)---6*30*2---(0,1)(1,0)
让A是结构5,让B全是0。收敛误差为7e-4,收敛199次取迭代次数平均值,得到迭代次数为129535.3
(A,B)---6*30*2(5)---(0,1)(1,0)
然后让A分别是0,1,2,3,4,但是初始权重是5的收敛权重,收敛误差为7e-4,先用5收敛,得到收敛权重,每个结构用此权重再收敛,共199次,
得到迭代次
0 | 89344.08 |
1 | 89122.35 |
2 | 89385.8 |
3 | 89574.25 |
4 | 89199.59 |
这几个值几乎是相同的,训练集A-B矩阵的列可自由变换的假设在这种情况下依然适用。这几个值约为5迭代次数的69%,所以用5的收敛权重去分类0,1,2,3,4可以节约31%的运算。
同样再用5的收敛权重去分类11,17,23,29,35.得到迭代次数为
11 | 3 |
17 | 5 |
23 | 7 |
29 | 9 |
35 | 11 |
随着点与5的距离的增加,迭代次数变大,但是与129535.3相比可以近似认为迭代次数都相同约为1,虽然这种近似将导致误差但简化了计算。所以当点与5同列时迭代次数为1,节约100%的运算。
第三种情况
让A分别是10,15,20,25,30,同样用5的收敛权重作初始权重,得到迭代次数为
10 | 89172.89 |
15 | 89424.72 |
20 | 89387.52 |
25 | 89253.66 |
30 | 89293.71 |
这组数据和0,1,2,3,4的数据很相近,所以5的收敛权重把平面分成两类,同列的迭代次数为1,不同列的迭代次数减少31%。
导出结构5某次第一层6*30的初始权重和收敛权重
初始 | 收敛 | |||||||||
1 | 0.071 | 0.071 | 31 | 0.069 | 0.069 | 61 | -0.04 | -0.04 | ||
2 | 0.023 | 0.023 | 32 | 0.013 | 0.013 | 62 | -0.04 | -0.04 | ||
3 | 0.079 | 0.079 | 33 | 0.095 | 0.095 | 63 | -0.04 | -0.04 | ||
4 | 0.017 | 0.017 | 34 | -0.06 | -0.06 | 64 | -0.03 | -0.03 | ||
5 | -0.03 | -0.03 | 35 | 0.075 | 0.075 | 65 | -0.03 | -0.03 | ||
6 | 0.049 | 0.049 | 36 | 0.037 | 0.037 | 66 | -0.06 | -0.06 | ||
7 | -0.08 | -0.08 | 37 | 0.087 | 0.087 | 67 | -0.05 | -0.05 | ||
8 | -0.06 | -0.06 | 38 | 0.053 | 0.053 | 68 | -0.02 | -0.02 | ||
9 | 0.041 | 0.041 | 39 | 0.067 | 0.067 | 69 | 0.095 | 0.095 | ||
10 | 0.085 | 0.085 | 40 | 0.031 | 0.031 | 70 | 0.041 | 0.041 | ||
11 | -0.06 | -0.06 | 41 | 0.017 | 0.017 | 71 | -0.07 | -0.07 | ||
12 | -0.07 | -0.07 | 42 | 0.041 | 0.041 | 72 | 0.047 | 0.047 | ||
13 | -0.09 | -0.09 | 43 | 0.077 | 0.077 | 73 | 0.009 | 0.009 | ||
14 | -0.05 | -0.05 | 44 | -0.08 | -0.08 | 74 | -0.09 | -0.09 | ||
15 | 0.085 | 0.085 | 45 | -0.03 | -0.03 | 75 | -0.06 | -0.06 | ||
16 | -0.09 | -0.09 | 46 | 0.041 | 0.041 | 76 | 0.085 | 0.085 | ||
17 | 0.005 | 0.005 | 47 | -0.01 | -0.01 | 77 | 0.055 | 0.055 | ||
18 | 0.075 | 0.075 | 48 | 0.049 | 0.049 | 78 | -0.03 | -0.03 | ||
19 | -0.1 | -0.1 | 49 | -0.09 | -0.09 | 79 | 0.091 | 0.091 | ||
20 | -0.05 | -0.05 | 50 | -0.06 | -0.06 | 80 | 0.029 | 0.029 | ||
21 | -0.08 | -0.08 | 51 | -0.01 | -0.01 | 81 | -0.08 | -0.08 | ||
22 | 0.005 | 0.005 | 52 | 0.009 | 0.009 | 82 | -0.05 | -0.05 | ||
23 | -0.01 | -0.01 | 53 | -0.03 | -0.03 | 83 | 0.075 | 0.075 | ||
24 | -0.07 | -0.07 | 54 | 0.053 | 0.053 | 84 | -0.02 | -0.02 | ||
25 | -0.05 | -0.05 | 55 | 0.067 | 0.067 | 85 | -0.02 | -0.02 | ||
26 | -0.06 | -0.06 | 56 | 0.063 | 0.063 | 86 | 0.049 | 0.049 | ||
27 | -0.06 | -0.06 | 57 | -0.06 | -0.06 | 87 | 0.057 | 0.057 | ||
28 | -0.07 | -0.07 | 58 | 0.095 | 0.095 | 88 | 0.027 | 0.027 | ||
29 | 0.029 | 0.029 | 59 | -0.03 | -0.03 | 89 | 0.083 | 0.083 | ||
30 | -0.09 | -0.09 | 60 | -0 | -0 | 90 | -0.08 | -0.08 |
91 | -0.02 | -0.02 | 121 | 0.065 | 0.065 | 151 | 0.061 | 1.311 | ||
92 | 0.007 | 0.007 | 122 | 0.003 | 0.003 | 152 | 0.073 | -0.82 | ||
93 | -0 | -0 | 123 | 0.089 | 0.089 | 153 | -0.06 | -0.8 | ||
94 | 0.005 | 0.005 | 124 | 0.003 | 0.003 | 154 | 0.013 | -0.93 | ||
95 | 0.001 | 0.001 | 125 | -0.01 | -0.01 | 155 | -0.04 | -1.8 | ||
96 | -0.01 | -0.01 | 126 | 0.081 | 0.081 | 156 | 0.069 | 1.754 | ||
97 | -0.06 | -0.06 | 127 | -0.03 | -0.03 | 157 | 0.049 | 0.013 | ||
98 | -0.08 | -0.08 | 128 | 0.089 | 0.089 | 158 | 0.009 | 1.378 | ||
99 | 0.029 | 0.029 | 129 | -0.04 | -0.04 | 159 | -0.03 | -0.43 | ||
100 | 0.001 | 0.001 | 130 | -0 | -0 | 160 | 0.061 | -1.04 | ||
101 | 0.055 | 0.055 | 131 | 0.025 | 0.025 | 161 | 0.091 | 2.423 | ||
102 | 0.049 | 0.049 | 132 | 0.011 | 0.011 | 162 | -0.09 | -1.09 | ||
103 | 0.085 | 0.085 | 133 | -0.04 | -0.04 | 163 | 0.077 | 0.825 | ||
104 | -0.07 | -0.07 | 134 | 0.061 | 0.061 | 164 | 0.015 | 1.123 | ||
105 | -0.03 | -0.03 | 135 | -0.06 | -0.06 | 165 | -0.04 | 0.13 | ||
106 | 0.061 | 0.061 | 136 | 0.023 | 0.023 | 166 | -0.08 | -1.54 | ||
107 | 0.091 | 0.091 | 137 | 0.087 | 0.087 | 167 | 0.037 | 0.461 | ||
108 | 0.047 | 0.047 | 138 | 0.023 | 0.023 | 168 | 0.085 | 1.265 | ||
109 | 0.071 | 0.071 | 139 | 0.045 | 0.045 | 169 | 0.081 | 1.974 | ||
110 | 0.071 | 0.071 | 140 | -0.06 | -0.06 | 170 | -0.07 | -1.28 | ||
111 | 0.079 | 0.079 | 141 | -0.08 | -0.08 | 171 | 0.059 | -0.23 | ||
112 | -0.04 | -0.04 | 142 | -0 | -0 | 172 | -0.04 | -0.77 | ||
113 | 0.033 | 0.033 | 143 | -0.03 | -0.03 | 173 | -0.02 | -1.19 | ||
114 | 0.065 | 0.065 | 144 | 0.003 | 0.003 | 174 | -0.04 | -1.01 | ||
115 | -0.09 | -0.09 | 145 | -0.01 | -0.01 | 175 | 0.013 | 1.085 | ||
116 | 0.041 | 0.041 | 146 | -0.02 | -0.02 | 176 | -0 | -1.16 | ||
117 | 0.097 | 0.097 | 147 | 0.081 | 0.081 | 177 | -0.06 | -1.81 | ||
118 | -0.03 | -0.03 | 148 | 0.091 | 0.091 | 178 | 0.051 | 1.706 | ||
119 | -0.01 | -0.01 | 149 | 0.095 | 0.095 | 179 | 0.007 | -0.45 | ||
120 | -0.04 | -0.04 | 150 | 0.091 | 0.091 | 180 | -0.07 | -0.97 |
画图
只有151-180的30个点有变化,其余的150个点完全没有变化,所以显然30个数对应一列,151-180对应第6列。
所以如果点与结构5同列则收敛权重的波形应该是相近的,而如果不同列将这个波形移动到其他列的成本是总运算量的约69%。