( A, B )---6*30*2---( 1, 0 )( 0, 1 )
做一个网络分类A和B,让训练集A有6张图片
0 | 1 | 1 | 1 | 0 | 0 | 0 |
1 | 0 | 1 | 0 | 0 | 0 | 0 |
2 | 0 | 0 | 0 | 0 | 0 | 0 |
3 | 0 | 0 | 0 | 0 | 0 | 0 |
4 | 0 | 0 | 0 | 0 | 0 | 0 |
5 | 0 | 0 | 0 | 0 | 0 | 0 |
这6张图片按照0,1,2,3,4,5的顺序循环进样。
训练集B的6张图片全是0。让测试集也只有6张图片,分别为
0 | 1 | 0 | 0 | 0 | 0 | 0 |
1 | 0 | 1 | 0 | 0 | 0 | 0 |
2 | 0 | 0 | 1 | 0 | 0 | 0 |
3 | 0 | 0 | 0 | 1 | 0 | 0 |
4 | 0 | 0 | 0 | 0 | 1 | 0 |
5 | 0 | 0 | 0 | 0 | 0 | 1 |
收敛误差为7e-4,收敛199次,统计A分类准确率的平均值,得到分类准确率为
1 | 2 | 3 | 4 | 5 | 6 | |
1 | 0.8106 | |||||
1 | 0.9957 | |||||
1 | 0.8101 | |||||
1 | 0.4385 | |||||
1 | 0.438 | |||||
1 | 0.4389 |
第1,3列的分类准确率相同,第2列最大。第4,5,6列是全0列,对分类没影响,不考虑。
现在变换训练集的行和列,观察对分类准确率的影响
得到分类准确率的数据为
1 | 0.8106 | 0.9957 | 0.8101 | 0.4385 | 0.438 | 0.4389 | |
2 | 0.8092 | 0.9957 | 0.81 | 0.4412 | 0.4395 | 0.4375 | |
3 | 0.803 | 0.9951 | 0.8032 | 0.4007 | 0.399 | 0.3988 | |
4 | 0.8085 | 0.9955 | 0.8086 | 0.4233 | 0.4238 | 0.4229 | |
5 | 0.8096 | 0.9957 | 0.81 | 0.4391 | 0.4382 | 0.437 | |
6 | 0.9952 | 0.8032 | 0.8046 | 0.3997 | 0.4003 | 0.399 | |
7 | 0.8096 | 0.9957 | 0.4377 | 0.8097 | 0.4387 | 0.4379 |
前5组数据几乎是相同的,前3列都是
0.8106 | 0.9957 | 0.8101 |
所以行变换对分类准确率没有影响。
第6组,因为第1,2列顺序调换,因此数据为
0.9952 | 0.8032 | 0.8046 |
第7组,3,4列调换因此数据为
0.8096 | 0.9957 | 0.4377 | 0.8097 |
第6,7组只是顺序发生变化,但数值没有变化,所以列变换对分类准确率也没有影响。
所以如果行列自由变换对分类准确率没有影响,有理由猜测导致分类准确率不同的原因应该是结构本身的对称性,
4(4a4-1)=3a6+3a4+2*3a1
4a4-1可以得到1个3a6,1个3a4,2个3a1
现在分别测3a1,4,6在相同条件下的分类准确率
得到
1 | 0.4384 | 0.9975 | 0.8871 | 0.4371 | 0.4403 | 0.4385 | |
4 | 0.9826 | 0.9988 | 0.9827 | 0.4386 | 0.4371 | 0.4411 | |
6 | 0.9542 | 0.9539 | 0.9542 | 0.4761 | 0.4755 | 0.4772 |
结构3a6的值
0.9542 | 0.9539 | 0.9542 |
1,2,3列几乎相同,
3a1的值
0.4384 | 0.9975 | 0.8871 |
第2列比第3列的大
3a4的值
0.9826 | 0.9988 | 0.9827 |
尽管3a4每列都只有1个1,但因为对称性不同,1,3列值相同,而第2列的值更大些,现在把这些值相加
1 | 2 | 3 | |
0.9542 | 0.9539 | 0.9542 | |
0.4384 | 0.9975 | 0.8871 | |
0.8871 | 0.9975 | 0.4384 | |
0.9826 | 0.9988 | 0.9827 | |
平均 | 0.8155 | 0.9869 | 0.8156 |
实测 | 0.8085 | 0.9955 | 0.8086 |
计算值体现了实测值的对称性,并且数值本身也比较接近。
再计算一组,4a10的分类准确率为
0.9343 | 0.9344 | 0.9347 | 0.9976 | 0.3988 | 0.399 |
因为
4a10-1等于3个3a4和1个3a6
因为3a4和3a6的准确率都已知,因此代入
0.9542 | 0.9539 | 0.9542 | 0.4761 | |
0.4386 | 0.9826 | 0.9827 | 0.9988 | |
0.9826 | 0.4386 | 0.9827 | 0.9988 | |
0.9826 | 0.9827 | 0.4386 | 0.9988 | |
平均 | 0.8395 | 0.8394 | 0.8395 | 0.8681 |
实测 | 0.9343 | 0.9344 | 0.9347 | 0.9976 |
尽管数值相差较大,但顺序是一致的。这可以解释为什么4a10每列都只有1个1,但分类准确率却不相同。
所以有理由猜测分类准确率也是符合结构加法的。