Page 80 - 《软件学报》2020年第12期
P. 80
3746 Journal of Software 软件学报 Vol.31, No.12, December 2020
3.6 实验结果对比分析
本文提出的特征选择算法 MCC-NES 是在 NES 的基础上使用了一些优化策略,为了验证这些策略的有效
性,我们对比了原始 NES,NES+F(在 NES 的基础上使用新的适应度函数),NES+CC(在 NES 基础上使用合作协同
进化策略),MNES(基于 NES 的分布式多种群进化策略),MNES+RE(在 MNES 基础上使用重启策略)在 5 个数据
集(按照特征维数分别代表低维数据、中维数据、高维数据以及更高维度数据)上的表现,实验中使用 1-NN 分
类器,实验结果由表 4 给出.表 4 中的粗体部分对应了该组实验中最佳分类准确率(CA)和维度缩减率(DR).如表
4 中数据所示:在 NES 的基础上,通过采用相关的优化策略,可以有效地提高算法的性能.分析其原因分别为:在
引入新的适应度函数后,因为综合考虑了维度缩减的影响,因此大幅提升了算法的 DR 值;在采用子种群合作协
同进化策略后,通过将原始特征集合划分成多个子块进行协同进化,使得种群能更充分地探索局部搜索空间并
发掘出关键信息,因此大幅提升了算法的分类准确率和维度压缩率;通过使用多种群分布式进化策略,实现多个
种群并行搜索,更大程度地在搜索空间进行探索,因此提升了算法的性能;而通过引入种群重启策略后,让种群
能够跳出局部最优解,并不断地将表现差的种群向表现好的种群进行转移,因此对分类准确率也有一定的改进.
Table 4 Classification accuracy and dimensional reduction based on various optimization strategies of NES
表 4 基于 NES 各种优化策略的分类准确率和维度缩减率
Cleveland CA (%) DR (%) Classifier
MCC-NES 67.11(70%~30%) 74.61 1-NN
NES 58.89(70%~30%) 61.54 1-NN
NES+F 57.78(70%~30%) 69.23 1-NN
NES+CC 63.33(70%~30%) 73.92 1-NN
MNES+RE 62.22(70%~30%) 53.85 1-NN
MNES 61.11(70%~30%) 69.23 1-NN
Ionosphere CA (%) DR (%) Classifier
MCC-NES 98.58(70%~30%) 75.88 1-NN
NES 94.34(70%~30%) 64.71 1-NN
NES+F 93.40(70%~30%) 72.47 1-NN
NES+CC 95.28(70%~30%) 73.41 1-NN
MNES+RE 96.23(70%~30%) 73.53 1-NN
MNES 95.28(70%~30%) 73.53 1-NN
Sonar CA (%) DR (%) Classifier
MCC-NES 97.93(70%~30%) 78.0 1-NN
NES 92.06(70%~30%) 61.67 1-NN
NES+F 92.06(70%~30%) 66.67 1-NN
NES+CC 95.24(70%~30%) 76.67 1-NN
MNES+RE 94.71(70%~30%) 65.0 1-NN
MNES 93.65(70%~30%) 63.33 1-NN
Musk2 CA (%) DR (%) Classifier
MCC-NES 97.01(70%~30%) 80.28 1-NN
NES 85.24(70%~30%) 61.67 1-NN
NES+F 86.13(70%~30%) 72.67 1-NN
NES+CC 94.73(70%~30%) 76.67 1-NN
MNES+RE 94.71(70%~30%) 77.10 1-NN
MNES 93.65(70%~30%) 72.33 1-NN
Arcene CA (%) DR (%) Classifier
MCC-NES 97.50(70%~30%) 98.44 1-NN
NES 91.67(70%~30%) 72.83 1-NN
NES+F 91.67(70%~30%) 75.97 1-NN
NES+CC 95.83(70%~30%) 98.27 1-NN
MNES+RE 93.37(70%~30%) 79.67 1-NN
MNES 93.33(70%~30%) 69.35 1-NN
同时,我们将 MCC-NES 算法与其他 17 个特征选择算法进行比较.对比算法详情已由表 2 给出.表 5~表 7
依据数据集维度大小的划分总结了全部实验结果,并用粗体标出了不同分类器对应的表现最佳的分类准确率
和维度缩减率.按照文献[14]中给出的一般做法,为了确保对比实验结果的准确性,部分数据结果均采用了文献
[14−18,21,45]中公开发表的实验结果.实验中使用的分类器主要包括 KNN(1-NN,3-NN,5-NN),CART 和 Rbf-
SVM.