Page 77 - 《软件学报》2020年第12期
P. 77
张鑫 等:自然进化策略的特征选择算法研究 3743
Table 2 Information of the methods for comparisons
表 2 对比算法的详细信息
算法名称 数据集划分 描述/发表年份
FSFOA 10-fold,2-fold,70%~30% 基于森林优化算法 [14] /2016
Rc-BBFA 70%~30% 基于收益成本的萤火虫算法 [15] /2017
UFSACO 70%~30% 基于 ACO 的无监督算法 [13] /2014
FS-NEIR 10-fold 近邻有效信息比 [11] /2013
PSO(4-2) 70%~30% 基于粒子群优化算法 [12] /2013
IFS-CoCo 10-flod 基于多种群协同进化 [21] /2010
NSM 10-fold 近邻软间隔 [43] /2010
[9]
SVM-FuzCoc 70%~30% 基于支持向量机 /2010
[8]
SFS,SBS,SFFS 70%~30% 贪婪爬山算法 /2010
HGAFS 2-fold 混合遗传算法 [44] /2007
ACOFSS+mRMR 10-flod 蚁群优化多目标特征选择 [45] /2015
FW-NSGA-II 10-flod 多目标演化特征选择算法 [16] /2018
DE-FLS 70%~30% 差分进化的特征选择方法 [17] /2018
ISEDBFO,ACBFO 10-flod 细菌觅食算法 [18] /2017
用于对比的特征选择算法有:Ghaemi 等人利用分类器准确率作为评估标准提出的 FSFOA [14] 、Hu 等人基
[9]
于邻居软间隔评估特征子集而提出的 NSM [43] 、Moustakidis 等人提出的 SVM-FuzCoc 、Huang 等人提出的
FS 混合基因算法(HGAFS) [44] 、Zhu 等人利用邻居有效信息率评价准则提出的 FS-NEIR [11] 、Tabakhi 等人基于
特征之间的相似性评估准则提出的 UFSACO [13] 、Xue 等人提出的将分类器准确率和特征子集规划作为评价准
则的 PSO(4-2) [12] 、Zhang 等人基于成本收益萤火虫算法提出的 Rc-BBFA [15] 、J. Derrac 等人基于协同进化算法
[8]
提出的 IFS-CoCo [21] 、贪婪爬山算法 SFFS 、Khan A 等人基于 mRMR 增强的蚁群多目标特征选择算法
ACOFSS+mRMR [45] 、Marwa 等人提出的混合过滤和包裹方法的多目标演化特征选择算法 FW-NSGA-II [16] 、
Hancer 等人基于差分进化提出的特征选择方法 DE-FLS [17] 、Chen 等人基于细菌觅食算法提出 ISEDBFO [18] 及
ACBFO [18] 等.
实验中,MCC-NES 算法相关的参数设定由表 3 给出 [46] .其中,在处理不同维度数据集时,设定了不同的种群
个数、子种群的大小以及子种群中个体的数量等.其原因是:随着数据维数的增加,出于计算资源的限制,相应减
少种群个数以及子种群中个体的数量;而增加子种群的个数是为了让每个种群能够尽可能多地探索局部搜索
空间,以此避免种群过早陷入局部最优解.同时,随着特征维数的增加,我们不断减小种群初始化参数,使得种群
在高维数据上能够发掘出更关键的特征信息.最后,通过给高维数据设定更高的重启阈值和迭代次数,以此让种
群在高维搜索空间中进行更充分的探索.
Table 3 Set of MCC-NESalgorithm parameters
表 3 MCC-NES 参数设置
Subpopulation Individuals Restart Initialization Historical Number of Number of
Dataset Feature
size m size λ threshold ϖ parameters α utilization β population σ iteration τ
Glass 9 3 36 7 0.0 0.6 6 30
Heart 13 4 36 7 0.0 0.6 6 30
Cleveland 13 4 36 7 0.0 0.6 6 30
Wine 13 4 36 7 0.0 0.6 6 30
Vehicle 18 4 36 7 0.0 0.6 5 30
Segmentatin 19 4 36 7 0.0 0.6 5 30
Ionosphere 34 6 36 8 −0.1 0.6 5 30
Dermatology 34 6 36 8 −0.1 0.6 5 30
Spambase 57 10 24 8 −0.1 0.6 4 35
Sonar 60 10 24 8 −0.2 0.6 4 35
Musk2 166 12 24 8 −0.3 0.6 4 35
LSVT 310 15 24 9 −0.4 0.6 4 40
SRBCT 2 308 25 12 9 −0.5 0.6 3 40
Arcene 10 000 50 12 10 −0.6 0.6 3 40
RNA-Seq 20 531 60 12 10 −0.6 0.6 2 40
Dorothea 100 000 160 12 10 −0.8 0.6 1 40