Page 77 - 《软件学报》2020年第12期
P. 77

张鑫  等:自然进化策略的特征选择算法研究                                                            3743


                                 Table 2    Information of the methods for comparisons
                                          表 2   对比算法的详细信息
                            算法名称           数据集划分                描述/发表年份
                             FSFOA     10-fold,2-fold,70%~30%  基于森林优化算法  [14] /2016
                            Rc-BBFA         70%~30%      基于收益成本的萤火虫算法       [15] /2017
                            UFSACO          70%~30%       基于 ACO 的无监督算法    [13] /2014
                            FS-NEIR          10-fold         近邻有效信息比    [11] /2013
                            PSO(4-2)        70%~30%         基于粒子群优化算法     [12] /2013
                            IFS-CoCo         10-flod        基于多种群协同进化     [21] /2010
                             NSM             10-fold           近邻软间隔  [43] /2010
                                                                        [9]
                           SVM-FuzCoc       70%~30%          基于支持向量机 /2010
                                                                       [8]
                          SFS,SBS,SFFS      70%~30%           贪婪爬山算法 /2010
                             HGAFS           2-fold           混合遗传算法   [44] /2007
                         ACOFSS+mRMR         10-flod      蚁群优化多目标特征选择      [45] /2015
                           FW-NSGA-II        10-flod      多目标演化特征选择算法      [16] /2018
                            DE-FLS          70%~30%       差分进化的特征选择方法      [17] /2018
                         ISEDBFO,ACBFO       10-flod          细菌觅食算法   [18] /2017
             用于对比的特征选择算法有:Ghaemi 等人利用分类器准确率作为评估标准提出的 FSFOA                          [14] 、Hu 等人基
                                                                              [9]
         于邻居软间隔评估特征子集而提出的 NSM               [43] 、Moustakidis 等人提出的 SVM-FuzCoc 、Huang 等人提出的
         FS 混合基因算法(HGAFS)     [44] 、Zhu 等人利用邻居有效信息率评价准则提出的 FS-NEIR             [11] 、Tabakhi 等人基于
         特征之间的相似性评估准则提出的 UFSACO              [13] 、Xue 等人提出的将分类器准确率和特征子集规划作为评价准
         则的 PSO(4-2) [12] 、Zhang 等人基于成本收益萤火虫算法提出的 Rc-BBFA          [15] 、J. Derrac 等人基于协同进化算法
                                            [8]
         提出的 IFS-CoCo   [21] 、贪婪爬山算法 SFFS 、Khan A 等人基于 mRMR 增强的蚁群多目标特征选择算法
         ACOFSS+mRMR   [45] 、Marwa 等人提出的混合过滤和包裹方法的多目标演化特征选择算法 FW-NSGA-II                     [16] 、
         Hancer 等人基于差分进化提出的特征选择方法 DE-FLS              [17] 、Chen 等人基于细菌觅食算法提出 ISEDBFO        [18] 及
         ACBFO [18] 等.
             实验中,MCC-NES 算法相关的参数设定由表 3 给出             [46] .其中,在处理不同维度数据集时,设定了不同的种群
         个数、子种群的大小以及子种群中个体的数量等.其原因是:随着数据维数的增加,出于计算资源的限制,相应减
         少种群个数以及子种群中个体的数量;而增加子种群的个数是为了让每个种群能够尽可能多地探索局部搜索
         空间,以此避免种群过早陷入局部最优解.同时,随着特征维数的增加,我们不断减小种群初始化参数,使得种群
         在高维数据上能够发掘出更关键的特征信息.最后,通过给高维数据设定更高的重启阈值和迭代次数,以此让种
         群在高维搜索空间中进行更充分的探索.

                                   Table 3    Set of MCC-NESalgorithm parameters
                                          表 3   MCC-NES 参数设置
                            Subpopulation  Individuals   Restart   Initialization  Historical   Number of   Number of
            Dataset  Feature
                               size m    size λ   threshold ϖ  parameters α  utilization β  population σ   iteration τ
             Glass     9        3         36        7         0.0       0.6       6         30
             Heart     13       4         36        7         0.0       0.6       6        30
            Cleveland  13        4        36        7         0.0       0.6       6         30
             Wine      13        4        36        7         0.0       0.6       6         30
            Vehicle    18        4        36        7         0.0       0.6       5         30
           Segmentatin  19       4        36        7         0.0       0.6       5         30
           Ionosphere  34        6        36        8        −0.1       0.6       5         30
           Dermatology  34       6        36        8        −0.1       0.6       5         30
            Spambase   57       10        24        8        −0.1       0.6       4         35
             Sonar     60       10        24        8        −0.2       0.6       4         35
             Musk2    166       12        24        8        −0.3       0.6       4         35
             LSVT     310       15        24        9        −0.4       0.6       4         40
            SRBCT     2 308     25        12        9        −0.5       0.6       3         40
             Arcene  10 000     50        12        10       −0.6       0.6       3         40
            RNA-Seq  20 531     60        12        10       −0.6       0.6       2         40
            Dorothea  100 000   160       12        10       −0.8       0.6       1         40
   72   73   74   75   76   77   78   79   80   81   82