Page 52 - 《软件学报》2020年第12期
P. 52

3718                                Journal of Software  软件学报 Vol.31, No.12, December 2020

         偏好算法其非支配解的数量急剧增长,削弱了 Pareto 支配关系对种群的选择压力,可能导致算法的收敛性恶化.
         同时,在高维空间中,决策者较难直接给定确切偏好信息,难以获取偏好区域                          [19] .因此,本文提出基于偏好向量引
         导的高维目标协同进化算法:首先,通过计算个体的收益标量扩展函数值,将种群映射到目标空间;随后,根据偏
         好区域选择策略确定两个临时参考点,分别获取距离两个临时参考点收益标量扩展函数值最小的个体,从而确
         定偏好集(goal vectors)上下界,构建偏好区域,以此减少决策者认知负担以及主观影响;最后,利用协同进化机制
         中适应值截断选取机制增加选择压力,引导种群向偏好区域收敛.本文提出的基于收益标量扩展函数的偏好区
         域选择策略具有较好移植性,能与多种类型的多目标进化算法相结合.
         1    相关工作


         1.1   协同进化机制
                                                   Fleming 等人提出一种多偏好驱动下的协同进化算法
                父代种群,                          (preference-inspired co-evolutionary algorithms for  many-
               父代目标向量                                                      [20]
                         适应值赋值                 objective optimization,简称 PICEA)  ,该算法的主要思想是:将
                         截断选择
                                               多目标进化算法与协同机制结合,利用适应度截选机制提高种
             遗传变异    μ+λ精英选择   混合种群,           群选择压力,实现偏好与种群协同进化,如图 1 所示               [20] .需要说明
              操作              混合目标向量
                                               的是:随机偏好不是由决策者提供的参考信息,而是用来和候选
                                               解集比较的一种方式.这是经典的(μ+λ)精英选择框架,S 是含有
                子代种群,   父子代混合                  N 个候选解的集合,G 是含有 N Goal 个目标向量的集合.首先,初始
               子代目标向量
                                               化种群及目标向量,通过交叉变异产生子代种群,并根据种群范
           Fig.1   (μ+λ) elite selection framework   围内随机产生子代目标向量;然后,将父代种群与子代种群合并,
               图 1   (μ+λ)精英选择框架               父代目标向量与子代目标向量合并,形成混合种群及混合目标

                                               向量,并计算目标向量与个体各自的适应度值,按照适应度值截
                                               断选择,形成新的父代种群及父代目标向量混合种群及混合
                                               目标.
         1.2   偏好信息的表达方法

             关于决策者偏好信息的表达方式大致可分为以下几类                    [19,21] .
             (1)  偏好参考点:在各个目标维度上由决策者的期望值构成的点,其在每个维度上的值均由决策者事先给
                 出.Wierzbicki 等人 [22] 提出了参考点的设置方法:设定一个参考点 r=[r 1 ,r 2 ,…,r M ],该参考点每一维的数
                 值 r i 代表决策者在第 i 个目标上的期望值..通过修改参考点的占优机制来引入决策者偏好是一种常
                 见的偏好设置方式,这种方式改变了种群的支配优先级,例如 g-占优                      [13] 、r-占优 [14] 、2p-占优 [23] .这种
                 机制也存在一定的不足,需要决策者事先给出参考点,且该类算法对参考点的位置较为敏感,容易导
                 致算法不收敛或陷入局部最优;
             (2)  权重:权重以决策向量的方式给出,代表决策者对于每个目标的偏好程度,并对每个权重向量给出相
                 应的数学表达     [24] .权重在一定程度上表达了决策者的期望搜索解集的方向,即引导种群进化的方向;
             (3)  效用函数:效用函数是一种综合了偏好参考点、决策向量和解集信息的函数,更加直观地反映了算法
                 带来的性能提升程度.但是当面对复杂函数时,尤其是 Pareto 前沿信息及其数学特性未知的问题时,决
                 策者很难将每个目标上的期望值转换成可信赖的效用函数;
             (4)  涂刷技术:Wang 等人    [25] 提出一种涂刷技术(brushing technique)来表达决策者偏好信息,在目标空间中
                 涂刷一部分区域以作为偏好区域(ROI),优势在于决策者不需要事先了解目标函数的先验信息.因而
                 一定程度上克服了决策者需明确给出权重和期望值的缺陷,此外,涂刷技术是交互式的,决策者可以
                 在算法运行过程中调整偏好信息,从而使种群逼近偏好区域;
   47   48   49   50   51   52   53   54   55   56   57